DIGITALNA ARHIVA ŠUMARSKOG LISTA
prilagođeno pretraživanje po punom tekstu
ŠUMARSKI LIST 11-12/2008 str. 53 <-- 53 --> PDF |
STRUČNI ČLANCI – PROFESSIONAL PAPERSŠumarski list br. 11–12, CXXXII (2008), 551-554 UDK 630* 945 DIGITALIZACIJAŠUMARSKOG LISTA DIGITIZATION OF JOURNAL OF FORESTRY Branko MEŠTRIĆ* SAŽETAK: Potpunom digitalizacijom cjelokupnog izdanja Šumarskog lista uz korištenje suvremene informacijske i računalne tehnologije, omo gu ćuje se pristup vrijednoj građi i omogućuje njena bolja logička i fizička dos tup nost. Time je Hrvatsko šumarsko društvo napravilo velik iskorak u nove tehnologije, osiguravši tako svojem članstvu, ali i cjelokupnoj šumarskoj struci pristup ogrom nom fondu znanstvenih, stručnih i povijesnih informacija koje su kroz više od 130 godina prezentirane na stranicama ovog uglednog ča sopisa. Digitalizirani materijal, koji uključuje preko 75000 stranica (trenutno preko 1020 PDF dokumenata, veličine skoro 13 GB), pokazuje cjelokupni sa dr žaj u isto vjetnom obliku kako je objavljen (odnosno u stanju kako je sačuvan), a istodobno je računalnim prepoznavanjem teksta omogućen i računalni pristup sadržaju, što podrazumijeva pretraživanje po punom tekstu, odnosno mo guć no sti kopiranja dijelova teksta i njegovo korištenje pri citiranju, reizda nju i sl. Sva građa može se slobodno koristiti, naravno uz navođenje njena izvora. Ko rištenje u komercijalne svrhe nije dozvoljeno bez dozvole izdavača. Ključne riječi:Šumarski list, digitalizacija, biblioteka, povijest HŠD-a UVOD– Introduction Šumarski list kao znanstveno, stručno i staleško gla -No, suvremeni pri s tup zahtijeva, a suvremene in for ma silo Hrvatskog šumarskog društva, odnosno hr vat skogcij ske i računalne teh nologije omogućuju, da se pristup šumarstva u cjelini, izlazi u kontinuitetu već 132. go -tako vrijednoj gra đi modernizira, što u osnovi znači da se dinu. Za to vrijeme na njegovim je stranicama objavljenaomogući bolja logička ifizička dostupnost.Šumarski list impresivna znanstvena i stručna građa, a i cje lokupna ije ovim iskorakom postao predvodnikom takvih pristuvrlo detaljna povijest Hrvatskog šu mar skog društva. Svapa i digitali za ci jom cjelokupnog sadržaja i nje govim in ta građa dostupna je u biblioteci Hr vat skog šu mar skogdek si ranjem, potom i prezentacijom na in ter netu, pos tao društva u cjelosti, djelomično i u dvije nepotpune zbirketre nut no pre tra živ i globalno dostupan u svoj svojoj na Šumarskom fakultetu, a dijelom i u Na cio nal noj iobimnostiicje lo kupnomdosadašnjemtrajanju. sveučilišnoj biblioteci. Na ravno, u “papirnatom” obli ku. DOSADAŠNJA NASTOJANJAI POSTIGNUĆA– Past efforts and achievements Potreba za učinkovitijim pristupom objavljenoj gra -1976). Ovdje je na jedan popularniji na čin, više ili ma đi uočena je odavno. Jedno od prvih i poznatijih rješe njanje bibliografski (ovisno o autoru po je di nog područja), dao je dr.AlfonsKauders,koji je u svoje dvije šu mar -pri kazana i bibliografija Šumarskog lista. ske bibliografije (Kauders1946, Kauders 1958) de Sljedeći korak učinjen je izradom prve cjelovite ra talj no obradio i Šumarski list. Daljnju razradu materije čunalno podržane i internetski prezentirane biblio gra dala je grupa autora u ediciji Povijest šumar stva Hr vat fije (Meštrić,2005). Ona je donijela naslove svih ske 1846–1976. kroz stranice Šumarskog lista (Zagreb, ra do va objavljenih u cijelom dotadašnjem životnom vi je ku Šumarskog lista, ali po prvi puta i mehanizme * koji su bibliografiju učinili “živom”, tj. osigurali da se Branko Meštrić, dipl. ing. šum., branko.mestric@sumari.hr HŠ Consult d.o.o.Vukotinovićeva 2, Zagreb ona na dopunjuje sa svakim izlaskom novog broja |
ŠUMARSKI LIST 11-12/2008 str. 54 <-- 54 --> PDF |
B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554 časopisa. Ova bibliografija dostupna je na internetskimsadržaja svih brojeva odnosno godišta Šumarskog stranicama Hrvatskog šumarskog društva i to krozlista. Na ovaj je način riješena globalna logička dostuppristup pre ko naslova i autora, pretraživanje po ključn-nost cje lo kup nog sadržaja. Svatko može na internetu im riječima i imenima osoba, a posredno i kroz pregledlako saznati tko je kada i što pisao. KAKO RIJEŠITI FIZIČKU DOSTUPNOST?– How to solve the physical presence? Kada zainteresirani sazna u kom broju je objavljenmje reniji vremenu, odnosno stupnju razvoja teh no logija odre đeni članak, a što mu je omogućeno i olakšano in -u okružju. Moguće je i izvodivo napraviti slje deći velik ter netskom biliografijom, ostaje da nekako dođe dokorak u modernizaciji i informatizaciji kako Šumarskog samog članka. Klasično rješenje razmjerno je jedno -lista kao izdanja, tako i načina rada u Hr vatskom stav no. Kako se zna da je u HŠD cjelokupna zbirka svihšumarskom društvu. Početkom 2007. na bav ljena je po izdanja, dovoljno je nazvati HŠD, da bi netko od služ -treb na oprema, razrađen tehnološki po s tu pak i pristupibenika pronašao konkretan broj, napravio foto ko piju ilo se skeniranju, a potom i digitalizaciji cjelokupne poštom ga poslao zainteresiranoj osobi.Takav sce narijgra đe objavljene na stranicama časopisa. je realan, pa se i redovito događa, no baš i nije najpri TEHNOLOGIJAPRIMJENJENAU RADU– Technology applied in the work Skeniranje– Scaningto matskog obostranog skeniranja pojedinačnih stranica za one brojeve koji postoje neuvezani u arhivi, pa ih Sam posao bio je obiman i fizički zahtjevan. Bilo je je bilo moguće i fizički razdvojiti – to je bitno olakšalo jasno da valja skenirati preko 60000 stranica (poslije i ubr zalo postupak. Manji pak dio brojeva, koji ne se pokazalo 75000) građe, često već u dosta lošem sta posto je u duplikatu, već samo u uvezu, skeniran je iz nju zbog starosti. Najprije je korištena mogućnost au uveza pojedinačnim snimanjem digitalnom re proka me rom. Svi skenovi su grafički obrađeni i pripremljeni za daljnji postupak. Prepoznavanje tekstova–Text recognition Obrada skenova koja uključuje prepoznavanje teks tova, njihovo pohranjivanje, a potom i generiranje digitalne forme časopisa obavljen je programomAbby Finereader, za koji je procijenjeno da ostvaruje do volj no velik stupanj prepoznavanja tekstova na hrvatskom jeziku, ali i sažetaka i ostale opreme članaka, koji su često na francuskom, njemačkom odnosno engleskom jeziku. Svjesno su tolerirana vjerojatno i veća odstupa nja prepoznavanja tekstova na slovenskom, odnosno srp skom jeziku – posebice na ćirilici, kojih je u neka vre mena bilo dosta, jer bi ručna dorada zahtijevala izu zetno velik radni angažman, koji u ovoj fazi nije bio pri hvatljiv. Ukratko: cjelokupni sadržaj je okularno čitljiv“as is” jer je čitatelju dostupan izgled svake stra nice kakva stvarno jest, a “u pozadini” je isti tekst au to mat ski računalno prepoznat, bez dodatne korekcije, što znači s izvjesnim pogreškama. Računalno ko riš te nje – pre traživanje, kopiranje dijelova teksta – nosi sa so bom izvjesnu pogrešku zbog te nedorađenosti. Mo gu će je naknadno, u svakom trenutku, ukoliko bi to za neki tekst bilo potrebno (reizdanje i sl.) napraviti do dat no ručnu kontrolu i popraviti ta odstupanja. Priprema digitalnih materijala–Preparation of digital materials Sav materijal pripremljen je u formatu Portable Di - Slika 1.Web stranica za pristup digitaliziranom materijalu – stanje studeni 2008. gital Format (PDF) jer se on u zadnje vrijeme etablirao Figure 1Web site to access to digitalized material – kao de facto svjetski standard za digitalne dokumente. the situation in November 2008. |
ŠUMARSKI LIST 11-12/2008 str. 55 <-- 55 --> PDF |
B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554 Slika 2.Analiza stanja – stanje studeni 2008. Figure 2Analysis of the situation – the situation in November 2008. Iako su materijali skenirani u razlučivosti od 300 to čaka po inču (tpi) kako bi si osta vi li prostor za daljnja una pre đenja, dokumenti su generirani sa sma nje nom raz lu či vosti od 150 tpi i još dodatno grafički sažeti. Čak i na taj način dobiveni generirani dokumenti možda su pre ve liki za lagodno korištenje na in ter netu u ovom tre nutku, ali za pretpostaviti je da će dalj njim na pret kom ko munikacij skihteh no lo gijatajprob lemnestati. Svaki broj (svezak) časopisa fi zički je jedan PDF, koji se sastoji od realne kopije stranice (sa svim ev. po greškama, mrljama, žuće njem), ispod koje je i digitalni tekst koji se ne vidi, ali se koristi pri pretraživanju, odnosno može se kopirati i ko ristiti računalnim putem. Objava na internetu– Pu bli sh ing on the Internet Digitalni dokumenti objavljeni su na internetu na adresi http:// sumlist. sumari.hr i dostupni su ka ko pre ko na toj adresi postav lje nih pregleda po brojevima, au to rima, tako i preko pretraživača.Također se do odre đenih radova može i pre - Dodatno, više kao model, napravljen je i ključ pris tupa preko imena osoba – šumara o kojima je pisano u Šu marskom listu. Vjerojatno je da će se u budućnosti pri premiti pregledi i po drugim entitetima koji se mogu pre poznati u sadržaju ovog časopisa. Nije isključeno ni da netko drugi napravi preglede na svojim stranicama i po svojim kriterijima. Doz vo lje no je ugrađivanje linkova i na druge stranice drugih subjekata, za što se specifikacije mogu dobiti u HŠD. Naime, svi dokumenti nezaštićeni su i mogu se ko ris titi u skladu sa Creative commonslicencom, koja uvje tuje imenovanje vlasnika i nekomercijalno ko riš te nje, a obvezuje na daljnje djeljenje pod istim uvjetima (Imenovanje – Nekomercijalno – Dijeli pod istim uvje tima 3.0 neloklizirana licenca – detalje vidjeti na http://sumlist.sumari.hr) Indeksiranje i pretraživanje–Indexing and search Pretraživanje sadržaja preko brojeva, autora, naslova i ključnih riječi moguće je još od izrade i postavlja nja Bibliografije Šumarskog lista na internet (Meš trić, 2005). Ovaj sustav se i dalje dorađuje i može se koristiti. Međutim, digitalizacijom cjelokupnog sadržaja otva ra se mogućnost pretraživanja po cjelokupnom tekstu, što daje pristupu sadržaja novu dimenziju. Budući su digitalni dokumenti objavljeni na internetu, već se do dobrog dijela njih može doći i preko jav nih pretraživača (Google i sl.). No kako njihov sa dr žaj i rad ne možemo kontrolirati generiran je vlastiti ko bibliografije časopisa, ali i pre - Slika 3.Pretraživanje po punom tekstu ko web stranica autora.Figure 3Full text searching |
ŠUMARSKI LIST 11-12/2008 str. 56 <-- 56 --> PDF |
B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554 indeks cjelokupnog materijala i odgovarajući pretraži-Jasno je da i veličina samog digitaliziranog broja vač koji je postavljen na adresihttp://sumlist.sumari.hr.pred stavlja određeno ograničenje u korištenju. Kako je in tencija bila zadržati vjerni izgled originalnog izda - Skidanje i korištenje dokumenata– Download nja, mo ralo se svjesno ući u izradu dokumenata koju su and use documents po ve ličini na granici upotrebljivosti, ali u sadašnjim Pristup dokumentima je slobodan i neograničen. ko mu nikacijskimuvjetima. Iako je pristup moguć cjelokupnom broju ili izravno na Ukoliko neki korisnik ima veće potrebe za digital konkretnu stranicu, fizički se u oba slučaja učitava nim dokumentima a nema tehničke uvjete, može se javi cijeli broj. U izvjesnoj mjeri postupak učitavanja može ti u HŠD i koristiti iste dokumente u lokalnoj mreži. ovisiti o vrsti i stanju lokalno instaliranog čitača PDF dokumenata kod korisnika. ZAKLJUČAK– Conclusion Akcijom digitalizacije cjelokupne građe Šu mar -obliku kako je objavljen (odnosno u stanju kako je sa skog lista Hrvatsko šumarsko društvo je napravilo ve -ču van), a istodobno je računalnim prepoznavanjem lik iskorak u nove tehnologije, osiguravši tako svojemtek sta omogućen i računalni pristup sadržaju, što pod članstvu, ali i cjelokupnoj šumarskoj struci pristupra zumijeva pretraživanje po punom tekstu, odnosno ogrom nom fondu znanstvenih, stručnih i povjesnih in -mo gućnosti kopiranja dijelova teksta i njegovo ko riš te for macija koje su kroz više od 130 godina prezentiranenje pri citiranju, reizdanju i sl. na stranicama ovog uglednog časopisa. Sva građa može se slobodno koristiti, naravno uz Digitalizirani materijal, koji uključuje preko 75000na vođenje njena izvora. Korištenje u komercijalne svr stra nica, pokazuje cjelokupni sadržaj u istovjetnomhe nije dozvoljeno bez dozvole izdavača. LITERATURA– Literature Kauders,A., 1947: Šumarska bibliografija (1846– -Meštrić,B., 2005: Šumarski list – bibliografska baza 1946), (Bi bliographia forestalis), Šum. sek cijapo da taka i njena prezentacija, ŠL5–6/2005., s. DITN. R. Hrvatske, s. 1–266., Zagreb279–286., Zagreb. Kauders,A., 1958: Šumarska bibliografija (1946– -Meštrić,B., 2005: www.sumari.hr, ŠL 11–12/2005, 1955), Šum. društvo N.R. Hrvatske, s. 1–440.,s. 636–638., Zagreb. Zagreb. SUMMARY: Journal of Forestry, a scientific, technical and professional periodical of the Croatian Forestry Society and Croatian forestry as a whole, has been coming out continuously for 132 years. During this time it has published an impressive amount of scientific and technical material, as well as a detailed history of the Croatian Forestry Society. The entire material is available in the library of the Croatian Forestry Society, while part of the material is also contained in two incomplete collections at the Faculty of Forestry and in the National and University Library. Modern information and computer technology allows improved access to valuable material and enables better logical and physical availability of the items. By stepping into the field of new technologies, the Croatian Forestry Society has made it possible for their members and the entire forestry profession to access the extensive fund of scientific, technical and historical information, which have for over 130 years been presented on the pages if this renowned periodical. Digitized material, which includes over 75,000 pages (currently over 1020PDF documents of almost 13 GB), shows the overall content in the form identical to that published in the Journal (or in the state in which it has been preserved). At the same time, computer-recognized text allows computer accessto the content. This includes search by full text, the possibility of copyingparts of the text and their use in citations, etc. All materials can be used free of charge, but their sources must be cited. Commercial use is not allowed without permission from the publisher. Key words:Journal of Forestry, digitization, library, history of HŠD |