DIGITALNA ARHIVA ŠUMARSKOG LISTA
prilagođeno pretraživanje po punom tekstu




ŠUMARSKI LIST 11-12/2008 str. 54     <-- 54 -->        PDF

B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554
časopisa. Ova bibliografija dostupna je na internetskimsadržaja svih brojeva odnosno godišta Šumarskog
stranicama Hrvatskog šumarskog društva i to krozlista. Na ovaj je način riješena globalna logička dostuppristup
pre ko naslova i autora, pretraživanje po ključn-nost cje lo kup nog sadržaja. Svatko može na internetu
im riječima i imenima osoba, a posredno i kroz pregledlako saznati tko je kada i što pisao.


KAKO RIJEŠITI FIZIČKU DOSTUPNOST?– How to solve the physical presence?
Kada zainteresirani sazna u kom broju je objavljenmje reniji vremenu, odnosno stupnju razvoja teh no logija
odre đeni članak, a što mu je omogućeno i olakšano in -u okružju. Moguće je i izvodivo napraviti slje deći velik
ter netskom biliografijom, ostaje da nekako dođe dokorak u modernizaciji i informatizaciji kako Šumarskog
samog članka. Klasično rješenje razmjerno je jedno -lista kao izdanja, tako i načina rada u Hr vatskom
stav no. Kako se zna da je u HŠD cjelokupna zbirka svihšumarskom društvu. Početkom 2007. na bav ljena je po izdanja,
dovoljno je nazvati HŠD, da bi netko od služ -treb na oprema, razrađen tehnološki po s tu pak i pristupibenika
pronašao konkretan broj, napravio foto ko piju ilo se skeniranju, a potom i digitalizaciji cjelokupne
poštom ga poslao zainteresiranoj osobi.Takav sce narijgra đe objavljene na stranicama časopisa.
je realan, pa se i redovito događa, no baš i nije najpri


TEHNOLOGIJAPRIMJENJENAU RADU– Technology applied in the work
Skeniranje– Scaningto matskog obostranog skeniranja pojedinačnih stranica
za one brojeve koji postoje neuvezani u arhivi, pa ih


Sam posao bio je obiman i fizički zahtjevan. Bilo je


je bilo moguće i fizički razdvojiti – to je bitno olakšalo


jasno da valja skenirati preko 60000 stranica (poslije


i ubr zalo postupak. Manji pak dio brojeva, koji ne


se pokazalo 75000) građe, često već u dosta lošem sta


posto je u duplikatu, već samo u uvezu, skeniran je iz


nju zbog starosti. Najprije je korištena mogućnost au


uveza pojedinačnim snimanjem digitalnom re proka


me rom. Svi skenovi su grafički obrađeni i pripremljeni
za daljnji postupak.


Prepoznavanje tekstova–Text recognition
Obrada skenova koja uključuje prepoznavanje
teks tova, njihovo pohranjivanje, a potom i generiranje
digitalne forme časopisa obavljen je programomAbby
Finereader, za koji je procijenjeno da ostvaruje do volj no
velik stupanj prepoznavanja tekstova na hrvatskom
jeziku, ali i sažetaka i ostale opreme članaka, koji su
često na francuskom, njemačkom odnosno engleskom
jeziku. Svjesno su tolerirana vjerojatno i veća odstupa nja
prepoznavanja tekstova na slovenskom, odnosno
srp skom jeziku – posebice na ćirilici, kojih je u neka
vre mena bilo dosta, jer bi ručna dorada zahtijevala izu zetno
velik radni angažman, koji u ovoj fazi nije bio
pri hvatljiv. Ukratko: cjelokupni sadržaj je okularno
čitljiv“as is” jer je čitatelju dostupan izgled svake stra nice
kakva stvarno jest, a “u pozadini” je isti tekst au to
mat ski računalno prepoznat, bez dodatne korekcije,
što znači s izvjesnim pogreškama. Računalno ko riš te nje
– pre traživanje, kopiranje dijelova teksta – nosi sa
so bom izvjesnu pogrešku zbog te nedorađenosti. Mo gu
će je naknadno, u svakom trenutku, ukoliko bi to za
neki tekst bilo potrebno (reizdanje i sl.) napraviti do dat
no ručnu kontrolu i popraviti ta odstupanja.


Priprema digitalnih materijala–Preparation of
digital materials


Sav materijal pripremljen je u formatu Portable Di -


Slika 1.Web stranica za pristup digitaliziranom materijalu –


stanje studeni 2008.


gital Format (PDF) jer se on u zadnje vrijeme etablirao


Figure 1Web site to access to digitalized material –


kao de facto svjetski standard za digitalne dokumente.


the situation in November 2008.