DIGITALNA ARHIVA ŠUMARSKOG LISTA
prilagođeno pretraživanje po punom tekstu
ŠUMARSKI LIST 11-12/2008 str. 54 <-- 54 --> PDF |
B. Meštrić: DIGITALIZACIJA ŠUMARSKOG LISTAŠumarski list br. 11–12, CXXXII (2008), 551-554 časopisa. Ova bibliografija dostupna je na internetskimsadržaja svih brojeva odnosno godišta Šumarskog stranicama Hrvatskog šumarskog društva i to krozlista. Na ovaj je način riješena globalna logička dostuppristup pre ko naslova i autora, pretraživanje po ključn-nost cje lo kup nog sadržaja. Svatko može na internetu im riječima i imenima osoba, a posredno i kroz pregledlako saznati tko je kada i što pisao. KAKO RIJEŠITI FIZIČKU DOSTUPNOST?– How to solve the physical presence? Kada zainteresirani sazna u kom broju je objavljenmje reniji vremenu, odnosno stupnju razvoja teh no logija odre đeni članak, a što mu je omogućeno i olakšano in -u okružju. Moguće je i izvodivo napraviti slje deći velik ter netskom biliografijom, ostaje da nekako dođe dokorak u modernizaciji i informatizaciji kako Šumarskog samog članka. Klasično rješenje razmjerno je jedno -lista kao izdanja, tako i načina rada u Hr vatskom stav no. Kako se zna da je u HŠD cjelokupna zbirka svihšumarskom društvu. Početkom 2007. na bav ljena je po izdanja, dovoljno je nazvati HŠD, da bi netko od služ -treb na oprema, razrađen tehnološki po s tu pak i pristupibenika pronašao konkretan broj, napravio foto ko piju ilo se skeniranju, a potom i digitalizaciji cjelokupne poštom ga poslao zainteresiranoj osobi.Takav sce narijgra đe objavljene na stranicama časopisa. je realan, pa se i redovito događa, no baš i nije najpri TEHNOLOGIJAPRIMJENJENAU RADU– Technology applied in the work Skeniranje– Scaningto matskog obostranog skeniranja pojedinačnih stranica za one brojeve koji postoje neuvezani u arhivi, pa ih Sam posao bio je obiman i fizički zahtjevan. Bilo je je bilo moguće i fizički razdvojiti – to je bitno olakšalo jasno da valja skenirati preko 60000 stranica (poslije i ubr zalo postupak. Manji pak dio brojeva, koji ne se pokazalo 75000) građe, često već u dosta lošem sta posto je u duplikatu, već samo u uvezu, skeniran je iz nju zbog starosti. Najprije je korištena mogućnost au uveza pojedinačnim snimanjem digitalnom re proka me rom. Svi skenovi su grafički obrađeni i pripremljeni za daljnji postupak. Prepoznavanje tekstova–Text recognition Obrada skenova koja uključuje prepoznavanje teks tova, njihovo pohranjivanje, a potom i generiranje digitalne forme časopisa obavljen je programomAbby Finereader, za koji je procijenjeno da ostvaruje do volj no velik stupanj prepoznavanja tekstova na hrvatskom jeziku, ali i sažetaka i ostale opreme članaka, koji su često na francuskom, njemačkom odnosno engleskom jeziku. Svjesno su tolerirana vjerojatno i veća odstupa nja prepoznavanja tekstova na slovenskom, odnosno srp skom jeziku – posebice na ćirilici, kojih je u neka vre mena bilo dosta, jer bi ručna dorada zahtijevala izu zetno velik radni angažman, koji u ovoj fazi nije bio pri hvatljiv. Ukratko: cjelokupni sadržaj je okularno čitljiv“as is” jer je čitatelju dostupan izgled svake stra nice kakva stvarno jest, a “u pozadini” je isti tekst au to mat ski računalno prepoznat, bez dodatne korekcije, što znači s izvjesnim pogreškama. Računalno ko riš te nje – pre traživanje, kopiranje dijelova teksta – nosi sa so bom izvjesnu pogrešku zbog te nedorađenosti. Mo gu će je naknadno, u svakom trenutku, ukoliko bi to za neki tekst bilo potrebno (reizdanje i sl.) napraviti do dat no ručnu kontrolu i popraviti ta odstupanja. Priprema digitalnih materijala–Preparation of digital materials Sav materijal pripremljen je u formatu Portable Di - Slika 1.Web stranica za pristup digitaliziranom materijalu – stanje studeni 2008. gital Format (PDF) jer se on u zadnje vrijeme etablirao Figure 1Web site to access to digitalized material – kao de facto svjetski standard za digitalne dokumente. the situation in November 2008. |