Hlavní obsah stránky

Kolokvium knihovnicko-informačních pracovníků zemí Visegrádské skupiny V4+

JAN KAŇKA > kanka@kfbz.cz  

Digitalizace - cesta k ochraně a zpřístupnění dokumentů - tak znělo téma v pořadí druhého mezinárodního knihovnického kolokvia V4+, které se konalo 6.-8. července 2008 v Brně (první proběhlo v roce 2006 v Banské Bystrici). Doba konání ani místo nebyly zvoleny náhodou, kolokvium se stalo důstojnou součástí oslav dvoustého výročí založení pořádající instituce, Moravské zemské knihovny v Brně.

Tématem prvního dne odborného jednání byly Národní strategie digitalizace knihovních sbírek. Tento blok moderoval Adolf Knoll. Sám zahájil program svou prezentací projektu ENRICH 1, mezinárodního rozvinutí Manuscriptoria. Mimo jiné zdůraznil, že cílem projektu není sjednocení metadatových formátů používaných jednotlivými účastníky, ale naopak interoperabilita mezi nimi (zejména MARC a TEI). Problémem je často struktura jednotlivých digitálních knihoven, odkud se čerpají obrazová data - bývají závislé na konkrétním použitém SW.

Zástupci maďarské národní knihovny Péter Dippold a Katalin Bánkeszi představili záměr vybudovat v letech 2006-2013 Národní digitální registr, který by zachycoval stav a záměry digitalizace v maďarských knihovnách, muzeích a archivech. Největšími tamními digitálními knihovnami jsou v současnosti Hungarian Electronic Library2 a John von Neumann Digital Library3. Důležitou součástí národní strategie je oblast vzdělávání.

Zástupkyně lotyšské národní knihovny Inga Grīnfelde hovořila jednak o již existující lotyšské národní digitální knihovně Letonica, jednak o národní digitalizační strategii, která je rozložena na léta 2006-2012 a finančně je dotována částkou 2 mil. Ř. Strategie zahrnuje celé spektrum paměťových institucí. V tuto chvíli Letonica4 obsahuje sbírky dvou největších akademických knihoven, tří výzkumných institucí, jedenácti veřejných knihoven a jedné vládní agentury. V plánu je digitalizace 13 mil. stran periodik a 30 mil. stran monografií. Velká pozornost se věnuje procesu rozpoznávání skenovaného textu (OCR), mj. kvůli dříve používané lotyšské fraktuře a také autorskoprávním otázkám zpřístupnění.

Zástupkyně polské národní knihovny Katarzyna Ślaska prezentovala národní strategii digitalizace, kterou na léta 2007-2013 přijal národní Výbor pro digitalizaci. Hlavními záměry je digitalizovat důležitou část polského kulturního dědictví a zpřístupnit jej veřejnosti přes internet. Součástí příspěvku byly charakteristiky sedmi nejdůležitějších v současnosti fungujících polských digitálních knihoven. Přednášející zmínila také dva běžící projekty: Electronic library of Polish historical texts a digitalizaci důležitého periodika Kurier Warszawski. Součástí polské strategie je zapojení digitalizovaných sbírek do TEL5 a portálu Europeana6.

Ředitel slovenské národní knihovny Dušan Katuščák představil velkoryse pojatý Operačný program Informatizácia spoločnosti7, který má díky podpoře strukturálních fondů EU rozpočet 30 mil. Ř. Hlavní součástí projektu je masová digitalizace 500 tis. slovacikálních monografií a 10 tis. titulů periodik. Začíná se budovat digitalizační pracoviště SNK ve Vrútkách (bývalá kasárna), kde budou v provozu robotické skenery (4DigitalBooks), úložiště bude realizováno na platformách SUN a Oracle (výhled 
55 PB). Přístup k digitálnímu obsahu zajišťuje portál Memoria Slovaca8. Kromě jiného je v plánu zapojení velkého komerčního poskytovatele obsahu Slovakia Online.

Christa Müller, pracovnice rakouské národní knihovny, ve svém příspěvku poskytla komplexní informaci o digitalizaci v Rakousku. Zmínila zapojení do důležitých evropských projektů TEL, EDL9, PLANETS10 a IMPACT11. Strategie digitalizace na úrovni národní knihovny je zaměřena dvěma směry: masová digitalizace a digitalizace speciálních sbírek. První směr reprezentují tři velké projekty: ANNO12 (Austrian Newspapers Online), ALEX13 (knihovna parlamentárií a právních textů Rakouska a Habsburské monarchie) a Bildarchiv Austria14 (fotografie a historické portréty). V oblasti speciálních sbírek jde zejména o digitalizaci cca 22 tis. analogových zvukových dokumentů (cca 30 tis. hodin záznamu).

Zástupkyně Rumunské národní knihovny Elena Tîrziman seznámila posluchače se stavem a záměry digitalizace v Rumunsku. Doposud zde až na několik izolovaných a rozsahem malých sbírek neexistují podstatnější digitalizační projekty, a tak je na léta 2008 až 2014 naplánován projekt digitalizace kulturního dědictví a vytvoření rumunské digitální knihovny. Jedním z novějších počinů v oblasti digitalizace je zapojení rumunské sbírky několika starých tisků do Manuscriptoria.

Druhý blok - Technologie pro digitalizaci - moderoval Petr Žabička. Obsahově ho ještě první den zahájil příspěvek Petera Günthera (fa DISC) na téma Dlouhodobé archivace digitálního obsahu na Blue-Ray discích. Srovnával tuto technologii s technologií diskových polí RAID a vyzdvihl zejména řádově nižší energetickou náročnost. Z dalších kladných vlastností lze jmenovat vysokou hustotu záznamu, dobrou čitelnost, vysokou odolnost nosiče záznamu. Deklarovaná doba životnosti je 50 let, odhaduje se však až 200 let.

Druhý den byl zahájen prezentací Andrease Parschalka z innsbrucké Universitäts- und Landesbibliothek Tirol. Tato knihovna je koordinátorem a technologickým centrem projektu Digitization-on-Demand, který je uživatelům znám pod pojmem e-Books-on-demand - EOD. Třináct zapojených knihoven prostřednictvím svých on-line katalogů nabízí přímé objednání elektronické kopie děl s uplynulou autorskoprávní ochranou ve formě dvouvrstvého PDF (skenovaný obraz + prohledatelný text). Výslednou elektronickou knihu je možno buď stáhnout, nebo si nechat poslat na DVD, platba probíhá on-line, převodem z účtu či na dobírku. Z českých knihoven je zatím zapojena MZK Brno.

Thomas Wolf-Klostermann přednesl příspěvek s názvem Kvalitativní a konzervační požadavky při digitalizaci - cesta Bavorské státní knihovny. Bavorská státní knihovna digitalizuje ve třech liniích: rukopisy, inkunábule, staré tisky a historické mapy na vlastním pracovišti, novodobé fondy na zakázku formou služby a monografie 16.-19. století prostřednictvím projektu Google Books. Při digitalizaci vzácných fondů kladou důraz na kvalitu a šetrnou manipulaci s dokumenty, nepoužívají se přítlačná skla (otevírání hřbetů v kolébkách v úhlech 60-120°). V Mnichovském digitalizačním centru vyvinuli několik pomůcek pro práci, např. olověné řetězy v sametových rukávech pro otevření knihy, plexisklové „prsty“ pro přitlačení stran, polštářky ze skleněných kuliček pod hřbety knih ad. V současné době je digitalizováno bezmála 29 tis. titulů15.

Zástupce firmy Treventus Mechatronics Stephan Tratter představil zajímavou konstrukci jejich výrobku ScanRobot pro masovou digitalizaci (mj. je používán výše zmíněným centrem v Mnichově). Jde o originální řešení, kdy skenovaná vázaná předloha je uložena rozevřená v kolébce s úhlem 60°, do níž zajíždí klínovitá skenovací hlava, která vždy při cestě vzhůru přisaje podtlakem dvě stránky a současně je naskenuje. V horní poloze je proudem vzduchu otočí a proces se opakuje. Zařízení dosahuje výkonu 500-300 stran za hodinu. Výhodou je, že vyrovnávání a čištění obrazu probíhá přímo při skenování. Technologie, která se začala rodit jako studentský projekt, získala velkou cenu na CeBITu 2007.

Jinou konstrukci používá skener 4DigitalBooks, který představil Jean Marc Rod. Vázané předlohy jsou rozevřeny úplně do úhlu 180° a přitlačeny zespodu na sklo (dle výzkumu to snese bez úhony cca 80 % dokumentů). Otáčení stránek zajišťuje opět podtlak, při otáčení je měřena tloušťka papíru a kontroluje se, zda se neotáčí více stran najednou. Přednášející se ve svém příspěvku nevěnoval pouze technologii, ale celé problematice založení efektivních digitalizačních center a nastavení workflow. Své teze ilustroval na několika velkých fungujících centrech v zahraničí.

Problematice workflow při digitalizaci se věnoval také představitel fy CCS - Content Conversion Specialists, Claus Gravenhorst. Klíčovou fází jejich pracovní linky je právě tzv. konverze, kde speciální SW DOCWorks provede předzpracování skenovaného obrazu, analýzu layoutu stránky, OCR, ISR (Intelligent Structure Recognition), extrakci metadat a kontrolu kvality. V praxi to znamená, že v této fázi např. při skenování novin proběhne rozdělení celé stránky do jednotlivých logických bloků - článků, rozpoznání jejich názvů a identifikačních údajů (číslo, ročník, strana, datum). Tyto údaje jsou pak ve strukturované podobě uloženy jako XML metadata formátu ALTO (Analyzed Layout and Text Object) a spolu s obrazem ve formátu TIFF „zabaleny“ do kontejnerového formátu METS. CCS provozuje např. digitalizační centrum pro British Library (1,5 mil. stran za měsíc).

Problematice masové digitalizace se věnovala také pracovnice slovenského zastoupení fy Microform, Alena Kulíková. V prvních projektech skenovali několik větších slovenských lístkových katalogů knihoven. Dalším projektem, na kterém se podílí, je DiFMOE16 (Digitales Forum Mittel- und Osteuropa) - portál historických německy psaných periodik vydávaných ve střední a východní Evropě. V současné době obsahuje titul Karpathen-Post (1880-1942, Kežmarok) a Pressburgisches Wochenblatt (1771 až 1773, Bratislava). U posledně jmenovaného periodika, které bylo k dispozici ve velmi špatných vazbách, zvolili cestu rozvázání na jednotlivé listy, jejich skenování automatickým podavačem a opětovné svázání do nových, kvalitních vazeb. Firma se podílela také na projektu Inkunábuly Univerzitnej knižnice v Bratislave17 a její norské zastoupení pracuje např. na digitalizaci Norské národní knihovny, kde se rozhodli naskenovat veškerý fond na volných listech a rozvázané monografie, u kterých mají alespoň jeden duplikát.

Společný příspěvek Jiřího Polišenského (NK ČR) a Pavla Kocourka (INCAD) přednesl posledně jmenovaný. Jeho tématem byl registr digitalizace v ČR - RD.CZ. Jde o systém na bázi SW Relief, který slouží pro evidenci a sledování workflow při digitalizaci. Kromě NK ČR a KNAV by se v budoucnu jeho uživateli měly stát i ostatní digitalizující knihovny v ČR, zejména pak účastníci programu VISK7. Kromě jiného bude systém řešit provázanost mezi digitalizovanými dokumenty a jejich záznamy v SK ČR.

Rüdiger Klepsch z fy Imageware informoval o projektu obohacování knihovních katalogů na příkladu Německé národní knihovny ve Frankfurtu. Digitalizace tam probíhá od podzimu 2005 (500 tis. titulů / 2 mil. stran) a od roku 2006 je její součástí např. výběrová retrospektivní věcná indexace, skenování obálek, titulních stran, obsahů a rejstříků, jejich rozpoznávání do textu apod.

Pracovník fy SUN Microsystems Jan Jiskra představil úložiště StorageTek 5800 Honeycomb. Jde o robustní RAID zařízení s vysokou úrovní bezpečnosti dat (výrobce udává střední dobu do ztráty dat 2,4 mil. let). SW, který zařízení používá, je k dispozici jako open source. Byly zmíněny konkrétní aplikace s digitálními knihovnami typu Fedora, Dspace, e-Prints, ExLibris či VTLS.

Andrea Fojtů (v zastoupení) ze společnosti Multidata se ve svém příspěvku věnovala zejména systému pro dlouhodobé digitální uchování a ochranu DPS - Digital Preservation System. Jde o produkt fy ExLibris, který byl vyvinut ve spolupráci s Národní knihovnou Nového Zélandu. Tam jej provozují na HW SUN.

Program kolokvia zakončil Jan Buriánek z fy Visual Connection, který se zabýval digitalizací 3D objektů. Představil unikátní projekt digitalizace Langweilova modelu Prahy. Tento detailní realistický 3D model zachycující Prahu v letech 1826-1837 na ploše cca 20 m2 měla firma převést do digitální podoby za dodržení mnoha přísných bezpečnostních opatření. Pomocí speciálního zařízení nasnímali více než 250 000 vysoce kvalitních fotografií, které byly použity pro matematické sestrojení vlastní vizualizace.

Většinu příspěvků zejména prvního tematického bloku obsahuje tištěný sborník18, který účastníci obdrželi. Prezentace jsou též dostupné na stránkách http://colloquium.mzk.cz/cz/index.php. Závěrem lze říci, že kolokvium bylo velmi zajímavým a tematicky aktuálním odborným setkáním, a svým mezinárodním rozměrem bylo akcí v tuzemsku ne často konanou. Poskytlo možnost srovnání postupující digitalizace v okolních zemích a informace o nejnovějších technologiích v této oblasti.

 

ODKAZY:

1 http://enrich.manuscriptorium.com
2 http://mek.oszk.hu/indexeng.phtml
3 http://www.neumann-haz.hu/index_en.html
4 http://www.lnb.lv/en/digital-library
5 http://www.theeuropeanlibrary.org/
6 http://www.europeana.eu/ 
7 http://www.informatizacia.sk/opis/598s
8 http://www.memoria.sk/
9 http://www.edlproject.eu/
10 http://www.planets-project.eu/
11 http://www.impact-project.eu/
12 http://anno.onb.ac.at/
13 http://alex.onb.ac.at/  

14 http://www.bildarchivaustria.at/
15 http://www.digital-collections.de
16 http://www.difmoe.eu/
17 http://sigma.ulib.sk/digi/Incunabula/
18 2. kolokvium knihovnicko-informačních pracovníků zemí V4+: Digitalizace - cesta k ochraně a zpřístupnění dokumentů = 2nd Colloquium of Library Information Employees of the V4+ Counries: Digitization - the Path to protection and Access to Documentation: Brno, 6-8 July 2008: [sborník příspěvků] / [ed. Michaela Shejbalová]. Brno: Moravská zemská knihovna, 2008. ISBN 978-80-7051-178-7