Hlavní obsah stránky
Projekt Digitalizace a ukládání v Kraji Vysočina
HELENA HRNČÍŘOVÁ hrncirova@kkvysociny.cz
V současné době vzniká celá řada digitálních dat různého významu. Aby jich většina nemizela v propasti „digitálního temna“, je potřeba zajistit celý jejich životní cyklus – tvorbu, ukládání i snadný přístup k nim. Touto problematikou se zabývá projekt Digitalizacea ukládání. Jeho cílem je vytvořit pro potřeby veřejné správy digitalizační pracoviště s odpovídajícím vybavením, digitální úložiště a spisovnu jako nástroje pro tvorbu, zpracování a uložení úředních spisů i dokumentů kulturního dědictví regionu. Projekt Digitalizace a ukládání navazuje na Technologická centra krajů a na projekty Národní digitální knihovna a Národní digitální archiv.
Vysočina digitalizuje
Na začátku roku 2012 jsme v Havlíčkově Brodě spustili provoz Krajské digitalizační jednotky Kraje Vysočina (KDJ). Jedná se o pracoviště zařízené pro skenování různých dokumentů – robotické snímání knih do formátu A3, manuální snímání knih větších nebo poškozených a snímání velkoformátových materiálů do velikosti A0. Součástí pracoviště je vybavení pro zpracování obrazu i systém pro tvorbu metadat, OCR, kontrolu a export výsledků. Pro materiály, které nelze zpracovat za pomoci vybavení KDJ, ale o jejichž digitalizaci je také zájem, využíváme externího dodavatele firmu A-scan. Výběr dokumentů vychází především z potřeb regionálních organizací a zájmu badatelů. Dokumenty, které v našem pracovišti digitalizujeme, musejí splňovat jedno základní kritérium – mít vazbu na Kraj Vysočina. Tomu odpovídá řada dokumentů, jako jsou knihy, periodika, kroniky měst a obcí, zápisy z obecních a městských zastupitelstev, hřbitovní knihy, sčítací aparáty, stavební plány, mapy, fotografie a negativy, listiny, smlouvy, různé druhy dokumentace, katalogizačí lístky ad. Jejich fyzické ohrožení je pak dalším vodítkem k výběru. Například periodika jsou typicky ohrožena kyselostí papíru, jiné dokumenty svým stářím, další si zase často žádají badatelé.
Podmínkou digitalizace knižních dokumentů je pak přidělení čísla České národní bibliografie. Pokud monografie/periodikum toto číslo nemá, je na vlastníkovi, aby o ně v Národní knihovně zažádal a doplnil vše potřebné.
Odborným garantem projektu je Krajská knihovna Vysočiny v Havlíčkově Brodě, která se již několik let digitalizací monografií a periodik v rámci svých možností zabývá. V první fázi jsme tedy začali zpracovávat knižní dokumenty. Standardizované formáty pro jejich zpracování a archivaci vycházejí z projektu Národní digitální knihovny. Výsledkem digitalizace je přesně definovaný balíček. Jedna kniha nebo jedno číslo periodika představuje jeden balíček, který putuje do Krajského digitálního úložiště i do úložiště NDK. Jeho součástí jsou archivní a uživatelské kopie snímků, txt a ALTO xml soubory vzniklé automatickým rozpoznáváním textu a xml soubory zahrnující všechna potřebná popisná, administrativní a technická metadata.
V další fázi jsme navázali spolupráci s Moravským zemským archivem v Brně, pod který spadají všechny regionální okresní archivy a začali přípravu pro digitalizaci a především popis dokumentů ze sbírek archivů.
Dosud nám prošly rukama stovky knih, desítky stavebních plánů a několik exemplářů obecních kronik, hřbitovních knih a zápisů ze zastupitelstev. V rámci externí dodávky jsme prozatím zdigitalizovali necelé 3000 fotografií a obdobné množství negativů.
Digitalizace krok za krokem
Dokumenty, které vlastník vybere k digitalizaci a zapíše do naší vnitřní evidence, dopraví následně na pracoviště KDJ. Tady posoudíme jejich stav, rozhodneme, na kterém skeneru budou zpracovány, případně, je-li jejich digitalizace v našich silách. Problém nastává například u některých periodik, kde byl použit nevhodný typ vazby, hřbet je příliš tuhý a zasahuje do něj text. Parametry pro skenování jsou vždy stejné – formát tiff, 300 DPI, color/gs (podle barevnosti předlohy). Následuje ořez a úprava snímků, kdy jsou surové snímky pomocí nástroje pro hromadnou konverzi vyrovnány, ořezány a upraveny tak, aby bylo potlačeno pozadí a dosaženo co nejlepší čitelnosti textu. K takto připraveným snímkům pak doplňujeme metadata a provádíme konverzi do jp2 a zpracování OCR. Nakonec provedeme export celého balíčku určeného pro uložení v NDK.
Vybavení KDJ
Robotický knižní skener DL mini-C od švýcarské firmy 4DigitalBooks snímá ve formátu 2x A3 a je vybaven automatickým obracečem stránek a knižní kolíbkou. Skener stránky obrací a skenuje s minimální asistencí obsluhy. Nejvyšší rychlost, kterou jsme reálně zaznamenali, je 1200 stran za hodinu při rozlišení 300 DPI, formát tiff velikost 2x A4, barevně (skenována byla kvalitní kniha). Velkoformátový plochý skener ScannTech 600i-ms do velikosti formátu A0 od německé firmy ProServ je vybavený také knižní kolíbkou pro manuální skenování knih formátu 2x A2. Maximální rozlišení obou skenerů je 600 DPI. Pro automatické zpracování obrazu používáme SW PageImprover (4DigitalBooks).
Systém Sirius firmy ElsystEngineering využíváme pro tvorbu metadat, konverzi do jp2 a generování balíčků podle požadavků NDK. Pro automatické rozpoznávání textu (OCR) máme k dispozici ABBY FineReader.
Projekt Digitalizace a ukládání je spolufinancován z prostředků Evropské unie, Evropského fondu pro regionální rozvoj. Dodavatelem řešení je firma ICZ, subdodavateli firmy ScanService a Digis.
Foto archiv knihovny