Hlavní obsah stránky

VYUŽITÍ NOVÝCH TECHNOLOGIÍ: Systém Kramerius v knihovnách ČR na konci roku 2021

ALEŠ BROŽEK  brozek@svkul.cz

Již pošesté1, vždy ve dvouletých intervalech, seznamuji čtenáře tohoto měsíčníku se stavem digitálních knihoven (DK), které využívají systém Kramerius. Následující řádky shrnují změny, ke kterým došlo od začátku roku 2020 do konce roku 2021.

Verze systému Kramerius

Kramerius je systém umožňující mimo jiné plnotextové vyhledávání ve zdigitalizovaných dokumentech. Jeho vývoj byl zahájen v roce 2003 a v knihovnách byla nasazena verze, která byla označena číslem 3. Uživatelé si ji příliš neoblíbili, protože naskenované strany nejsou v běžných formátech, jako je jpg či pdf, ale ve formátu DjVu, takže si musejí stáhnout speciální plugin. Bohužel, jak ukazují tabulky na s. 88 a 89, stále tři DK vystavují zdigitalizované dokumenty v této zastaralé verzi. Je to o jednu méně než v předchozím období, protože pracovníci Vědecké knihovny v Olomouci (VKOL) dokončili konverzi všech záznamů do jpg a vystavili je v DK, která pracuje ve verzi 5.0. O totéž usilují pracovníci Národní knihovny ČR (NK ČR) již mnoho let. Ve verzi 3 však zpřístupňovali téměř devět milionů stran, takže konverze určitou dobu trvá. Tato DK obsahuje mnoho digitalizovaných celostátních novin z 2. poloviny 19. století a 1. poloviny 20. století, a tak je poměrně dost využívaná. Ve verzi 3 je i DK Divadelního ústavu v Praze, kde je však jen 266 000 zdigitalizovaných stran. Konverze by tedy nemusela být tak časově náročná a měla by se provést co nejdříve. Poslední DK ve verzi 3 je DK Národní technické knihovny (NTK). Ta se však na rozdíl od DK Divadelního ústavu již deset let nedoplňuje, a tak lze předpokládat, že veškeré digitalizáty se najdou také v DK NTK pracující ve verzi 5.

Jedinou DK v již nevyvíjené verzi 4 je DK Muzea východních Čech v Hradci Králové obsahující 15 zdigitalizovaných regionálních periodik. Patrně všechny obsahuje také DK Studijní a vědecké knihovny (SVK) v Hradci Králové, takže uživatel zvyklý na přívětivý vyhledávací software zvaný „klient DK“ bude raději pracovat s DK hradecké SVK.

Současnou verzi 5 má nasazenou 42 DK. Tato verze se dále vyvíjela, v letech 2020 a 2021 přibyly verze 5.4.4, 5.5.0, 5.6.0, 5.7.0, 5.7.1, 5.7.2 a 5.7.3. Do nich však nepřešlo 12 DK, a užívalo tak verze z roku 2019. Tento fakt kazí reputaci IT pracovníkům, kteří systém Kramerius spravují. Novější verze totiž odstraňují nedostatky předchozích a přinášejí další vylepšení pro uživatele.

Rostoucí počet krameriovských DK

Počet institucí, kde se užívá systém Kramerius, je důkazem jeho velké oblíbenosti.

Nejsou to přitom jen české knihovny, které ho zvolily, ale i zahraniční, jako je Das Digitale Forum Mittel- und Osteuropa (DiFMOE) sídlící v Mnichově. V DK zpřístupňuje řadu plzeňských a brněnských knih, novin, časopisů a grafik. Tabulka 1 uvádí na konci roku 2021 už 46 DK pracujících v tomto systému. Na začátku roku 2020 přibyla DK Národního pedagogického muzea J. A. Komenského v Praze (NPMK), v září 2020 DK Husitského muzea v Táboře, v lednu 2021 DK Národního ústavu lidové kultury (NULK) ve Strážnici a na konci roku 2021 DK Historického ústavu AV (HÚAV) ČR.

Uživatelé rostoucím počtem DK nadšeni nejsou, protože musejí prohledávat stále větší počet DK, pokud chtějí mít jistotu, že využili všechny možnosti při hledání požadovaných informací. Práce s větším počtem DK je pochopitelně časově náročnější než s jednou, a tak uživatelé sní o Superkrameriu, který by obsahoval digitalizáty ze všech českých digitalizačních pracovišť soustředěné do jedné DK.

Velké a malé krameriovské DK

V Tabulce 1 jsou tradičně seřazeny DK podle počtu zdigitalizovaných stran od největších k nejmenším. Pořadí na prvních místech se již řadu let nemění. Národní digitální knihovna (NDK) zpřístupňovala na konci roku 2021 přes 66 milionů stran. DK Moravské zemské knihovny (MZK) měla o 5 milionů stran méně, protože na rozdíl od NDK neobsahuje digitalizáty vzniklé v projektech českých knihoven v rámci VISK 7. V dalších DK (s výjimkou České digitální knihovny) se desítky milionů zdigitalizovaných stran už nenajdou. Za DK Knihovny Akademie věd (KNAV) ČR se tradičně řadí DK VKOL a DK Jihočeské vědecké knihovny (JVK) v Českých Budějovicích. Německou DK DiFMOE předběhla DK Digitální studovna Ministerstva obrany (DSMO) ČR, kam se dostávají digitalizáty z knihovny Vojenského historického ústavu. Oproti předchozímu období si v pořadí polepšila DK Národního muzea, která se dostala před DK Moravskoslezské vědecké knihovny (MSVK) v Ostravě. DK NTK byla přeskočena DK Knihovny Antonína Švehly. DK Severočeské vědecké knihovny (SVK) v Ústí nad Labem se konečně dostala přes hranici půl milionu stran a je tak na 19. místě. Skokanem roku je DK Muzea Jindřichohradecka, která se buduje teprve od února 2018 a nyní je dvacátá šestá.

Ke změnám v pořadí došlo i ve spodní části tabulky, protože do některých menších DK nebyly naimportovány v posledních letech žádné nové digitalizáty, a tak je předběhly DK, které jsou pravidelně obohacovány. Během posledních dvou let nepřibyla ani jedna stránka do DK Výzkumného ústavu geodetického, topografického a kartografického (VÚGTK) ve Zdibech a do DK Městské knihovny (MK) v České Třebové. Ještě horší vizitku si udělaly DK Západočeského muzea v Plzni, Mendelovy univerzity (MENDELU) v Brně a Muzea východních Čech v Hradci Králové, u nichž počet stran zůstal beze změny dokonce čtyři roky.

Na konci tabulky je DK Vysoké školy uměleckoprůmyslové (VŠUP) v Praze, která se buduje od března 2019, a DK HÚ AV ČR, kde po měsíci své existence vystavili osmdesát stránek časopisu Svět myslivosti z roku 2018. Je to titul, který již dříve zpřístupnil Lesnický a myslivecký digitální archiv (LMDA) a který by málokdo hledal v DK HÚ AV ČR.

Česká digitální knihovna

Na třetím místě podle počtu zdigitalizovaných stran je stále Česká digitální knihovna (ČDK), která se označuje za národní agregátor digitálních knihoven a „umožňuje vyhledávání v dokumentech obsažených v digitálních knihovnách provozovaných jednotlivými knihovnami v České republice“2. Měla by tedy být v tabulce na prvním místě s velkým náskokem před NDK. Bohužel, zatím umožňuje prohledávat jen 44 milionů stran, což nejsou ani 2/3 počtu stran NDK. Ve skutečnosti prohledá v současnosti necelou polovinu obsahu NDK. Potěšitelné je, že však prohledá celý obsah dalších dvanácti DK a že v roce 2020 přibyl do ČDK obsah DK Knihovny A. Švehly a v roce 2021 obsah DK Národního filmového archivu a DK Krajské knihovny Františka Bartoše (KKFB) ve Zlíně. V roce 2022 se do dalšího vylepšování ČDK mají zapojit kromě pracovníků KNAV i odborníci MZK a NK ČR, což je slibné.

Volná a chráněná díla

Autorský zákon umožňuje dálkově, tedy vzdáleně na počítačích doma či v zaměstnání, zpřístupnit uživatelům jen volná díla, tedy malou část obsahu digitální knihovny. Počet stran zdigitalizovaných volných děl v jednotlivých DK uvádí Tabulka 1 v posledním sloupci. V případě NDK je to šestina obsahu a v případě DK MZK dokonce jen devítina. (Výjimkou je DK DSMO nebo DiFMOE, kde je volných děl přes 90 %, protože se tyto DK zaměřily na digitalizaci starých dokumentů.) Zdigitalizovaná chráněná díla si uživatel mohl dosud zobrazit pouze na určených počítačích v institucích, které je zdigitalizovaly, takže využívanost DK nebyla příliš velká. Situace se změnila až v době koronaviru od konce března 2020 díky zvláštní licenční smlouvě uzavřené mezi NK ČR a kolektivními správci autorských práv Dilia a Ochrannou organizací autorskou – OOA-S a se souhlasem Svazu českých knihkupců a nakladatelů. Smlouva umožnila realizovat projekt nazvaný Národní digitální knihovna pro studenty VŠ, spočívající v dálkovém zpřístupnění celého obsahu NDK a několika dalších DK studentům a pedagogům do 20. 5. 2020. Protože pandemie koronaviru opětovně nabyla na síle na podzim 2020, podařilo se uzavřít podobnou licenční smlouvu i na období od 3. 11. 2020 do 30. 6. 2021.

Přínosem pandemie se paradoxně stala skutečnost, že si studenti zvykli na práci s krameriovskými DK a objevili pro ně do té doby netušené možnosti vytěžování digitálního obsahu pomocí plnotextového vyhledávání. Využívanost DK v porovnání s obdobím před březnem 2020 mnohonásobně vzrostla. Do NDK, DK MZK a DK KNAV vstupuje nevídaný počet uživatelů i po 30. 6. 2021, protože od 1. 7. 2021 mohou registrovaní čtenáři knihoven po přihlášení získat přístup k tzv. dílům nedostupným na trhu (DNNT). V rámci licence DNNT se zatím jedná o vzdálený přístup k digitalizovaným periodikům vydaným do roku 2010 a ke zdigitalizovaným knihám vydaným do roku 2000, a to do tří DK. V roce 2022 se však časová hranice posune k novějším dílům a přibudou další DK, pokud se jejich provozovatelům podaří realizovat speciální technický režim.

Vyhledávací program

Na to, zda je uživatel pracující se systémem Kramerius spokojen, nemá vliv jen výsledek vyhledání, ale i kvalita programu (tzv. klient či rozhraní), který užívá. Od dubna 2019 je k dispozici pro většinu krameriovských DK přívětivější rozhraní s poněkud matoucím označením. Nazývá se totiž „klient Digitální knihovna“. Podobně jako systém se i klient dále vyvíjí. Od konce roku 2020 lze po odladění dotazu v jedné DK přecházet do další DK s využitím „zobáčku“ v řádku, kde je údaj o počtu nalezených záznamů. Pro plnotextové vyhledávání byl klient v roce 2021 upraven tak, že lze používat tytéž operátory a zástupné znaky, které platí při vyhledávání na portálu Knihovny.cz. Přibylo tak proximitní hledání, které se při plnotextovém hledání často využije.

Vzhledem k tomu, že dále poroste počet zdigitalizovaných dokumentů v DK, bude nutné vymyslet nové účinnější postupy plnotextového vyhledávání. Určitým řešením bude tvorba dalších virtuálních sbírek a hledání v nich.

1 Poslední článek na toto téma byl BROŽEK, Aleš. Systém Kramerius v knihovnách ČR na konci roku 2019. Čtenář, 2020, 72(4), s. 142–144. ISSN 0011-2321. Dostupné také z: https://svkkl.cz/ctenar/clanek/3082.

2 Text převzat ze vstupní stránky https://www.czechdigitallibrary.cz/cs.