Hlavní obsah stránky
VYUŽITÍ NOVÝCH TECHNOLOGIÍ: Systém Kramerius v knihovnách ČR na konci roku 2023
ALEŠ BROŽEK ales.brozek@knihovnauk.cz
Již posedmé1, vždy ve dvouletých intervalech, seznamuji čtenáře tohoto měsíčníku se stavem digitálních knihoven (DK), které využívají systém Kramerius. Následující řádky shrnují změny, ke kterým došlo od začátku roku 2022 do konce roku 2023.
Verze systému Kramerius
Kramerius je softwarové řešení pro zpřístupnění digitálních dokumentů. Prvotně je určen pro monografie a periodika. Využít se však dá také ke zpřístupnění dalších typů dokumentů, jako jsou mapy, hudebniny a staré tisky, případně částí dokumentů, jako jsou články a kapitoly.2 Na rozdíl od řady jiných systémů má tu velkou přednost, že umožňuje plnotextové vyhledávání ve zdigitalizovaných dokumentech. Zkušený uživatel tak dokáže najít ve zdigitalizovaných starých knihách, novinách a časopisech zajímavé informace, které unikly pozornosti jiných badatelů, protože texty studovali jen povrchně.
Vývoj systému Kramerius byl zahájen před dvaceti lety a v knihovnách byla tehdy nasazena verze s číslem 3. Uživatelé ji příliš nemají v oblibě, protože naskenované strany nejsou v běžných formátech, jakými je jpg či pdf, ale ve formátu DjVu, takže si musejí stáhnout speciální plugin. Bohužel, jak ukazuje Graf 1 i Tabulka 1, ještě dvě DK vystavují zdigitalizované dokumenty v této zastaralé verzi (názvy DK pracujících ve verzi 3 jsou v tabulce napsány kurzívou). Pro badatele je stále nenahraditelná DK Národní knihovny ČR (NK). Ve verzi 3 je vystaveno téměř devět milionů stran. Většina monografií a část novin již byla zkonvertována a vystavena ve verzi 5. Přesto noviny z druhé poloviny 19. století a první poloviny 20. století, jako je Bohemia z let 1890 až 1900, Deutsche Zeitung Bohemia z let 1915 až 1938 nebo Národní politika z let 1926 až 1945, se v jiných DK nenajdou. Ve verzi 3 je i DK Divadelního ústavu v Praze, kde je jen 266 tisíc zdigitalizovaných stran, a snad již v roce 2024 proběhne konverze do verze 7.3
Jedinou DK, která užívá již nevyvíjenou verzi 4, resp. 4.6, je DK Muzea východních Čech v Hradci Králové, obsahující 15 zdigitalizovaných regionálních periodik. Téměř všechny (kromě Královéhradeckých rozhledů z roku 1913 a 1915) obsahuje také DK Studijní a vědecké knihovny (SVK) v Hradci Králové, takže uživatel zvyklý na přívětivý vyhledávací software zvaný „klient DK“ bude raději pracovat s DK hradecké SVK. Navíc využije faktu, že tato DK pracuje v režimu Díla nedostupná na trhu (DNNT), a tak si periodika prohlédne z pohodlí domova.
Nejvíce užívanou verzi 5 najdeme u 34 DK. Tato verze se dále vyvíjela: v letech 2022 a 2023 přibyly varianty 5.8.0, 5.8.1, 5.8.2, 5.8.3 a 5.8.4 a nasadilo si je 15 DK; 19 DK zůstalo u starších verzí 5.3, 5.4, 5.5 a 5.7. Ty jsou nyní už zastaralé, např. verze 5.3 byla uvolněna v roce 2016 a 2017. IT pracovníci, kteří systém Kramerius spravují, si tak zastaralými verzemi kazí reputaci. Novější verze totiž odstraňují nedostatky předchozích a přinášejí další vylepšení pro uživatele.
Devět dní před koncem roku 2021 byla konečně vydána dlouho připravovaná sedmičková verze. Přinesla výrazné zlepšení práce s virtuálními sbírkami. Její nasazení je nyní podmínkou pro knihovny, které chtějí zpřístupňovat digitalizáty v režimu DNNT. V uplynulých dvou letech byla nainstalována do 12 DK.
Rostoucí počet krameriovských DK
Počet institucí, v nichž se užívá systém Kramerius, je důkazem jeho velké oblíbenosti. Nejsou to přitom jen české knihovny, které si ho vybraly, ale i zahraniční. V uplynulých dvou letech k nim přibyly dvě slovenské DK: jedna v Matici slovenskej v Martině, druhá v Centru vedecko-technických informácií SR v Bratislavě. V Krameriu lze prohledávat i přes pět tisíc knih, které byly zdigitalizovány v rámci evropského projektu EODOPEN – eBooks-On-Demand-Network Opening Publications for European Netizens, který provozuje univerzita v Innsbrucku.
Tabulka 1 uvádí na konci roku 2023 už 49 DK pracujících v systému Kramerius. V září 2022 přibyla již zmíněná DK EODOPEN, v listopadu 2022 DK Českého rozhlasu, koncem ledna 2023 nejdříve bratislavská CVTI s pěti tituly a krátce po ní martinská DIKDA.
Velké a malé krameriovské DK
V Tabulce 1 jsou DK tradičně seřazeny podle počtu zdigitalizovaných stran od největších k nejmenším. Pořadí na prvních místech tentokrát doznalo výrazné změny, když se před Národní digitální knihovnu (NDK) a DK Moravské zemské knihovny (MZK) konečně dostala Česká digitální knihovna. Čtvrté místo obsadil Katalóg digitálnej knižnice (DIKDA). Oproti konci roku 2021 si polepšilo Das Digitale Forum Mittel- und Osteuropa (DiFMOE), sídlící v Mnichově a zpřístupňující digitalizáty řady plzeňských a brněnských knih, když předstihlo Digitální studovnu Ministerstva obrany ČR (DSMO). Ta v DK vystavuje nejen digitalizáty z knihovny Vojenského historického ústavu, ale i úmrtní matriky z Vojenského historického archivu, což potěší genealogy. Na patnáctou příčku se dostala DK Národního muzea, protože z DK Fakulty sociálních věd (FSV) ubylo za dva roky téměř 300 tisíc stran a DK FSV klesla až na 20. místo.
Ke změnám v pořadí došlo i ve spodní části tabulky, protože do některých menších DK nebyly naimportovány v posledních letech žádné nové digitalizáty, a tak je předběhly DK, které jsou pravidelně obohacovány. Během posledních dvou let nepřibyla ani jedna stránka do DK Krajské knihovny Karlovy Vary, Mendelovy univerzity (MENDELU) v Brně, DK Výzkumného ústavu geodetického, topografického a kartografického (VÚGTK) ve Zdibech, Muzea východních Čech v Hradci Králové, Husitského muzea v Táboře, Městské knihovny v České Třebové a Historického ústavu AV. Oproti konci roku 2021 se zmenšila nejen DK FSV, ale mírně i DK Západočeského muzea v Plzni.
Spolehlivost provozu krameriovských DK
Tabulka 1 sice uvádí 49 krameriovských DK, na konci roku 2023 však nefungovala 18 dní DK Národního pedagogického muzea J. A. Komenského a 14 dní DK Českého rozhlasu. Do DK Muzea Tábor se uživatelé nemohli dostat od poloviny října 2023 a do DK Historického ústavu Akademie věd ČR dokonce od poloviny června 2023. Jiné DK, jako např. DK Městské knihovny v Praze, sice byly poslední den v roce funkční, ale k výpadkům docházelo poměrně často během roku. Spolehlivost provozu krameriovských DK sleduje Registr Krameriů (RK). Pokud DK nefunguje, ukáže se u jejího názvu červené kolečko. Po kliknutí na název DK a zvolení nabídky Provoz se zájemce dozví, kdy systém Kramerius v knihovně fungoval, a kdy ne. V průběhu roku 2022 byl RK přepracován4 a nově uvádí v přehledové tabulce i údaj, kolik dní uplynulo od posledního přírůstku, a informaci o počtu dokumentů s licencí DNNT.
Česká digitální knihovna
Česká digitální knihovna (ČDK) obsahuje metadata průběžně sklízená z digitálních knihoven provozovaných v České republice. Cílem je postupně zapojit všechny digitální knihovny v ČR provozované v systému Kramerius. Samotné digitální dokumenty jsou uloženy ve zdrojových (tedy původních) digitálních knihovnách, ze kterých jsou při požadavku uživatele na prohlédnutí staženy do webového rozhraní ČDK. Díky tomu mohou uživatelé přistupovat k milionům stran digitalizovaných dokumentů napříč knihovnami zapojenými do ČDK v rámci jednoho intuitivního rozhraní.5 Ještě na konci roku 2021 byla ČDK na třetím místě co do počtu zdigitalizovaných stran. Sice sklidila 14 DK, ale jen necelou polovinu obsahu NDK. V roce 2022 se do dalšího vylepšování ČDK zapojili kromě pracovníků Knihovny Akademie věd (KNAV) i odborníci z MZK a NK ČR, což se projevilo i tím, že se ČDK v říjnu 2023 dostala na první místo podle počtu zdigitalizovaných stran. Vylepšená ČDK zatím sklízí obsah osmi DK. Z větších DK chybějí metadata např. z DK Vědecké knihovny v Olomouci, Jihočeské vědecké knihovny či Národní lékařské knihovny. Od poloviny roku 2023 však existuje testovací verze aplikace nazvané Kramio.6 Kromě jiného obsahuje funkci Zacílení dotazu, díky níž lze najednou prohledat 12 DK včetně těch chybějících v ČDK.
Volná a chráněná díla
Badatelé na celém světě jsou omezeni autorským zákonem a z pohodlí domova mohou přistupovat jen ke zdigitalizovaným publikacím, pokud jejich původci (autoři textu, ilustrátoři, překladatelé) zemřeli před 70 a více lety a pokud od vydání jejich děl uplynulo nejméně 50 let. Takových publikací bývá v krameriovských DK malé množství. V případě NDK jich bylo na konci roku 2023 necelých 17 % a v DK MZK dokonce jen 12 %. Pokud chtějí badatelé ostatní digitalizáty plnotextově prohledávat nebo jen číst, musejí chodit k vyčleněným počítačům v knihovně, která dokumenty zdigitalizovala.
Naštěstí byla v posledních letech vytvořena licence DNNT a ta umožňuje dálkově zpřístupnit, tedy vzdáleně na počítačích doma či v zaměstnání, i digitalizáty novějších publikací. Díky licenční smlouvě uzavřené mezi NK ČR a kolektivními správci autorských práv Dilia a Ochrannou organizací autorskou – OOA-S a se souhlasem Svazu českých knihkupců a nakladatelů mohou registrovaní čtenáři knihoven, které uzavřely smlouvu s NK ČR, po přihlášení získat přístup k DNNT. Která konkrétní díla to jsou, se čtenáři dozvědí ze Seznamu děl nedostupných na trhu (SDNNT)7, provozovaného NK ČR od června 2022. Protože jsou čtenáři zvyklí hledat nejprve v on-line katalogu knihovny, kterou navštěvují, několik knihoven (např. JVK v Českých Budějovicích, MěK Kladno) implementovalo SDNNT do svých katalogů a rozšířilo jim nabídku čtiva o digitalizáty.
Zhruba dvě třetiny DNNT však dosud nebyly zdigitalizovány, navíc na konci roku 2023 pomocí vzdáleného přístupu byly dostupné monografie vydané před rokem 2003 a periodika vydaná před rokem 2013, nikoliv novější. I tak je to významný přínos pro badatele. Bohužel zatím nabízejí práci v režimu DNNT jen čtyři DK. K trojici (NDK, DK MZK, DK KNAV) přibyla DK SVK Hradec Králové, když koncem března 2022 zpřístupnila přes 1500 titulů.8 Pokud uživatelé ve větší míře studují slovenské publikace, využijí nabídky DK DIKDA. Ta umožňuje studovat publikace v režimu DNNT, aniž byste museli mít čtenářský průkaz vystavený v Matici slovenskej. Protože si vyjednala odlišnou licenční smlouvu s ochrannými svazy, stačí uvést svou mailovou adresu a získáte přístup k digitalizátům 15 800 knih. Mezi nimi je také 350 knih vydaných v Praze.
Vyhledávací program
Z portálu Digitální knihovna Kramerius9, který provozuje MZK, se nedá z bezpečnostních důvodů vstupovat do krameriovských DK, kde nejsou data přenášena v protokolu https. Pro hledání v DK, kde se data stále přenášejí protokolem http, jako je DK kladenské vědecké knihovny nebo DK MENDELU, se používá uživatelsky málo přívětivý klient K5. Navíc se přestal dále vyvíjet a chybí v něm možnost vyhledávat podle rozsahu let, vytvářet citace, řadit podle nově přidaných digitalizátů. Také funkce pro tvorbu virtuálních sbírek je v klientu K5 omezena, na rozdíl od neustále vylepšovaného klienta DK. Na konci roku 2023 měla DK MZK 87 virtuálních sbírek. Jen o dvě méně sestavili kurátoři KNAV a 50 sbírek nabízela NDK. Při plnotextovém hledání osoby s běžným příjmením v celé DK, kdy se dostane příliš velký počet výsledků, se vyplatí hledat jen v takové sbírce, do níž jsou zařazena encyklopedická díla a díla z oboru, kde daná osoba působila. U DK, které začnou užívat Kramerius verze 7, bude možnost vytvářet čtenářské seznamy, takže uživatel přestane být závislý jen na virtuálních sbírkách, jejichž obsah nemůže ovlivnit.
Výsledky plnotextového hledání v krameriovských DK s využitím umělé inteligence, jak byly předvedeny na 24. ročníku konference Archivy, knihovny, muzea v digitálním světě, zatím nebyly příliš dobré. Naznačily však, že v budoucnu, kdy se už nebudou plnotextově prohledávat desítky milionů stran, ale stovky milionů, by umělá inteligence mohla badatelům významně pomoci.
1 Poslední článek na toto téma byl BROŽEK, Aleš. Systém Kramerius v knihovnách ČR na konci roku 2021. Čtenář, 2022, roč. 74, č. 3, s. 88–91. ISSN 0011-2321. Dostupné také z: https://www.svkkl.cz/ctenar/clanek/3576
2 https://github.com/ceskaexpedice/kramerius?tab=readme-ov-file#readme
3 Dne 23. 5. 2024 na veletrhu Svět knihy mne kolegyně z Divadelního ústavu informovaly, že se jim podařilo převést jejich DK do Krameria verze 7.
4 ŽABIČKA, Petr a Pavla RYCHTÁŘOVÁ. Registr Krameriů. IT lib, 2023, č. 1–2, s. 7–10.
5 Text převzat ze vstupní stránky https://ceskadigitalniknihovna.cz/about
6 KŘÍŽ, Filip. Kramio – přístup nejen do Digitální knihovny NLK. Lékařská knihovna. Online. 2023, roč. 28, č. 1–2 [cit. 20.01.2024]. Dostupné z: https://casopis.nlk.cz/archiv/2023-28-1-2/kramio-pristup-nejen-do-digitalni-knihovny-nlk/.
7 https://sdnnt.nkp.cz/sdnnt/home
8 V dubnu 2024 se k ní přidala DK Krajské knihovny F. Bartoše ve Zlíně s 630 tituly.