Hlavní obsah stránky

TÉMA: Využití analytických záznamů v českých knihovnách – nové trendy a výzvy

Bohdana Stoklasová Bohdana.Stoklasova@nkp.cz

Příspěvek mapuje zásadní proměny zpracování a využití článků publikovaných v českých novinách, časopisech a dalších periodických zdrojích v roce 2011 a na počátku roku 2012 a v závěru se zamýšlí nad možnostmi dalšího vývoje v této oblasti. Zatímco pro počátek loňského roku byla charakteristická konfrontace různých přístupů, na jeho konci a na začátku roku 2012 se objevují snahy o její nahrazení účelným a pro všechny přínosným dialogem a propojením různých variant řešení.

Krok 0 – ANL plus i minus

Na počátku roku 2011 ukončila Národní knihovna ČR z ekonomicko-personálních důvodů „klasické“ bibliografické zpracování článků publikovaných v českých novinách, časopisech a dalších periodických zdrojích do báze ANL a nabídla variantní způsob zajištění agendy.

Tento příspěvek není polemikou s materiálem uveřejněným nedávno k podobnému tématu na stránkách tohoto časopisu (Čtenář č. 10/2011, str. 343 – pozn. redakce). Je nepochybné, že náhlý výpadek excerpce mnoha titulů v NK ČR a jejich pomalá náhrada způsobily nemalé problémy v rámci kooperačního systému i na rešeršních pracovištích knihoven. Za tyto komplikace se NK ČR opakovaně omluvila.

Kromě minusů a problémů je však třeba vidět i plusy. Variantní zajištění přístupu k článkům otevřelo přímou dostupnost jejich plných textů a zároveň nový pohled na celou oblast, která je velmi komplexní a působí v ní mnoho různých hráčů. Pokud se podaří jejich aktivity rozumně provázat a sladit, může být výsledek velkým plusem pro knihovny, jejich uživatele i širokou veřejnost. Prozatím jsme na počátku cesty a tento příspěvek přibližuje již vykonané kroky i plány do budoucna.

Krok 1 – Zastřešení ANL a ANL+ v Jednotné informační bráně

ANL+ je experimentální zdroj poskytující informace o článcích publikovaných v českých novinách, časopisech a dalších pokračujících zdrojích od roku 2011.

ANL+ navazuje na bázi ANL, kterou společně vytvářely od roku 1992 Národní knihovna České republiky, Moravská zemská knihovna v Brně, krajské a odborné knihovny. V sou­časné době je ANL+ plněna ze tří zdrojů.

Zdroj 1: Bibliografické záznamy z titulů zpracovávaných krajskými a odbornými knihovnami

Bibliografické záznamy jsou tvořeny bohatými metadaty, obsahují předmětová hesla a selekční prvky jsou provázány se soubory jmenných i věcných autorit. Metadata jsou dostupná všem volně, chybí zde přímá vazba na plné texty.

Zdroj 2: Tituly původně zpracovávané Národní knihovnou – variantní řešení pomocí externích zdrojů

Tituly původně zpracovávané Národní knihovnou ČR jsou dodávány částečně z externích zdrojů (NEWTON Media, a. s.). Obsahují kromě velmi stručných a minimálně formalizovaných metadat i krátký náhled, plné texty a digitalizovanou podobu článků. Metadata i plné texty lze prohledávat. Metadata a stručný náhled jsou dostupné všem volně, přístup k plným textům a digitalizované podobě článků vyžaduje registraci, od roku 2012 je ale zaručen přístup v místě samém pro všechny české knihovny, které projeví zájem a nahlásí své IP adresy NEWTON Media, a. s. – tedy i pro ty, které příslušný dokument nevlastní ve svém fondu.

Zdroj 3: Tituly původně zpracovávané Národní knihovnou – variantní řešení pomocí „vlastní“ digitalizace

Tituly původně zpracovávané Národní knihovnou ČR dodávané částečně jako výsledek „vlastní“ (externě zadávané) digitalizace, zčásti Knihovnou Akademie věd. Tituly obsahují v porov­nání se zdrojem 2 bohatší metadata, stručný náhled, plné texty a digitalizovanou podobu článků. Metadata i plné texty lze prohledávat. Metadata jsou dostupná všem volně, přístup k plným textům a digitalizované podobě článků se řídí možnostmi a limity knihovní licence autorského zákona.

Pokud porovnáme pouze metadata pocházející ze zdrojů 1 a 2 (viz obr. 1, nahoře zdroj 2, dole zdroj 1), nevychází porovnání pro zdroj 2 příliš lichotivě.

Možnost prohledávání plných textů soustředěných v centrálním indexu, který obsahuje kromě článků i přepis televizního a rozhlasové­ho zpravodajství a možnost okamžitého získání přepisu plného textu (viz obr. 2) a zobrazení náhledu na digitalizovanou podobu původního článku, pokud chceme vidět i obrázky (viz obr. 3), již posouvá jazýček vah jas­ně směrem ke zdroji 2.

Zdroj 3 je jakýmsi kompromisem – obsahuje v porovnání se zdrojem 2 bohatší metadata, ale knihovní licence autorského zákona klade pro využití plných textů a náhledů na digitalizovanou podobu dokumentů v porovnání s variantou 2 – těžící z výhod bilaterálních smluv mezi Newton Media a vydavateli – podstatně větší limity.

Zvažování výhod a nevýhod jednotlivých variant a snahy o vyloučení některých z nich však nemají z hlediska budoucnosti a zajištění maximálního komfortu pro naše uživatele velký smysl, zvláště pak ne v době, kdy disponujeme nástroji na jejich propojení. V současné době jsou všechny zdroje propojeny v rámci Jednotné informační brány.

V rámci existujících licenčních podmínek pro Jednotnou informační bránu máme možnost využívat centrální index Primo. Se všemi záznamy je možné pracovat a využívat je paralelně s mnoha dalšími zdroji ve standardním rozhraní MetaLibu http://www.jib.cz, pro ANL+ máme navíc v rámci experimentu k dispozici dočasně též rozhraní Prima http://anlplus.jib.cz. Ať již bude pro centrální národní portál vybrán jako rozhraní kterýkoli ze stávajících čtyř horkých kandidátů, nebo se objeví kandidát/i další, komfort by měl být přinejmenším stejný jako u varianty experimentálního zpřístupnění prostřednictvím Prima.

Krok 2 – Obohacování metadat

V roce 2012 podaly krajské knihovny v rámci VISK 9 řadu projektů, jejichž předmětem je obohacení metadat ze zdrojů 2 a 3, která pokládají s ohledem na rešeršní a bibliografické potřeby za nedostatečná. Pro nový model kooperativní katalogizace článků založený na přebírání záznamů z indexu ANL+ je plánován následující postup:

1. katalogizátor pracuje ve svém lokálním systému, kde provádí selekci dokumentů ke zpracování,

2. využije služeb Jednotné informační brány a ověří, zda již existuje záznam (typicky by měl být k dispozici z ANL+ coby výsledek digitalizace nebo od agregátora), který převezme,

3. převzatý záznam zkontroluje a doplní o chybějící pole (přitom zachová existující identifikátor z digitalizace nebo od agregátora),

4. pokud záznam v Jednotné informační bráně nenajde, zpracuje jej jako nový,

5. takto zpracovaný záznam uloží ve svém lokálním systému, odkud se pravidelnými exporty dostává do báze ANL01 v NK ČR (a posléze automaticky do ANL+, kde se díky identifikátoru propojí s původním záznamem z digitalizace nebo od agregátora).

Tento model má následující výhody:

  •  knihovny pracují ve svém lokálním knihovním systému, který znají nejlépe (tj. nemusí se učit nic nového);
  •  maximálně využívá existující infrastrukturu:

• prostředí Jednotné informační brány a její profily pro stahování bibliografických záznamů založené na standardu Z39.50, který je úspěšně implementován a rutinně provozován ve všech knihovních systémech v ČR po řadu let,

• schopnost Jednotné informační brány vyhledávat v centrálním indexu ANL+ a přebírat bibliografické záznamy,

• schopnost Jednotné informační brány provádět konverze a úpravy záznamů v rámci provedeného dotazu a vrácených výsledků,

• standardní způsob dodávání dat do souborné báze ANL01 udržované v Národní knihovně ČR, který je shodný s mechanismem dodávání do Souborného katalogu ČR.

  •  umožňuje rozlišit „čistou“ verzi článkové bibliografie, kde se schází pouze vybrané články (souborná báze ANL01 v NK ČR) a její úplnou podobu v prostředí indexu ANL+;
  •  nevyžaduje žádné další investice s výjimkou centrálního indexu ANL+.

Výsledkem projektů realizovaných v rámci VISK 9 budou dostatečně podrobná metadata propojená se soubory jmenných a věcných autorit, plnými texty i digitalizovanou podobou původních článků. Spokojeni by tedy měli být jak profesionální rešeršéři a bibliografové, tak běžní uživatelé vyžadující vše hned a na jednom místě.

Krok 3 – Nové cesty digitalizace a tvorby metadat na úrovni článků

Tuto cestu zahájila Národní knihovna ČR v roce 2011 a je popsána jako zdroj 3. Původně izolovaný experiment Národní knihovny ČR se v roce 2012 rozšíří v rámci VISK 7 na úroveň krajů. Navíc by na trh digitalizace mohly vstoupit nové subjekty. Vydavatelé a agregátoři již digitální podobu periodik mají, krok digitalizace si tedy mohou ušetřit, a tím snížit zatím poměrně vysoké tržní ceny. Zbývá jim „jen“ zvládnout předepsané formáty, standardy a metadata, což si zřejmě vyžádá určitý čas, ale pak vyroste stávajícím firmám specializujícím se na digitalizaci a tvorbu doprovodných metadat zdatná konkurence.

ZÁVĚR

Je dobře, že konfrontaci jednotlivých způsobů řešení vystřídala snaha o spolupráci, kombinaci a propojení. Pokud tento trend vydrží i do budoucna, bude v Česku existovat špičkové řešení, které bude přínosem pro uživatele našich knihoven a inspirací pro zahraniční knihovny.

Zatímco rok 2011 byl ve znamení hledání odpovědi na otázku JAK řešit zpracování a zpřístupnění článků publikovaných v českých novinách, časopisech a dalších periodických zdrojích, v roce 2012 a nepochybně i v letech dalších budeme společně řešit otázky CO, PROČ a ZA KOLIK zpracovávat na analytické úrovni, kde nám stačí výsledky automatizovaného zpracování a kde a do jaké míry je nutná manuální intervence.↑

 

Obr. 1: Zdroje 1 a 2 – porovnání metadat

Obr. 2: Zdroj 2 – plný text

Obr. 3: Zdroj 2 – náhled na digitalizovanou podobu původního článku