Information for libraries

  • na webu

Visual

Nacházíte se zde: Úvod Archiv 2016 / 1 Recenzované příspěvky Výměnné formáty bibliografických dat: jejich proměna v současnosti

Výměnné formáty bibliografických dat: jejich proměna v současnosti

Resumé: Výměnné formáty bibliografických dat jsou v knihovnické praxi používány od 60. let minulého století a i přes to, že uplynulo několik desetiletí nedošlo k příliš velké změně, přestože po ní knihovníci volají. Nedostatky a přežitost formátů typu MARC jsou zřejmé. Od nového tisíciletí dochází k vyššímu tlaku fna změnu. Cílem článku je shrnout aktivity na tomto poli a nastínit cesty možného vývoje. Na základě analýzy jednotlivých projektů, ale i dotazníkového šetření, lze směr, kterým se tato oblast bude nyní ubírat, odhadnout. Aktivity nyní směřují k publikačnímu modelu založenému na principu propojených dat (linked data) při zachování současné katalogizační praxe.


Klíčová slova: výměnné formáty, bibliografická data, propojená data, linked data, BIBFRAME, Schema.org, katalogizace

Summary: Exchangeable formats of bibliographical data in the practice of libraries have been used from the 60ies of the last century, and in spite of the decades having flown by no substantial change has taken place, although the librarians have called for it. The deficiencies and the obsolescence of the MARC type formats are obvious. The pressure for change has been increasing from the turn of the century. The objective of the present article resides in summarizing the activities on this field, including an outline of possible further development. The analysis of diverse projects and of the respective questionnaires allows us to estimate what direction of development this field is likely to take. The activities tend towards the linked data publication model, while retaining the cataloguing practice of the present day.

Keywords: exchangeable formats, bibliographical data, linked data, BIBFRAME, Schema.org, cataloguing

file_pdf.png

PhDr. Klára Rösslerová / Filozofická fakulta Univerzity Karlovy v Praze(Faculty of Arts, Charles University in Prague), náměstí Jana Palacha 2,116 38 Praha 1, Česká republika

„… Jen se podívejte na záznam ve formátu MARC a pochopíte, o čem mluvím. Ale ať vás z toho moc nebolí hlava. Existují pouze dva druhy lidí, kteří záznam ve formátu MARC umí přečíst, aniž by k tomu potřebovali kupu příruček: hrstka našich top katalo gizátorů a pak ti, kteří berou tvrdé drogy.“ 1(TENNANT, 2002)

1 Úvod

Nejpoužívanějším výměnným formátem bibliografických dat je v současnosti formát MARC 212 a v menší míře UNIMARC (Universal MARC, Univerzální formát MARC). Již delší dobu se mluví o zastaralosti formátů typu MARC, zároveň však nelze jednoduše převzít jiný formát, množství záznamů převést, přizpůsobit knihovní systémy, které s jeho strukturou pracují. V těchto formátech byla bibliografická data po několik desítek let vytvářena, ukládána a následně distribuována. Je však zřejmé, že jednoduché období je již ve světovém knihovnictví minulostí.

Není ani tak důležitá kritika formátů typu MARC, respektive analýza, co je na nich zastaralé, zbytečné. Je spíše potřebné nahlédnout na vývoj v oblasti knihovnictví (či spíše obecně webu) a navrhnout, jak by měla vypadat struktura dat produkovaných knihovnou, aby byl stále sledován primární cíl: poskytnutí služby uživateli knihovny, a to co nejrychleji a nejjednodušeji – tedy přesně tak, jak je uživatel zvyklý při použití webu. Dle průzkumů více než 80 procent uživatelů zahajuje své hledání na volném webu, teprve poté začnou vyhledávat v knihovních katalozích. Je zřejmé, že pokud knihovny chtějí sledovat trendy a přizpůsobovat se jim (což činí např. v oblasti propagace a obecně komunikace na sociálních sítích), měly by svá cenná data zpřístupňovat takovým způsobem, aby je uživatelé mohli pohodlně vyhledávat za pomoci běžných vyhledávačů.

Cesta směřuje k maximální integraci dat z různých zdrojů – a to nejen nekomerčních, ale i komerčních. Vývoj se tedy zároveň dostává z čistě knihovní, resp. nevýdělečné oblasti, až na pomezí obchodu, a přestává tak být předmětem zájmu pouze knihoven, ale i takových společností, které mohou přidávat ke knihovním datům odkazy na své komerční produkty.

Dojde-li ke spojení knihovnictví s komerční sférou, může to být pro všechny strany přínosné: knihovní data jsou velmi kvalitní. Jejich vytváření je sofistikovaná a drahá práce, která vyžaduje odborné vzdělání a praxi knihovníků.

Cílem tohoto článku je předpovědět možný budoucí vývoj v oblasti výměnných formátů bibliografických dat. Bude MARC 21 nahrazen jiným formátem? Bude nahrazen jedním formátem? Nebo bude nahrazen podle účelu několika formáty: jiný formát pro výměnu a prezentaci dat, jiný pro uložení dat v systémech nebo výměnu mezi knihovnami?

„…kvůli formátu MARC jsme technicky izolováni, se zbytkem světa, který je založen na webu, nemůžeme nijak rozumně spolupracovat“3 (z článku MARC neumírá dost rychle, AYRE, 2014)

1.1 Východiska

Přestože je stejně jako v životě důležitější dívat se vpřed než plakat nad minulostí, pro návrh budoucnosti výměnných formátů je důležitá analýza současného stavu, nalezení chyb či již nedostačujících řešení a z výsledků analýzy pak vycházet při definování požadavků, které mají vést k žádoucímu budoucímu stavu. Komplexněji, i když velmi stručně, se tomuto tématu věnoval ve svých článcích Roy Tennant (TENNANT, 2002 a 2002b). Východiska, na nichž lze podle něj stavět, jsou následující:

Uchovat to, co je dobré.

Dosáhnout vysoké míry granularity.

Propojovat pomocí odkazů.

Využívat hierarchických vztahů.

Oprostit se od fyzického zhmotnění.

Dosáhnout rozšiřitelnosti, flexibility.

Dosáhnout propojitelnosti.

Je zřejmé, že východiskem bude sémantický web.

1.2 Sémantický web

Před vysvětlením, co znamená pojem sémantický web, je vhodné vysvětlit samotný pojem sémantický, respektive výraz sémantika. Sémantika se jako lingvistický pojem zabývá významem slov. Sémantický web je v tomto smyslu takový web, který je strojům srozumitelný. Neznamená to však, že by se ze strojů staly subjekty umělé inteligence, které umějí číst data a chápat jejich smysl tak, jak to známe u lidí. Znamená to, že informace v sémantickém webu jsou strukturovány, a to tak, že stroje rozumí – chápou – rozpoznávají informace, ale na základě značek, které jsou pro toto porozumění používány.

S myšlenkou sémantického webu se poprvé setkáváme u Timothy Barnerse-Leeho, zakladatele webu, a to roku 2001, kdy Barners-Lee vyslovil požadavek nahradit změť souborů propojených hypertextovými odkazy strukturovanou databází, tedy nahradit web dokumentů (web of documents) webem dat (web of data), a to prostřednictvím skrytých značek, které poskytují informace o významu dat v dokumentech obsažených. Chtěl tak vyřešit dva problémy: existenci dat, která nejsou uvedena v HTML (např. databáze) a nejsou tak dostupná (vyhledatelná) pro klasické vyhledávače, tedy problematiku hlubokého (deep) webu, a problém spoléhání se při vyhledávání pouze na klíčová slova bez ohledu na samotný význam obsahu. (KONSTANTINOU, 2015)

O dosažení tohoto cíle – vytvoření webu propojených dat (linked data, viz dále) – se stará mezinárodní konsorcium zabývající se vývojem standardů pro web (World Wide Web Consorcium, W3C), které Barners-Lee založil a jehož je ředitelem. Sémantický web je založen na technologii RDF (Resource Description Framework, Rámec pro popis zdrojů4). (World Wide Web Consorcium, 2013)

1.3 Linked data – propojená data

S pojmem, resp. s myšlenkou propojených dat (linked data) se poprvé setkáváme opět u Timothyho Barnerse-Leeho roku 2006. Koncept propojených dat je publikačním modelem pro zveřejňování strukturovaných dat na webu, který je založen na webových standardech jako http (Hyper Text Transfer Protocol5) a URI (Uniform Resource Identifier, Univerzální identifikátor zdroje) a technologiích sémantického webu jako je datový model RDF (Resource Description Framework, Rámec pro popis zdrojů) (MYNARZ, 2010). OCLC (Online Computer Library Center, Automatizované knihovní středisko s interaktivním přístupem) na svém webu zpřístupnilo velmi názorné video o tom, co propojená data jsou a jaké výhody a možnosti tento koncept přináší do knihoven.

Uplatňovat propojená data znamená vytvářet vazby mezi údaji z různých zdrojů. Může docházet k propojování velmi různorodých dat vytvářených spolu nesouvisejícími organizacemi v různých částech světa, nebo naopak data mohou být součástí heterogenních systémů jediné organizace. (BIZER, 2009). Bizer, Heath a Barners-Lee roku 2009 rozšiřují myšlenku webu dat na „web věcí na světě popsaných podle údajů na webu“.

Podmnožinou propojených dat pak jsou linked open data, otevřená propojená data, znamenající publikování strukturovaných dat, ale v otevřeném formátu, tedy takových dat, která jsou dostupná pro každého. (KONSTANTINOU, 2015) Taková data pak mohou být následně redistribuována, vícečetně používána a mohou být základem pro další využití, a to i komerční.

1.4 Výhody použití metody propojených dat

Health a Bizer (HEALTH, 2011) ve své práci shrnuli, v čem je potenciál propojených dat:

Princip RDF může použít kdokoliv na světě, aby provázal cokoliv s čímkoliv.

Uživatelé mohou díky jakémukoliv URI vyhledat doplňující informace.

Informace z různých zdrojů mohou být jednoduše spojeny sloučením dvou trojic (subjekt-predikát-objekt) do jediného grafu.

RDF umožňuje zobrazit informace, které jsou vyjádřeny různými schématy, v jediném grafu.

Názorným příkladem může být vyhledání výrazu „Jan Hřebejk“ ve vyhledávači Google (viz obrázek 1). Všimněme si v pravé části základních informací o osobě Jana Hřebejka, skupiny fotografií jeho osoby, odkazů na filmy, které režíroval apod. Všechny tyto heterogenní informace jsou zobrazeny právě díky použití propojených dat.

printscreen.png

Obr. 1 Printscreen obrazovky znázorňuje výsledky vyhledávání výrazu „Jan Hřebejk“

1.5 Cesta k sémantickému webu v oblasti knihovnictví

V prvním desetiletí nového tisíciletí se oblastí sémantického webu začali častěji zabývat i odborníci v knihovnictví. V roce 2008 představila knihovnice Filmového a televizního archivu Kalifornské univerzity (University of California Film & Television archive) Martha M. Yee vlastní katalogizační pravidla a model RDF, dokument, ve kterém je bibliografické univerzum podle autorky (příliš) komplexní a právě katalog by měl tuto komplexnost redukovat s cílem ulehčit uživatelům vyhledávání. Lidé, knihovníci, by měli označovat jednotlivá bibliografická data tak, aby s nimi dokázaly pracovat systémy a mohly je uživatelům předkládat v jednoduché a srozumitelné podobě, aby se „na jediné kliknutí“ zobrazovala všechna další díla autora, všechna další vydání, všechny jiné jednotky apod. Toto vše by navíc nedělaly knihovní katalogy, ale komerční vyhledávače typu Google. (YEE, 2008)

Roku 2006 si nechala Kongresová knihovna ve Washingtonu (Library of Congress) připravit od Karen Calhoun zprávu o změnách v katalogizaci, katalozích, knihovních pravidlech i formátech a obecně trendech v oblasti informačních služeb a knihovnictví. Karen Calhoun shrnula nejdůležitější změny a požadavky do několika bodů, z nichž jsou pro tuto práci relevantní následující: větší důraz na sdílené katalogy, sdílení přístupů, katalogy budou podpůrným prostředkem při digitalizačních projektech, a dále již samostatně příprava na propojování („linkages“). Zajímavá je však hlavně myšlenka či návrh, že by se výměnný formát měl ubírat směrem k formátu MARC-XML6, samotná struktura formátu MARC by však měla zůstat neměnná. (CALHOUN, 2006) Proti doporučení Karen Calhoun se však staví Brighid Gonzales, která ve svém článku (GONZALES, 2014) shrnuje, že MARC-XML je použitelný jednoduše proto, že nic lepšího zatím není.

V červnu 2006 se uskutečnila konference ALA (American Library Association, Americká knihovnická asociace), na které viceprezidentka Výboru pro knihovní a informační zdroje (Council on Library and Information Resources, CLIR) a později zástupkyně ředitele pro knihovní služby Kongresové knihovny ve Washingtonu Deanna Marcum přednesla požadavek zamyslet se nad katalogizací s ohledem na pokrok v informačních technologiích. Navrhla vytvoření pracovní skupiny, která by se problematikou zabývala s dostatečným nadhledem. V roce 2006 vznikla Pracovní skupina k budoucnosti bibliografické kontroly při Kongresové knihovně (Library of Congress Working Group on the Future of Bibliographic Control), která si stanovila cíl navrhnout jiný způsob bibliografické kontroly, a to aniž by při tom skupina vycházela ze stávajícího stavu: „neměli bychom se snažit opravovat existující systémy, spíše bychom měli předstírat, že jsme se právě vrátili na Zemi z Marsu…“. (Library of Congress, 2006)

Pracovní skupina v čele s dr. José-Marie Griffiths, děkankou Fakulty informační a knihovní vědy na Univerzitě Severní Karolíny v Chapel Hill (University of North Carolina at Chapel Hill. School of Information and Library Science, SILS) má patnáct členů z řad odborné veřejnosti (katalogizátorů či obecně knihovníků), přítomen je i zástupce firmy Microsoft. Skupina deklarovala zájem spolupracovat s Národní federací pokročilých informačních služeb (National Federation of Advanced Information Services, http://nfais.org/, dříve Národní federace služeb vědeckého referování a indexování, National Federation of Science Abstracting and Indexing Services), jejímiž členy jsou významné knihovny, ale i zcela komerční subjekty jako je EBSCO nebo Elsevier. Z toho je zřejmý ohled pracovní skupiny nejen na oblast knihovnických dat, ale i komerčních katalogů (databází), což pracovní skupina později i deklarovala (spolupracovat s komerční sférou i s uživateli samotnými).

1.6 Zpráva O záznamu

Pracovní skupina roku 2008 představila zprávu O záznamu (Library of Congress. 2006b). Zpráva vyzývá odbornou veřejnost („povolává do akce“) k řešení pěti vytypovaných oblastí. Premisy jsou následující:

Bibliografická kontrola neznamená jen katalogizaci, ale týká se všech typů materiálů dostupných prostřednictvím knihoven rozmanité skupině uživatelů, a to z různých typů míst.

Bibliografické univerzum se netýká jen knihoven, producentů databází a nakladatelů, ale i prodejců, distributorů a všech dalších možných skupin uživatelů, a to bez ohledu na hranice.

Kongresová knihovna by z důvodu rozvoje informačních technologií již neměla plnit roli jediného možného producenta bibliografických záznamů ve Spojených státech amerických, ani by takto neměla být vnímána.

Pět oblastí, které zpráva shrnuje jako témata pro diskuzi, jsou:

Kooperací a sdílením bibliografických záznamů zvýšit efektivnost bibliografické produkce.

Umožnit přístup k nyní nedostupným typům dokumentů.

Přijmout fakt, že uživateli bibliografických informací nejsou jen lidé, ale i stroje (aplikace).

Přizpůsobit se současným trendům a umožnit vkládat např. hodnocení uživatelů do záznamů.

Soustavně se vzdělávat.

Zpráva přináší zásadní doporučení. Všechna se týkají převážně distribuce práce a odpovědnosti a jejich hlavním cílem je odstranění duplicitní práce, která je drahá a při současném vývoji technologií zcela zbytečná. Předpokladem je netrvat nadále na precizním dodržování amerických knihovních standardů. Stávající katalogizační standardy by měly být analyzovány a případně pozměněny tak, aby mohly být používány i mimo oblast knihovnictví. Dále by měly být vytvářeny konverzní programy, které by umožnily sdílení dat napříč různými producenty a distributory dat, a to tak, aby to vyhovovalo všem zainteresovaným stranám, tedy nejen knihovnám, ale i různým informačním službám, (jmenovitě) Amazonu a IMDb (portál umožňující přístup k databázi filmů, televizních pořadů a dalšímu souvisejícímu obsahu).

Z pohledu budoucnosti formátů bibliografických dat však vše výše uvedené předpokládá jednu zásadní změnu: dokud bude knihovní svět používat čtyřicet let starý (a z tohoto pohledu zcela nevyhovující) formát MARC 21, nemůže efektivně kooperovat s ostatními skupinami producentů a distributorů dat, nemůže efektivně předávat svá data mimo knihovní systémy a nemůže tak dostát vizi maximální kooperace a distribuce. Proto je potřeba, aby byl v budoucnu vytvořen nosič záznamu (record carrier), který by umožňoval bezproblémovou komunikaci mezi knihovními systémy, a který by mohly používat nejen knihovny, ale i jiné uživatelské komunity.

Kromě zprávy O záznamu vznikla webová stránka pracovní skupiny (http://www.loc.gov/bibliographic-future/) a postupně se uskutečnila tři velká pracovní setkání s odbornou veřejností: pod vedením společnosti Google bylo zorganizováno setkání s uživateli bibliografických dat, Americká knihovnická asociace uspořádala setkání s tématem struktury dat a Kongresová knihovna uspořádala setkání, jehož hlavním tématem byla ekonomická stránka bibliografických systémů. (Library of Congress. 2008b) Zaměstnanci Kongresové knihovny pak pod vedením Deanny Marcum sepsali oficiální Odpo věď (Library of Congress. 2008b), ve které zprávu jednoznačně podpořili. Postavili se však za podporu politiky otevřeného přístupu (open access), a to s ohledem na malé, nedostatečně financované instituce. Dále volají po dokončení katalogizace nezpracovaného fondu a jeho zpřístupnění v online katalogu a od pracovní skupiny očekávají i návrh řešení retrospektivního zpracování fondu. Text samotné Odpovědi se postupně věnuje pěti oblastem definovaným v dokumentu O záznamu, postupně je analyzuje, doplňuje informacemi o tom, v jaké fázi se v daném okamžiku a v dané oblasti Kongresová knihovna právě nachází (co započala či nezapočala řešit), a případně navrhuje možná řešení. V jednotlivých návrzích je skutečně zřejmý jasný postup směřující k propojování komerční a nekomerční oblasti, a to sdílením bibliografických dat mezi knihovnami a komerčními subjekty, jako je např. Amazon nebo např. racionalizace práce přímo v Kongresové knihovně, a to analyzováním jednotlivých činností a zjišťováním, zda nedochází k duplicitní práci (např. při vytváření CIP, přidělování ISSN apod.). Dále jsou stručně navrhována technická řešení pro sdílení dat, jejich sběr apod.

Zpráva O záznamu však v knihovnické komunitě vyvolala i negativní reakce, a to ne samotným obsahem, ale právě naprostým pominutím trendu volného přístupu, v tomto případě tedy opomenutím principu otevřených propojených dat (open linked data). Jonathan Gray ze skupiny Open Knowledge Foundation vytvořil jako odpověď na dokument O záznamu manifest, ve kterém požaduje otevření se knihoven světu. Svůj požadavek staví na předpokladu, že bibliografické záznamy jsou součástí kulturního dědictví, a tak by měly být široké veřejnosti dostupné bez jakýchkoliv restrikcí, aby je bylo možné dále využívat ať už komerčně či nekomerčně. Pro příklad uvádí možné využití knihovních dat při vytváření webových stránek pro vášnivé čtenáře, pro vytváření různých statistik pro vědce, novináře apod. (Open Knowledge Foundation, 2011) Tento dokument podepsalo 157 knihovníků, informačních pracovníků a soukromých osob z celého světa, z knihoven převažují zaměstnanci knihoven italských vysokých škol, ostatní podepsaní jsou z různých dalších oblastí. Společným jmenovatelem by snad často mohl být open access: jsou to zaměstnanci institucí, které fungují na základě principu otevřeného přístupu nebo se k němu veřejně hlásí. Rozhodně však mezi podporovateli není žádná instituce jako celek.

1.7 Jednotlivé projekty

Od roku 2011 můžeme sledovat již praktický vývoj v oblasti linked data v knihovnictví. Alternativu k formátům typu MARC začala vytvářet Kongresová knihovna ve Washingtonu, ale i OCLC, která začala experimentovat s modelem Schema.org.

1.7.1 Průzkum OCLC

V létě roku 2014 byl z iniciativy OCLC proveden průzkum týkající se poskytování dat v podobě propojených dat světovými knihovnami, archivy, metadatovými službami a digitálními knihovnami. (OCLC Research) Dotazník obsahoval šest jednoduchých otázek:

Kdo data ve formě propojených dat poskytuje

Příklady

Kdo tato data využívá

Proč jsou tato data takto poskytována

Technické detaily

Rady od realizátorů

Organizátoři průzkumu obdrželi celkem 96 relevantních odpovědí z 15 zemí. Je zajímavé, že z odpovědí vyplynulo, že některé instituce data v podobě propojených dat pouze produkují nebo pouze naopak konzumují. Pouze polovina data produkuje a konzumuje zároveň. Jednotlivé instituce pocházejí jak ze Spojených států amerických, tak z Austrálie, Kanady, Francie, Německa, Irska, Itálie, Nizozemska, Norska, Singapuru, Jižní Korey, Španělska, Švýcarska a Velké Británie. Přestože několik projektů je určeno pouze pro neveřejné záznamy, jsou mezi projekty skuteční obři: katalog OCLC WorldCat, který obsahuje již přes 2 miliardy záznamů jednotek (a všechny ve formě propojených dat) je zároveň nejvyužívanějším (s 16 miliony dotazů za den), katalog Kongresové knihovny ve Washingtonu, Britská národní bibliografie. Mimo knihovní katalogy jsou ve formě propojených dat poskytovány Deweyho desetinné třídění (konverzi provedlo taktéž OCLC) nebo Mezinárodní virtuální databáze autorit (VIAF, Virtual International Authority File).

Mezi nejvýznamnější aktivity na poli propojených dat v oblasti knihoven patří model sémantického značkování BIBFRAME Kongresové knihovny a firmy Zepheira, a dále Schema.org používaný OCLC. (GODBY)

1.7.2 BIBFRAME Kongresové knihovny ve Washingtonu

V květnu roku 2011 Kongresová knihovna oficiálně ohlásila vznik Iniciativy bibliografického rámce (Bibliographic Framework Initiative;

http://www.loc.gov/bibframe www.bibframe.org), jejímž cílem je analyzovat:

bibliografický popis jako takový

samotnou tvorbu dat

výměnu dat včetně výměnných protokolů

Cílem analýzy je následně nahradit formáty typu MARC Bibliografickým rámcem (BIBFRAME; Bibliographic Frame). (Library of Congress, 2012d).

Ve zprávě s názvem Bibliografický rámec pro digitální věk (Library of Congress, 2011) iniciativa navazuje na zprávu O záznamu, zároveň ale už odkazuje na vazbu na katalogizační pravidla RDA, která jsou v mnohém pokroková, ale při použití formátu typu MARC nelze jejich potenciál plně využít.

Zpráva Bibliografický rámec pro digitální věk

Ve zprávě jsou definovány následující požadavky na prostředí bibliografického rámce: mělo by být nezávislé na katalogizačních pravidlech; údaje o jednotce, autoritní údaje, údaje o právech, údaje věcného popisu apod. by měly být kodifikovány; měla by být uplatňována textová data propojená pomocí identifikátorů URI (namísto pouhého textu); katalogizátoři nebudou pracovat přímo s formátem (bibliografickým rámcem) tak, jak byli nyní zvyklí pracovat přímo s formátem MARC; bibliografický rámec bude určen pro knihovny (instituce) všech velikostí a zaměření; formát MARC 21 bude zatím stále udržován, ale bude podporován pouze z hlediska implementace pravidel RDA; rámec bude kompatibilní se záznamy uloženými ve formátu MARC; bude umožněn převod záznamů z formátu MARC 21 do nového bibliografického prostředí a zpět.

Zpráva zdůrazňuje, že přizpůsobení se webovému prostředí, přijetí principů a mechanismů propojených dat a RDF jako základního modelu umožní uživatelům jednoduší přístup k informacím, knihovnám otevře dveře k efektivnějšímu ukládání a využívání jejich dat nejen nyní, ale hlavně do budoucna, protože knihovny budou moci využívat znalostí a dovedností odborníků, kteří jsou obeznámeni se současnou prací s daty a s vývojem softwaru. Knihovny se přizpůsobí současnému trhu a tím ušetří své náklady.

Kongresová knihovna ve Washingtonu vyčlenila dle Zprávy prostředky a prostřednictvím grantů podpořila během dvou let vytvoření národních i mezinárodních pracovních skupin, které měly za úkol navrhnout scénáře spolupráce, revizi používaných ontologií, vytvoření ontologie pro popis zdrojů.

Model BIBFRAME

Model BIBFRAME je konceptuálním modelem definujícím čtyři entity: dílo, instance, autoritu a anotaci (Library of Congress. 2012d).

dílo – Dílo je zde definováno zdroj reflektující konceptuální základ katalogizovaného zdroje.

Je popsáno jedenáct typů (podtříd) díla. Jsou to následující typy:

Zvukový dokument (audio), kartografický dokument, soubor dat, smíšená data (více typů dat, která však nevyžadují software), video, multimédium, záznam pohybu (tedy grafický zapsaný, např. tanec), zaznamenaná hudba (taktéž graficky, nikoliv jako zvuk), obraz, text a trojrozměrný objekt.

instance – Instance je individuální, hmotné provedení díla. Je popsáno deset typů (podtříd) instance. Jsou jimi: archiválie, sbírka, elektronický dokument, integrující zdroj, rukopis, monografie, vícesvazková monografie, tisk, seriál a daktyloskopický dokument.

autorita – Autorita je zdroj reflektující klíčové autoritní koncepty, které mají definovaný vztah k dílu a instanci. Jsou popsány čtyři typy (podtřídy) autority: agent (ve smyslu osoby, instituce apod.), místo, čas a téma.

anotace – Anotace doplňuje naše informace o jiných zdrojích. Je popsáno pět typů (podtříd) anotací: obálka (odkaz na obálku), informace o jednotkách (holdings), recenze, redukovaný text (abstrakt apod.), obsah (ve smyslu table of contents).

Vlastnosti entit

Každá z výše uvedených entit má následující vlastnosti:

a) autorizovaný přístupový bod (authorised access point), což je kontrolovaný řetězec znaků sloužící k identifikaci, např. jedinečný název nebo jedinečný název a jméno

b) identifikátor (identifier), což je řetězec znaků jednoznačně identifikující entitu, např. URI, ISBN

c) návěští (label), což je textový řetězec vyjadřující hodnotu vlastnosti

d) vztah (related to), což je jakýkoliv vztah mezi zdroji (URL, Uniform Resource Locator, Univerzální lokátor zdroje)

Kromě těchto společných vlastností jsou dále definovány vlastnosti konkrétních entit.

Formát BIBFRAME v praxi

Formát BIBFRAME začal být testován, a to  převážně v amerických knihovnách. Podle seznamu uveřejněného Iniciativou bibliografického rámce byly testujícími knihovnami: Britská knihovna, Německá národní knihovna, Knihovna Univerzity George Washingtona, Národní lékařská knihovna (USA), OCLC, Princetonská knihovna a Kongresová knihovna. Výsledkem bylo vytvoření Slovníku BIBFRAME (BIBFRAME Vocabulary), který je ještě stále zpřesňován, a konverze několika milionů dat ve formátu BIBFRAME.

Na webových stránkách Kongresové knihovny ve Washingtonu jsou volně přístupné veškeré potřebné materiály a aplikace pro konverzi dat, které mohou knihovny pro svou práci používat. V roce 2015 byl Kongresovou knihovnou ohlášen i BIBFRAME Editor (dostupný tamtéž), editor určený pro katalogizaci přímo do struktury BIBFRAME. V editoru jsou připraveny šablony pro zpracování v souladu s pravidly RDA monografií, hudebnin, seriálů, kartografických dokumentů, BluRayDVD a Audio CD. U těchto kategorií je vždy na výběr mezi instancí nebo dílem.

V tuto chvíli některé americké knihovny již nechávají celé své katalogy konvertovat do podoby propojených dat, a to komerčně firmou Zepheira, která se na vývoji formátu BIBFRAME podílela. V současnosti konverzí prochází přes tři miliony bibliografických záznamů Knihoven Univerzity v Bostonu (Boston University Libraries) nebo knihovny University v Manitobě (University of Manitoba). Program pro konverzi z formátu MARC/XML je však na webu přístupný taktéž, a to volně.

V Evropě patří mezi pionýry v této oblasti Německá národní knihovna, která své bibliografické záznamy poskytuje i v souladu se standardem RDF od roku 2010. Přestože knihovna používá vlastní publikační model založený na rozšíření modelu Schema.org, hlásí se i k BIBFRAME.

1.7.3 Schema.org OCLC

OCLC se začala zabývat možností prezentování svých dat v podobě linked data ve stejné době jako Kongresová knihovna ve Washingtonu, tedy v roce 2011. Na rozdíl od ní však OCLC nezačala vyvíjet vlastní podobu, ale přejala slovník Schema.org. Schema.org je společnou aktivitou firem stojícími za vyhledávači Bing, Google, Yahoo! a Yandex.

Tento slovník byl však postupně rozšířen o verzi vhodnou pro knihovny. Model propojených dat zpracovaný OCLC definuje podobné entity jako BIBFRAME. Jsou jimi dílo (work), instance (instance), organizace (organization) a osoba (person). V porovnání s modelem BIBFRAME je již z tohoto zřejmé, že BIBFRAME byl vyvinut pro účely knihoven: vychází z existence formátů a jeho cílem je dosáhnout kompatibility s vyhledávači, aby data, resp. záznamy uložené v knihovních databázích byly jednoduše prohledatelné a dostupné uživatelům způsobem, na jaký jsou při hledání informací v současnosti zvyklí. Schema.org žádné úzké zaměření nemá. Jeho cílem je jednoduché vyhledání dat bez ohledu na jejich původ, není tedy svázán s žádnými pravidly pro popis knihovních zdrojů, a je tak oproti BIBFRAME „plošší“. Na rozšíření publikačního modelu i pro prostředí knihoven intenzivně pracuje za tímto účelem vzniklá skupina W3C Schema Bib Extend Community Group.

Zástupci OCLC a Kongresové knihovny ve Washingtonu se rozdíly a kompatibilitou obou schémat intenzivně zabývají. Přestože se obě schémata ve svém jádru překrývají (překryvem je rozšíření Schema.org pro knihovny – BibExtensions), části schémat se právě z důvodu vývoje pro odlišné skupiny liší. (GODBY).

Schema.org v praxi

Jak již bylo uvedeno, OCLC poskytuje své záznamy založené na slovníku Schema.org prostřednictvím souborného katalogu WorldCat. Modifikací modelu Schema.org vznikl i publikační model Německé národní knihovny.

1.8 Aktivity jednotlivých knihoven

Problematice propojených dat se věnuje Švédská národní knihovna, která spravuje švédský souborný katalog LIBRIS. V tomto katalogu jsou dostupné záznamy 175 švédských knihoven. Přes 6 milionů bibliografických záznamů je samostatnou aktivitou švédských knihoven dostupných díky propojeným datům prostřednictvím webů běžných vyhledávačů již od roku 2008. (SÖDERBACK) Knihovníci Švédské národní knihovny se při mapování formátu MARC na RDF řídili velmi jednoduchou myšlenkou: „…je lepší přijít s něčím teď, než lpět na detailech a čekat na dokonalost“. (MALMSTEN)

Další skandinávskou zemí, která chce své katalogy otevřít světu, je Finsko. Finská národní knihovna v tuto chvíli započala s vývojem mapování svých záznamů. Její aktivita je podpořena rozhodnutím finské vlády z roku 2011, které nařizuje institucím zpřístupnit své veřejné informační zdroje. Za tímto účelem byl roku 2013 vyhlášen Program pro otevřená data (Open Data Programme). Finská národní knihovna je nyní na začátku projektu (2015–2017), jehož závěrem by měly být jak data ve formě open data, tak kompletní dokumentace pro knihovny. Přestože tamější knihovníci vidí budoucnost v BIBFRAME, rozhodli se pro vlastní strukturu. (HYVÖNEN)

Díky tlaku vlády na zpřístupnění dat začali vyvíjet aktivitu i britští knihovníci, kteří se začali publikačním modelem linked data zabývat v roce 2009. Pro svoji práci vybrali Britskou národní bibliografii, čítající přes 3 miliony záznamů, kterou takto zpřístupnili v červnu 2011. (DELIOT)

Zcela samostatně pak stojí aktivita amerických univerzitních knihoven s názvem Propojená data pro knihovny (Linked Data for Libraries, LD4L). Jedná se o společný projekt Knihovny Cornellské univerzity (Cornell University Library), Laboratoře pro inovace Harvardské knihovny (Harvard Library Innovation Lab) a Knihoven Stanfordské univerzity (Stanford University Libraries), který byl podpořen dvouletým grantem Mellonovy nadace ve výši jednoho milionu USD. Projekt se zaměřuje na vytvoření takového publikačního modelu pro zveřejňování strukturovaných dat, který bude plně reflektovat potřeby vysokoškolských knihoven, ač bude založena na BIBFRAME. (LD4L)

2 Budoucnost

Cílem tohoto článku je přinést souhrn informací o aktuálních trendech v oblasti výměnných formátů bibliografických dat a predikce možného vývoje. Z výše uvedeného je zřejmé, že se životní cyklus bibliografických dat proměňuje nebo již proměnil. Přestože knihovníci stále katalogizují převážně ve formátu MARC 21 a knihovny data v tomto formátu mezi sebou distribuují, přibyl na konci tohoto řetězce převod do struktury propojených dat. Díky této struktuře se cenné informace vytvářené knihovníky konečně dostávají z knihovních katalogů a databází (v angličtině je často používaný výraz silos) i na volný web, kde je koncoví uživatelé (čtenáři) jednoduše naleznou již při prvotním vyhledávání informací z vyhledávačů typu Google.

Pro odhad budoucího vývoje autorka příspěvku vybrala jednu z kvantitativních metod, a to dotazníkové šetření formou elektronického dotazování. Výhodou této metody bylo oslovení zahraničních odborníků bez ohledu na místo jejich pobytu.

Toto dotazníkové šetření formou kladení otevřených otázek je základem tzv. Delfské metody, díky které jsou zjišťovány názory skupiny expertů, a to nezávisle na sobě.7

Dotazníkový průzkum byl proveden na dvou výzkumných vzorcích. Každý z těchto vzorků je tvořen skupinou odborníků: prvním byl Stálý výbor Sekce katalogizace Mezinárodní federace knihovnických sdružení a institucí (IFLA Cataloguing Section Standing Committee), druhým byli členové e-mailové konference BIBFRAME. Dotazníkové šetření bylo provedeno během ledna a února 2016.

2.1 Dotazník

Pro dotazník byl využit volně dostupný webový nástroj Formuláře Google, odkaz na dotazník pak rozeslán elektronickou poštou. Při sestavování dotazníku jsem vycházela ze základní hypotézy: Formát MARC 21 je často v knihovnické komunitě považován za zastaralý a volá se po jeho nahrazení. Zároveň je aktuálním trendem publikování (již i knihovních, zde konkrétně bibliografických) dat na webu, a to využitím propojených dat. Z výše uvedeného textu článku je však zřejmé, že knihovny se vydaly různými cestami. Dotazník proto obsahoval tři otevřené otázky:

Za jak dlouho bude MARC 21 nahrazen jiným typem formátu bibliografických dat (ve vaší zemi)?8

Bude struktura propojených dat používána pro výměnu bibliografických dat?9

Bude existovat jedna (vedoucí) struktura propojených dat nebo budou existovat v různých knihovnách různé varianty?10

2.2 Výzkumný vzorek

Jak již bylo uvedeno, dotazník byl odeslán dvěma skupinám odborné veřejnosti. První skupina (vzorek A) byl tvořen patnácti členy Stálého výboru Sekce katalogizace IFLA, dále dopisujícími členy, předsedou, sekretářkou a informačním koordinátorem. Celkem bylo adresně osloveno osmnáct osob. Tito členové jsou odborníky z celého světa (v tuto chvíli jsou zastoupeni odborníci ze zemí, jako je Dánsko, Vatikán, Egypt, Argentina, Francie, ale i Česká republika atd.). Sekce katalogizace IFLA se zabývá katalogizací v nejširším slova smyslu, navrhuje a vyvíjí katalogizační pravidla, směrnice a standardy. Při sledování cíle úzce spolupracuje s Mezinárodní organizací pro normalizaci (International Organization for Standardization, ISO). Sekce katalogizace IFLA tak má přímý vliv na kodifikaci standardů, postoje a názory jejích členů jsou tudíž při predikování budoucnosti významné.

Druhou skupinou (vzorek B) byli zapsaní příjemci veřejné emailové konference BIBFRAME Listserv, kterou spravuje Kongresová knihovna ve Washingtonu. V konferenci je zapsáno 1744 členů.

2.3 Výsledky

Ze zkoumaného vzorku A odpovědělo 12 osob, ze zkoumaného vzorku B 30 osob.

Otázka č. 1 – Za jak dlouho bude MARC 21 nahrazen jiným typem formátu bibliografických dat (ve vaší zemi)?

Z výsledných odpovědí je zřejmé, že většina respondentů očekává změnu (35 osob, což odpovídá 90 %):

Tab. 1 Odpověď na otázku, zda bude formát MARC 21 nahrazen jiným typem formátu bibliografických dat

 

vzorek A

vzorek B

celkem

%

ano

8

27

35

90

ne

4

0

4

10

Vzorek A:

Ze vzorku A se 38 % respondentů domnívá, že k nahrazení formátu MARC 21 jiným typem formátu již dochází. Dalších 37 % respondentů se domnívá, že k jeho nahrazení dojde do 10 let.

Tab. 2 Odpověď respondentů vzorku A na otázku, za jakou dobu bude nahrazen formát MARC jiným typem formátu bibliografických dat

 

vzorek A

%

již se děje

3

38

do 5 let

2

25

do 10 let

1

12

později

0

0

jiná odpověď

2

25

celkem

8

100

Vzorek B:

Ze zkoumaného vzorku B se 15 % respondentů vyjádřilo, že k nahrazení formátu MARC 21 jiným typem formátu již dochází. Dalších 67 % respondentů se domnívá, že k nahrazení dojde do 10 let.

Tab. 3 Odpověď respondentů vzorku B na otázku, za jakou dobu bude nahrazen formát MARC jiným typem formátu bibliografických dat

 

vzorek B

%

již se děje

4

15

do 5 let

10

37

do 10 let

8

30

později

4

15

jiná odpověď

1

3

celkem

27

100

Jeden z respondentů odpověď doplnil o informaci, že v knihovně, ve které pracuje (Kongresová knihovna ve Washingtonu), je struktura linked data v testovacím režimu i pro primární vytváření záznamů (katalogizaci). Celkem 4 respondenti přechod podmiňují impulzem vedoucích knihoven (Kongresové knihovny ve Washingtonu nebo Britské knihovny (British Library)).

Otázka č. 2 – Bude struktura linked data používána pro výměnu bibliografických dat?

Na uvedenou otázku pouze 5 respondentů striktně odpovědělo záporně. Další dva respondenti (ze vzorku B) odpověděli, že ne, protože linked data jsou určena pro publikování informací a že v této podobě vyměňována nebudou. Ostatní (35) odpověděli kladně, dva z nich doplnili, že však bude vždy na výběr z různých formátů. Jeden respondent odpověděl, že neví. Z odpovědí vzorku A lze předpokládat aktivitu IFLA na podporu využití struktury linked data i pro výměnu bibliografických dat.

Tab. 4 Odpověď na otázku, zda bude struktura linked data používána pro výměnu bibliografických dat

 

vzorek A

vzorek B

%

ano

11

24

83

ne

0

5

12

neví

0

1

2,5

jiná odpověď

1

0

2,5

celkem

12

30

100

Otázka č. 3 – Bude existovat jedna (vedoucí) struktura linked data nebo budou existovat v různých knihovnách různé varianty?

U této otázky se odpovědi respondentů shodovaly. Pouze osm respondentů (19 %) jednoznačně odpovědělo, že bude existovat jediný model propojených dat (v tabulce odpověď ANO), ze zaslaných odpovědí pak lze shrnout, že to je převážně BIBFRAME. Jeden respondent nevěděl a jeden neodpověděl. Ostatní (34 respondentů, tedy 76 %) se shodovali v mínění, že bude existovat několik různých verzí. Většina respondentů odpověď doplnila svými názory, které jsou pro účely tohoto článku velmi zajímavé: většina respondentů se domnívá, že zvítězí BIBFRAME, ale bude existovat v různých lokálních verzích nebo bude modifikován pro různé účely. Z odpovědí vzorku A, tedy osob zodpovědných za kodifikaci standardů (pouze dva účastníci odpověděli, že lze očekávat jediný standard), je v současnosti však zřejmé, že minimálně ze strany asociace IFLA tlak na jednotnost očekávat nelze.

Tab. 5 Odpověď na otázku, zda bude existovat jedna (vedoucí) struktura linked data

 

vzorek A

vzorek B

%

ano

2

6

19

ne

9

23

76

neví

0

1

2,5

jiná odpověď

1

0

2,5

celkem

12

30

100

2.4 Závěr dotazníkového šetření

Ze získaných odpovědí dotazníkového šetření lze vyvodit odpověď na otázku, zda je MARC 21 skutečně nahrazován nebo bude nahrazen jiným formátem bibliografických dat. Většina (90 %) respondentů se shoduje, že formát již je nebo do 10 let bude nahrazen jiným formátem. Z toho 83 % respondentů se domnívá, že formát MARC 21 bude nahrazen strukturou propojených dat. Pouze dva respondenti upozornili, že struktura propojených dat není určena pro výměnu bibliografických informací, ale pro jejich publikování. Většina respondentů (76 %) se pak domnívá, že budou existovat různé varianty struktury.

Zajímavé je sledovat odpovědi zkoumaného vzorku A, tedy členů Stálého výboru Sekce katalogizace IFLA, kteří mají přímý vliv na vytváření standardů v oblasti katalogizace. Vzhledem k faktu, že většina jich se domnívá, že formát MARC 21 bude nahrazen strukturou propojených dat pro výměnu bibliografických dat, lze předpokládat aktivitu tímto směrem. Naopak se tito respondenti neshodují na jednotnosti ve struktuře, lze tedy předpokládat, že na jednotnou strukturu nebudou alespoň zatím vyvíjet tlak.

3 Závěr

Je nutné si opět uvědomit, pro jaké účely jsou výměnné formáty bibliografických dat v knihovnictví používány: pro zápis a přenos (výměnu) mezi bibliografickými agenturami a jinými institucemi. (KTD) V tuto chvíli je však zřejmé, že v budoucnu se tyto dvě funkce oddělí nebo se z nich alespoň odštěpí další funkce pro publikování bibliografických dat na webu. Přestože se v knihovnické obci dlouho debatuje o zastaralosti struktury formátu MARC, lze i přes výsledky dotazníkového šetření předpokládat, že tato struktura alespoň pro ukládání (katalogizaci) dat a jejich výměnu mezi knihovními systémy zůstane nadále zachována, a to i přes testování v Kongresové knihovně ve Washingtonu, kde strukturu linked data v testovacím režimu používají i pro katalogizaci. Často uváděným důvodem jsou existující knihovní systémy, které nejsou na změnu připraveny11, a nedostatek financí pro změnu. Většina knihoven, které sledují vývoj na tomto poli, ať už jako konzumenti nebo se vývojem přímo zabývají, předpokládá funkci linked data pouze pro prezentaci dat na webu (nikoliv tedy pro výměnu bibliografických záznamů mezi knihovnami) a pro otevření svých fondů uživatelům přímo z vyhledávacích rozhraní světových vyhledávačů. Za tímto účelem již využívají konverzních programů, které jsou volně dostupné, nebo volí komerční konverzi firmami, které se na vývoji podílely. Výsledky se již dostavují: Francouzská národní knihovna učinila v roce 2014 průzkum, v rámci něhož zjistila, že po zpřístupnění katalogu i pro vyhledávače bylo 80 procent dotazů realizováno primárně právě přes ně, nikoliv přes OPAC. Během průzkumu se navíc ukázalo, že většina těchto uživatelů vůbec neznala webovou stránku knihovního katalogu zmiňované knihovny. (ADAMICH, 2015b)

Vedoucími modely linked data jsou struktura bibliografického rámce BIBFRAME, který byl vyvinut pod záštitou Kongresové knihovny ve Washingtonu, a Schema.org, kterou implementovalo OCLC pro svůj katalog WorldCat. Zároveň vznikají rozšíření Schema.org pro oblast knihoven. Z důvodu kritiky, pomalosti a dalších důvodů již však další americké i evropské knihovny začaly na tomto poli experimentovat a postupně tak vznikají různé lokální verze. Lze však předpokládat spolupráci zainteresovaných institucí a z toho plynoucí kompatibilitu.

Reinhold Heuvelmann z Německé národní knihovny předpovídá zánik posledních knihovních systémů podporujících strukturu formátu MARC v roce 2060, kdy i poslední záznamy v tomto formátu zmizí. Ale ještě před tím vyjde v roce 2047 článek. A jeho název? BIBFRAME must die12. (HEUVELMANN)

Redakce nezasahovala do způsobu citování v tomto článku.

Použitá literatura:

ADAMICH, Tom. BIBFRAME Take 3: SchemaBibEx, OCLC WorldCat, and Search Optimization. Technicalities [online]. 2013, 33(5), 9–12 [cit. 2016-01-22]. ISSN 02720884. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=97868634&scope=site.

ADAMICH, Tom. Schema BibEx Extensions: Another 21st Century Paradigm Shift. Technicalities [online]. 2015, 35(4), 15–17 [cit. 2016-01-22]. ISSN 02720884. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=109262777&scope=site.

ADAMICH, Tom. 2015b. Linked Data Redoux. Technicalities [online]. 2015, 35(5), 13–16 [cit. 2016-01-22]. ISSN 02720884. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=110374901&scope=site.

ADAMICH, Tom. BIBFRAME Redux: Update on the BIBFRAME Project. Technicalities [online]. 2014, 34(4), 7–10 [cit. 2016-01-22]. ISSN 02720884. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=97480349&scope=site.

AYRE, Lori Bowen. MARC Isn‘t Dying Fast Enough. Collaborative Librarianship [online]. 2014, 6(4), 175–177 [cit. 2016-01-22]. ISSN 19437528. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=108744065&scope=site.

Bibliographic Framework Transition Initiative Forum. 2012. [online]. Washington: Library of Congress [cit. 2012-07-26]. Dostupné z: http://listserv.loc.gov/listarch/bibframe.html.

BIZER, Christian, Tom, HEALTH, Tim and BARNERS-LEE. Linked Data: the story so far [pdf]. 2009 [cit. 2014-03-18]. This is a preprint of a paper to appear in: Heath, T., Hepp, M., and Bizer, C. (eds.). Special Issue on Linked Data, International Journal on Semantic Web and Information Systems (IJSWIS). Dostupné z: http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf.

CALHOUN, Karen. The changing nature of the catalog and its integration with other discovery tools: prepared for the Library of Congress: final report [pdf]. Ithaca: Cornell University Library, Marc 17, 2006 [cit. 2015-06-08]. Dostupné z: WWW http://www.loc.gov/catdir/calhoun-report-final.pdf.

COYLE, Karen. The Way to Library Linked Data (ASIST Webinar: Library Linked Data, Part 1) [pdf]. Mar 8, 2011 [cit. 2014-03-17]. Dostupné z: http://www.kcoyle.net/presentations/asisti.pdf.

COYLE, Karen. Linked Data Tools: connecting on the web. Chicago: ALA TechSource, 2012. 46 s. Library technology reports: expert guides to library systems and services; v. 48, no. 4. ISSN 0024-2586.

COYLE, Karen. Library Linked Data: an evolution, for global interoperability and linked data in libraries [pdf]. Florence, June 18–19, 2012 [cit. 2014-03-17]. Dostupné http://www.kcoyle.net/presentations/FI2012_en.pdf

DELIOT, Corine. Publishing the British National Bibliography as Linked Open Data [pdf]. [cit. 2016-02-29]. Dostupné z: http://www.bl.uk/bibliographic/pdfs/publishing_bnb_as_lod.pdf.

Deutsche National Bibliothek. The Linked Data Service of the German National Library: modelling of bibliographic data [pdf]. Leipzig, Frankfurt am Main: German National Library, Last updated 12 January 2016 [cit. 2016-02-29]. Dostupné z: http://www.dnb.de/SharedDocs/Downloads/EN/DNB/service/linkedDataModellierungTiteldaten.pdf?__blob=publicationFile.

DROBÍKOVÁ, Barbora. Standardy pro knihovní katalogy v sémantickém webu. Knihovna [online]. 2013, 24(2), 72–83 [cit. 2016-02-29]. ISSN 1802–8772. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=93432914&scope=site.

FAY, Robin M. Semantic Web technologies and social searching for librarians. Chicago: ALA TechSource, 2012. xi, 115 s. The Tech set; 20. ISBN 1555707807.

GODBY, Carol Jean and Ray, DENENBERG. Common ground: exploring compatibilities between the Linked Data Models of the Library of Congress and OCLC [pdf]. January 2015 [cit. 2016-02-27]. ISBN 1-55653-490-6. Dostupné https://www.oclc.org/content/dam/research/publications/2015/oclcresearch-loc-linked-data-2015.pdf.

GONZALES, Brighid M. Linking Libraries to the Web: Linked Data and the Future of the Bibliographic Record. Information Technology [online]. 2014, 33(4), 10–22 [cit. 2016-01-22].

ISSN 07309295. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=a9h&an=100227706&scope=site.

HASTINGS, ROBIN. Linked Data in Libraries: Status and Future Direction. Computers in Libraries [online]. 2015, 35(9), 12–16 [cit. 2016-02-02]. ISSN 10417915. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=bth&an=111575087&scope=site.

HAWKINS, L. The semantic web and the BIBFRAME initiative. Serials Review [online]. 2015, 41(2), 106–107 [cit. 2016-01-22]. DOI: 10.1080/00987913.2015.1030962. ISSN 00987913.

HEALTH, Tom and Christian, BIZER. Linked Data: evolving the web into a global data space. Morgan and Claypool, 2011. Dostupné z: http://linkeddatabook.com/editions/1.0/.

HEUVELMANN, Reinhold. BIBFRAME on its way [online prezentace]. 28. Juni 2014 [cit. 2016-02-27]. Dostupné z: http://de.slideshare.net/sollbruchstelle/2014-0628-bibframeheuvelmann.

HYVÖNEN, Nina and Osma, SUOMINEN. The National Library opens up its data [online]. The National Library of Finland Bulletin, 2015 [cit. 2016-02-29]. Dostupné z: http://blogs.helsinki.fi/natlibfi-bulletin/?page_id=292.

KONSTANTINOU, Nikolaos and Dimitrios-Emmanuel, SPANOS. Materializing the web of linked data. Springer, 2015. 133 s. ISBN 3319160737. Komerčně dostupné též z SpringerLink Books Computer Science, DOI 10.1007/978-3-319-16074-0_1.

KOPTA, Martin. Budoucnost patří sémantickému webu [online]. Lupa, 10. 12. 2001. Dostupné z: http://www.lupa.cz/clanky/budoucnost-patri-semantickemu-webu/.

KROEGER, A. The Road to BIBFRAME: The Evolution of the Idea of Bibliographic Transition into a Post-MARC Future. Cataloging and Classification Quarterly [online]. 2013, 51(8), 873–890 [cit. 2016-02-29]. DOI: 10.1080/01639374.2013.823584. ISSN 01639374.

KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV), 2003 [online databáze]. Praha: Národní knihovna České republiky, 2003–. Dostupné z: http://sigma.nkp.cz/F/.

Library of Congress. 2012d. Bibliographic Framework as a Web of Data [pdf]. Washington: Library of Congress, November 21, 2012.

Dostupné z: www.loc.gov/bibframe/pdf/marcld-report-11-21-2012.pdf.

Library of Congress. Bibliographic Framework Initiative. BIBFRAME Frequently Asked Questions [online]. Washington, DC: The Library of Congress, [cit. 2014-03-16].

Dostupné z: http://www.loc.gov/bibframe/faqs/.

Library of Congress. Bibliographic Framework Transition Initiative [online]. Washington: Library of Congress, last updated May 24 2012 [cit. 2012-07-26]. Dostupné z: http://www.loc.gov/marc/transition.

Library of Congress. BIBFRAME tools & dowloads [online]. Cit. 2016-02-27. Dostupné z: http://www.loc.gov/bibframe/tools/.

Library of Congress. 2008b. Response to On the record [pdf]. Library of Congress, June 1, 2008 [cit. 2015-06-06]. Dostupné http://www.loc.gov/bibliographic-future/news/LCWGResponse-Marcum-Final-061008.pdf.

Library of Congress. Working Group on the Future of Bibliographic Control [online]. Washington: Library of Congress, [cit. 2012-03-02]. Dostupné z: http://www.loc.gov/bibliographic-future/.

Library of Congress. 2006b. Working Group on the Future of Bibliographic Control. On the Record [pdf]. Washington: Library of Congress, January 9, 2008 [cit. 2014-03-08]. Dostupné http://files.eric.ed.gov/fulltext/ED499668.pdf.

Library of Congress. Working Group on the Future of Bibliographic Control. Inaugural Meeting of the Working Group [pdf]. Washington: Library of Congress, November 2–3, 2006 [cit. 2012-03-02]. Dostupné z: http://www.loc.gov/bibliographic-future/meetings/docs/LCWGMinutes110306final.pdf.

Library of Congress. A Bibliographic Framework for the digital age [online]. Washington: Library of Congress, October 31, 2011 [cit. 2014-03-08].

Dostupné z: http://www.loc.gov/bibframe/news/framework-103111.html.

LD4L. Linked Data for Libraries [online]. [cit. 2016-02-2016]. Dostupné z: https://www.ld4l.org/.

MALMSTEN, Martin. Exposing Library Data as Linked Data [pdf]. [cit. 2016-02-29]. Dostupné z: http://wtlab.um.ac.ir/images/e-library/linked_data/other/Exposing%20Library%20Data%20as%20Linked%20Data.pdf.

MCCALLUM, Sally H. MARC/XML Sampler. International Cataloging [online]. 2006, 35(1), 4–6 [cit. 2016-01-28]. ISSN 10118829. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=502969226&scope=site.

MITCHELL, Erick T. Library Linked Data: Early Activity and Development. Library Technology Re ports [online]. 2016, 52(1), 5–35 [cit. 2016-02-02]. ISSN 00242586. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=a9h&an=111864256&scope=site.

MOEHRLE, Dolly. MARC of the Future. PNLA Quarterly [online]. 2012, 76(4), 81–86 [cit. 2016-01-28]. ISSN 00308188. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=108922506&scope=site.

MYNARZ, Jindřich a Jan ZEMÁNEK. Úvod k linked data. Knihovna plus [online]. 2010, 6(1), 1–11 [cit. 2016-02-29]. ISSN 18015948. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=57658628&scope=site.

OCLC. Data strategy and linked data [online]. OCLC, 2016 [cit. 2016-02-11]. Dostupné https://www.oclc.org/data.en.html.

OCLC Research. International Linked Data Survey 2015 [online]. OCLC, June 1, 2015 [cit. 2016-02-11]. Dostupné z: http://hangingtogether.org/?p=5206.

OCLC. Linked data at OCLC [online]. OCLC, 2016 [cit. 2016-02-27]. Dostupné https://www.oclc.org/en-US/data.html.

Open Knowledge Foundation. Future of bibliographic control [html]. Last modified 13 September 2011, at 06:15 [cit. 2015-06-05]. Response to Working group on the future of bibliographic control (Library of Congress). Dostupné z: http://wiki.okfn.org/Future_Of_Bibliographic_Control.

ROLLITT, Karen. MARC21 to Bibframe: outcomes, possibilities and new directions. New Zealand Library [online]. 2014, 55(1), 16–19 [cit. 2016-01-22]. ISSN 11773316. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=lls&an=100147725&scope=site.

Schema.org. Welcome to Schema.org [online]. [cit. 2016-02-27]. Dostupné z: http://schema.org/.

SÖDERBACK, Anders. LIBRIS – Open Library Linked Data [pdf]. [cit. 2016-02-29]. Dostupné z: http://www.kb.se/dokument/Libris/presentationer/LIBRIS_SWIB09_%20091124.pdf.

TENNANT, Roy. 21st-century cataloguing [online]. Library Journal Archive Content. 04/15/1998 [cit. 2014-03-19]. Dostupné z: http://roytennant.com/column/?fetch=data/96.xml.

TENNANT, Roy. 2002. MARC must die. (Digital Libraries). Library Journal [online]. 2002, 127(17), 26–27 [cit. 2016-02-29]. ISSN 03630277. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=edsglr&an=edsgcl.93349109&scope=site.

TENNANT, Roy. 2002b. MARC exit strategies. (Digital Libraries). Library Journal [online]. é 127(19), 27–28 [cit. 2016-02-29]. ISSN 03630277. Dostupné http://search.ebscohost.com/login.aspx?direct=true&db=edsglr&an=edsgcl.94774460&scope=site.

THARANI, Karim. Linked Data in Libraries: A Case Study of Harvesting and Sharing Bibliographic Metadata with BIBFRAME. Information Technology [online]. 2015, 34(1), 5–19 [cit. 2016-01-22]. ISSN 07309295. Dostupné z: http://search.ebscohost.com/login.aspx?direct=true&db=a9h&an=101948409&scope=site.

World Wide Web Consorcium. XML technology [online]. W3C, 2010 [cit. 2012-08-14]. Dostupné z: http://www.w3.org/standards/xml/.

World Wide Web Consorcium. Library linked data inkubator group final report [online]. W3C, 25 October 2011 [cit. 2015-06-06]. Dostupné z: http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/.

World Wide Web Consorcium. Semantic Web [online]. W3C, 2013 [cit. 2014-03-17]. Dostupné z: http://www.w3.org/standards/semanticweb/.

World Wide Web Consorcium. RDF Primer [online]. 10 February 2004 [cit. 2014-03-18]. Dostupné z: http://www.w3.org/TR/rdf-syntax/.

YEE, Martha M. Cataloging rules and RDF model [web]. Last modified: July 20, 2010 [cit. 2015-06-09]. Dostupné z: http://myee.bol.ucla.edu/catrul&rdfIntro.htm.

1 Překlad autorky

2 MARC – Machine Readable Cataloguing, Strojem čitelná katalogizace, formát ve své první verzi vytvořený v letech 1966–1967 v Kongresové knihovně ve Washingtonu za účelem možnosti vytvářet bibliografická data ve strojem čitelné podobě, distribuovat je na magnetických páskách po amerických knihovnám, které si následně měly samy tisknout lístkové záznamy. Označení formátu MARC 21 vzniklo ze spojení MARC pro 21. století.

3 Překlad autorky

4 Technologický základ pro výměnu dat v prostředí webu, který je aplikací XML.

5 Internetový protokol určený pro výměnu hypertextových dokumentů v prostředí webu.

6 XML – Extensible Markup Language, Rozšiřitelný značkovací jazyk, typ jazyka, který je vhodný pro výměnu dat mezi aplikacemi a pro publikování dokumentů. MARC/XML je aplikací schématu XML, kterou vytvořila Kongresová knihovna ve Washingtonu pro účely výměny bibliografických dat mezi systémy nebo jejich publikaci. Konverze mezi formátem MARC 21 a MARC/XML je bezztrátová a lze pro ni použít volně dostupný nástroj MARC Tool Kit dostupný na webu Kongresové knihovny (http://www.loc.gov/standards/marcxml/).

7 Pro tento článek byly použity odpovědi prvního kola kladení otázek. Pro účely disertace budou zde zjištěné výsledky předneseny respondentům zkoumaného vzorku A (vzorek B byl anonymní), aby tyto výsledky upřesnili či korigovali. Získané odpovědi by měly být postupně ve shodě. Tato shoda pak bude považována za predikci budoucího vývoje.

8 V angličtině: How soon will be MARC 21 replaced with a different type of a bibliographic data format (in your country)?

9 V angličtině: Will be linked data format used for exchange of bibliographic data?

10 V angličtině: Will there be a leding linked data format or will there exist many versions developed by libraries?

11 Analýza připravenosti knihovních systémů je součástí připravované disertační práce. Z provedeného výzkumu je již nyní autorce zřejmé, že knihovní systémy v tuto chvíli na změnu skutečně nejsou připraveny.

12 Název odkazuje na slavný článek R. Tennanta MARC must die.

 

RÖSSLEROVÁ, Klára. Výměnné formáty bibliografických dat: jejich proměna v současnosti. Knihovna: knihovnická revue. 2016, 27(1), 43–60. ISSN 1801-3252.

19.12.2016




Vyhledávání

Časopis Knihovna: knihovnická revue je zařazen do prestižní databáze vědeckých časopisů The European Reference Index for the Humanities and the Social Sciences (ERIH PLUS)


Časopisy Knihovna: knihovnická revue a Knihovna plus jsou mediálním partnerem konference LIB CON 2017
Místo: Hostivice
Datum: 3.11.2017


Časopisy Knihovna: knihovnická revue a Knihovna plus jsou mediálním partnerem konference: Archivy, knihovny a muzea v digitálním světě 2017
Kde: v Praze
Kdy: 29 - 30.11.2017

 


Časopisy Knihovna: knihovnická revue a Knihovna plus jsou mediálním partnerem konference: Konference o šedé literatuře a repozitářích
Kde: Národní technická knihovna v Praze
Kdy: 19. října 2017


Redakce časopisů Knihovna: knihovnická revue a Knihovna plus se zúčastní Konference: Periodiká v minulosti a súčasnosti
Kde: Bratislava
Kdy: 12. - 13. září 2017