Od vyhledávání informací k objevování nových znalostí aneb pohled na tzv. Literature-Based Discovery
KATUŠČÁKOVÁ, Marcela. Od vyhľadávania informácií k objavovaniu nových znalostí: Swansonova metóda prepájania pojmov. První vydání. Bratislava: Univerzita Komenského, Fakulta sociálnych a ekonomických vied, 2020. 150 s. ISBN 978-80-223-5072-3.
Recenzované dílo, které má podobu odborné monografie, je zajímavou autorskou a současně nakladatelskou záležitostí nejen ve slovenském, ale i v českém prostředí informační vědy, částečně také v inspirativním rozhraní s dalšími obory, neboť metody, teorie i aplikované výzkumné úlohy a následná vyhodnocení jsou zde pojaty mezioborově, např. oblast analýz a vytěžování textu, pohledy informační vědy, počítačové vědy, jakož i aplikačně v oblasti biomedicínských oborů, které je vděčným prostředím pro experimenty z hlediska práce s daty a metadaty.
Kladně hodnotím zaujetí autorky a díla pro problematiku literature-based discovery, s níž v 80. letech minulého století poprvé ve světě přichází bývalý několikanásobný děkan Graduate Library School na University of Chicago Don R. Swanson, jehož zaujaly poznatky roztroušené v množství vědeckých časopisů a čekající na smysluplné využití a propojení. Marcela Katuščáková tuto problematiku a tohoto autora inspirativně přenáší do slovenského a českého prostředí prostřednictvím metody LBD (literature-based discovery), metody objevování implicitních vztahů v rámci fragmentů zaznamenaného poznání.
Prostředí dat, informací a znalostí, ať již strukturovaných či nestrukturovaných, také v dokumentové a mediální podobě značně hybridních, je velmi rozmanité, a to obsahově, vztahově a organizačně a v neposlední řadě i terminologicky. I když základní směr výkladu je veden z pohledu informační vědy, ve kterém se autorka odborně a publikačně pohybuje řadu let, jsou zde zřetelně viditelné mezioborové vztahy tematiky monografie. Kvantitativní nárůst informací, někdy označovaný populárně, ale celkem vhodně, jako informační exploze, je charakteristický zejména pro 20. a 21. století a přináší celou řadu výzev, mj. také pro informační vědu a související hraniční obory. Informační věda jistým inspirativním analytickým způsobem může stát za novými metodami vytěžování dokumentů a textů (případně a pochopitelně nejen textů), to vše systémově a kreativně vnáší do nových poznatkových souvislostí.
Řídit, usměrňovat a využívat toky informací pro nejrůznější účely není v současnosti jednoduché, nicméně stále více rozvíjené technologické nástroje mají a budou mít tušené, ale také ne vždy úplně tušené možnosti řešení tzv. informační krize. Metody na principech již známých zkušeností dolování dat (data mining, resp. také text mining), aplikované teorie znalostních systémů a ontologií, jakož i zpracování přirozeného jazyka, jsou výzkumnou a aplikační realitou již delší dobu. S pomocí a podporou moderních vytěžovacích a mj. i nadstavbových vizualizačních nástrojů je možné vysledovat nejen řadu vztahů, ale také nastolit dobré předpoklady k objevování na základě dat, resp. také textů včetně vědeckých sdělení. Je to zároveň nezanedbatelně spojeno s vývojem patřičných technologií, nových technologických nástrojů, kdy se např. mohou lépe naplňovat myšlenky související s tématy již zmíněného zpracování přirozeného jazyka, které dříve mohly být jen teoreticky načrtnuty a předpokládány, ale ne vždy uskutečněny. Jsou to současné i budoucí výzvy pro automatizaci systémů LBD, které autorka ve své práci rozebírá.
Moje malé úvahové odbočení (neprobírané tedy v díle autorky): Jestliže se může v biomedicínských vědách, a v klinické medicíně zejména, uplatnit teprve pár desítek let starý koncept nazvaný evidence-based medicine (medicína založená na důkazech), který spočívá právě na strojovém a intelektuálním posuzování velkého množství dat
v klinických oborech, resp. informací a znalostí určených pro účely klinického rozhodování, pak v oblasti vědy v širším kontextu (a také v tzv. otevřené vědě) je možné díky obrovským rezervoárům informací uplatnit metody literature-based discovery. V tom coby recenzent díla vidím užitečnost autorčina otevírání problematiky nejen na Slovensku, ale také pro zájemce v České republice. Osobně vidím paralely i s některými strojovými (počítačovými) metodami návrhů nových léčiv apod.; nechci se již příliš nořit do těchto asociací. Naopak, chci se držet díla autorky. Zmiňuji to však proto, že při pročítání a hodnocení její práce mne napadala celá řada asociovaných myšlenek a věcí k diskuzi.
Inspirace autorka čerpá zejména od již výše zmíněného Dona R. Swansona, bývalého děkana Graduate Library School na University of Chicago, který upozornil na důležitý jev: že poznatky mohou být veřejně známé (publikované), ale také neznámé a neobjevené. Od této chvíle autorka rozehrává výborným odborným a čtivým stylem problematiku literature-based discovery, kterou lze přirovnat k postupnému skládání informací a znalostí (princip „puzzle“). Otevírá zároveň možnosti, které nabízí automatizované nástroje. Biomedicínské a částečně farmaceutické nebo chemické či genetické vědecké prostředí (příklady v publikaci tomu odpovídají) se vhodně nabízí pro autorčino téma, neboť jsou to prostředí, kde se vyskytuje díky informačním politikám různých zemí (za všechny zmíněny např. USA, viz databáze Medline / PubMed, řízené slovníky typu MeSH) mnoho tzv. otevřených dat a otevřených nástrojů získávání dat a informací, které také můžeme zařadit do kategorií velkých dat, „velkodat“ (big data). Odbočím-li mírně znovu, líbí se mi i mezioborové souvislosti, propojování poznání exaktních a např. i humanitních věd, dokážu si představit aplikace v oblasti zvané digital humanities.
První kapitola monografie se zabývá kontexty a filozofickými východisky LBD, druhá pak teoretickými základy LBD, třetí úlohou Dona Swansona a zrodem tematiky LBD, ve čtvrté najdeme aplikaci tématu LBD v biomedicíně, v páté modely a systémy LBD, v šesté pak praktické využití metody LBD pomocí vybraných nástrojů a v sedmé budoucí výzvy výzkumu LBD.
Témata, aplikace, příklady, systémy, metody apod., které autorka zařadila do publikace, naprosto respektuji, jsou jejím pohledem opírajícím se o velké množství studované literatury a zkušenosti v oblasti informační vědy. Osobně jako člověk pracující profesně s rešeršními nástroji (nástroji informačného prieskumu) mnoha desítek databází a digitálních knihoven v oblasti nejen biomedicíny a rovněž s některými nástroji „přidané hodnoty“, velmi oceňuji publikační otevření předkládané tematiky na Slovensku, které nás inspiruje i v České republice.
Dílo, které jsem se rád rozhodl recenzovat i pro potenciální české čtenáře, je psáno nejen odborně, ale také čtivě. Autorčina monografie má v sobě silnou edukační dimenzi, je zároveň přehledová a má ukázat zejména na jádro témat související s danou problematikou Je inspirativní záležitostí pro zainteresované odborníky, mohla by být určena
i pokročilejším studentům informačních studií a knihovnictví, také potenciálně a výběrově možná i širší odborné veřejnosti se zájmem o informační svět a problematiku získávání a analyzování znalostí z textu, byť nejde o jednoduché základní čtivo, ale náročný text, také občas s jistým matematickým aparátem.
Jsem rád, že recenzovaná publikace přinesla téma, které by mohlo podnítit odborný čtenářský zájem lidí v informační vědě a knihovnictví v České republice, mj. i s ohledem na blízký jazyk, kterým je napsána.
Doc. PhDr. Richard Papík, Ph.D.
PAPÍK, Richard. Od vyhledávání informací k objevování nových znalostí aneb pohled na tzv. Literature-Based Discovery. Knihovna: knihovnická revue. 2021, 32(2), 93–95.
ISSN 1801-3252.