System for semi-automatic linking of bibliographic data to relevant national LOD (Linked Open Data)
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F18%3APR32108" target="_blank" >RIV/00216305:26230/18:PR32108 - isvavai.cz</a>
Result on the web
<a href="https://github.com/KNOT-FIT-BUT/CPKLinkedOpenDataLinker" target="_blank" >https://github.com/KNOT-FIT-BUT/CPKLinkedOpenDataLinker</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Softwarové nástroje pro poloautomatické provazování katalogizačních záznamů s databází národních autorit a relevantními národními zdroji LOD (Linked Open Data)
Original language description
Systém slouží k navrhování doplňkových informací, které obohatí katalogizační záznamy pomocí propojení databází národních autorit a jejich provázání se zdroji typu česká DBpedie. Mezi hlavní zdroje použité k obohacování katalogizačních zdrojů patří databáze národních autorit a česká Wikipedie, resp. DBpedie. Data z databáze národních autorit se získávají z webu Národní knihovny. Data z Wikipedie jsou získávány z offline XML dumpu. Byla vytvořena sada skriptů, které umožňují pro zvolené typy vyextrahovat základní informace, což pro osoby mohou být např. jméno a příjmení, alternativní jména, datum a místo narození a úmrtí, povolání atd. Pro slučování záznamů z národních autorit, české Wikipedie a dalších zdrojů byl vytvořen nástroj v jazyce Python, který dokáže sloučit záznamy dvou datových sad. Základem komponenty pro navrhování doplňkových informací k obohacování katalogizačních záznamů je znalostní báze, která vznikla sloučením dílčích znalostních bází získaných z výše uvedených zdrojů. Mezi základní podporované typy, které jsou obsaženy ve znalostní bázi, patří osoba, geografická entita, událost a organizace.
Czech name
Softwarové nástroje pro poloautomatické provazování katalogizačních záznamů s databází národních autorit a relevantními národními zdroji LOD (Linked Open Data)
Czech description
Systém slouží k navrhování doplňkových informací, které obohatí katalogizační záznamy pomocí propojení databází národních autorit a jejich provázání se zdroji typu česká DBpedie. Mezi hlavní zdroje použité k obohacování katalogizačních zdrojů patří databáze národních autorit a česká Wikipedie, resp. DBpedie. Data z databáze národních autorit se získávají z webu Národní knihovny. Data z Wikipedie jsou získávány z offline XML dumpu. Byla vytvořena sada skriptů, které umožňují pro zvolené typy vyextrahovat základní informace, což pro osoby mohou být např. jméno a příjmení, alternativní jména, datum a místo narození a úmrtí, povolání atd. Pro slučování záznamů z národních autorit, české Wikipedie a dalších zdrojů byl vytvořen nástroj v jazyce Python, který dokáže sloučit záznamy dvou datových sad. Základem komponenty pro navrhování doplňkových informací k obohacování katalogizačních záznamů je znalostní báze, která vznikla sloučením dílčích znalostních bází získaných z výše uvedených zdrojů. Mezi základní podporované typy, které jsou obsaženy ve znalostní bázi, patří osoba, geografická entita, událost a organizace.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Result continuities
Project
<a href="/en/project/DG16P02R006" target="_blank" >DG16P02R006: CPK - Using Semantic Technologies to Access Cultural Heritage Through The Central Portal of Czech Libraries</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2018
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
CPKLinkedOpenDataLinker
Technical parameters
Pro informace o licenčních podmínkách prosím kontaktujte: Mgr. Michaela Burianová, Výzkumné centrum informačních technologií, Fakulta informačních technologií VUT v Brně, Božetěchova 2, 612 66 Brno, 541 141 470.
Economical parameters
Svobodný software
Owner IČO
—
Owner name
Fakulta informačních technologií