WAmetadataHarvest. Software pro automatizovaný metadatový popis sklizní projektu WebArchiv Národní knihovny České republiky.
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00023221%3A_____%2F12%3A%230000281" target="_blank" >RIV/00023221:_____/12:#0000281 - isvavai.cz</a>
Výsledek na webu
<a href="https://github.com/WebArchivCZ/WAmetadataHarvest" target="_blank" >https://github.com/WebArchivCZ/WAmetadataHarvest</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
WAmetadataHarvest. Software pro automatizovaný metadatový popis sklizní projektu WebArchiv Národní knihovny České republiky.
Popis výsledku v původním jazyce
Software pro extrakci informací z dat, které generuje WebArchiv při sklízení českého webu. Extrahuje se ze tří zdrojů: WA Admin, logy a reporty (txt soubory) a WARC/ARC soubory (specializovaný formát). Tyto informace se pak uloží do strukturovaného metadatového standardizovaného formátu (XML), který bude sloužit jako metadatový popis pro dlouhodobé uložení v LTP systému budovaném v projektu NDK Národní knihovny ČR.
Název v anglickém jazyce
WAmetadataHarvest. Metadata extractor from data of czech web-archive project WebArchiv of National Library of the Czech Republic.
Popis výsledku anglicky
Software for extraction of information form the data, generated during the harvest of the Czech web. It focuses on harvesting metadata from Heritrix logs/archives and WA-admin tool. XML metadata file will be used for long term preservation of web-archivedata.
Klasifikace
Druh
R - Software
CEP obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
WAmetadataHarvest 1.0
Technické parametry
Software v programovacím jazyce PHP, výstupem je soubor XML. Pro výstupní XML formát jsou použity tyto metadatové standardy: 1. Dublin Core ? popisná metadata 2. ContainerMD ? technická metadata 3. METS, RDF ? strukturální metadata. Národní knihovna ČR je vlastníkem výhradní licence k dílu. Kontaktní osoba: Zuzana Kvašová, zuzana.kvasova@nkp.cz.
Ekonomické parametry
Software zajišťuje efektivněji shromažďování informací nezbytných pro dlouhodobé uchování dat sklízených z webu. Toto se promítne do jejich větší čitelnosti v delším časovém úseku, zvýší se procento jejich úspěšných migrací.
IČO vlastníka výsledku
00023221
Název vlastníka
Národní knihovna České republiky