Archiv českého webu v roce 3
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F02%3A00006725" target="_blank" >RIV/00216224:14330/02:00006725 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Archiv českého webu v roce 3
Popis výsledku v původním jazyce
Projekt Webarchiv vznikl v roce 2000 jako projekt výzkumu a vývoje řešený Národní knihovnou. Jeho hlavním cílem bylo prozkoumání problematiky spojené s "registrací, ochranou a zpřístupnění domácích elektronických zdrojů v síti Internet". Do konce roku 2001 zprovoznil řešitelský tým zkušební infrastrukturu pro získávání elektronických zdrojů a pro podporu tvorby metadat. Použité softwarové nástroje (především Dublin Core Metadata Generator a NEDLIB Harvester) byly původně vyvinuty v rámci projektu NEDLIBa po vyzkoušení byly upraveny upraveny podle potřeb projektu Webarchiv. Ačkoli právní problematika týkající se sběru a archivace elektronických zdrojů Národní knihovnou není zatím vyjasněna, byla v letošním dubnu započata úplná sklizeň domény .cz. Kritéria omezující tuto sklizeň byla nastavena tak volně, aby byl pokryt co největší úsek českého webu. Po třech měsících tak Harvester stáhl a zaarchivoval přes 10 milionů (0,25 TB) dokumentů z přibližně 30.000 domén druhé úrovně. V blízké bu
Název v anglickém jazyce
Archive Of The Czech Web In Year 3
Popis výsledku anglicky
The Webarchiv project started in 2000 as a R&D project of the National Library. Its main target was to investigate problems connected with collection and long-term preservation of electronic information resources. By the end of 2001 the project team wasable to establish a testbed for harvesting electronic resources from the web as well as infrastructure supporting metadata creation, based on software tools developed with the support of NEDLIB project. These tools (Dublin Core Metadata Generator and NEDLIB Harvester) proved their quality in this phase and were further developed to suit the project needs. Although the legal situation concerning web harvesting and archiving by the National Library is not yet clear in the Czech Republic the project team was able to initiate first harvest of the .cz domain in April. The harvesting criteria were set very loose to allow for broadest coverage of the Czech web space. After three months, the Harvester collected about 10 million (0.25 TB) docume
Klasifikace
Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2002
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Národní knihovna - knihovnická revue
ISSN
1214-0678
e-ISSN
—
Svazek periodika
13
Číslo periodika v rámci svazku
3
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
9
Strana od-do
168
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—