Archiv českého webu v roce 3

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F02%3A00006725" target="_blank" >RIV/00216224:14330/02:00006725 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Archiv českého webu v roce 3
Popis výsledku v původním jazyce
Projekt Webarchiv vznikl v roce 2000 jako projekt výzkumu a vývoje řešený Národní knihovnou. Jeho hlavním cílem bylo prozkoumání problematiky spojené s "registrací, ochranou a zpřístupnění domácích elektronických zdrojů v síti Internet". Do konce roku 2001 zprovoznil řešitelský tým zkušební infrastrukturu pro získávání elektronických zdrojů a pro podporu tvorby metadat. Použité softwarové nástroje (především Dublin Core Metadata Generator a NEDLIB Harvester) byly původně vyvinuty v rámci projektu NEDLIBa po vyzkoušení byly upraveny upraveny podle potřeb projektu Webarchiv. Ačkoli právní problematika týkající se sběru a archivace elektronických zdrojů Národní knihovnou není zatím vyjasněna, byla v letošním dubnu započata úplná sklizeň domény .cz. Kritéria omezující tuto sklizeň byla nastavena tak volně, aby byl pokryt co největší úsek českého webu. Po třech měsících tak Harvester stáhl a zaarchivoval přes 10 milionů (0,25 TB) dokumentů z přibližně 30.000 domén druhé úrovně. V blízké bu
Název v anglickém jazyce
Archive Of The Czech Web In Year 3
Popis výsledku anglicky
The Webarchiv project started in 2000 as a R&D project of the National Library. Its main target was to investigate problems connected with collection and long-term preservation of electronic information resources. By the end of 2001 the project team wasable to establish a testbed for harvesting electronic resources from the web as well as infrastructure supporting metadata creation, based on software tools developed with the support of NEDLIB project. These tools (Dublin Core Metadata Generator and NEDLIB Harvester) proved their quality in this phase and were further developed to suit the project needs. Although the legal situation concerning web harvesting and archiving by the National Library is not yet clear in the Czech Republic the project team was able to initiate first harvest of the .cz domain in April. The harvesting criteria were set very loose to allow for broadest coverage of the Czech web space. After three months, the Harvester collected about 10 million (0.25 TB) docume

Klasifikace

Druh
J<sub>x</sub> - Nezařazeno - Článek v odborném periodiku (Jimp, Jsc a Jost)
CEP obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD obor
—

Návaznosti výsledku

Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)

Ostatní

Rok uplatnění
2002
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název periodika
Národní knihovna - knihovnická revue
ISSN
1214-0678
e-ISSN
—
Svazek periodika
13
Číslo periodika v rámci svazku
3
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
9
Strana od-do
168
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—

Podobné výsledky(10)

Archiving the Czech Web: Issues and Challenges Infrastruktura Webarchivu v roce 2002 Analýza archivu českého webu

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Archiv českého webu v roce 3

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)