Internet jako pramen výzkumu: přístup k archivovaným webovým zdrojům a možnosti jejich zpracování
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00023221%3A_____%2F22%3AN0000053" target="_blank" >RIV/00023221:_____/22:N0000053 - isvavai.cz</a>
Výsledek na webu
<a href="https://teorievedy.flu.cas.cz/index.php/tv/article/view/552/576" target="_blank" >https://teorievedy.flu.cas.cz/index.php/tv/article/view/552/576</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.46938/tv.2022.552" target="_blank" >10.46938/tv.2022.552</a>
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Internet jako pramen výzkumu: přístup k archivovaným webovým zdrojům a možnosti jejich zpracování
Popis výsledku v původním jazyce
Internet se stal přirozenou komunikační platformou soudobé společnosti. Webové archivy, které začaly vznikat v 90. letech 20. století s cílem zachytit a uchovat proměnlivý webový obsah, se tak staly klíčovými prameny pro výzkum nedávné minulosti. Analyzování jejich dat komplikují například nedostatečné kompetence badatelů, nutnost vybavení výkonnými výpočetními zdroji nebo legislativa. Jednou z cest, jak vyjít vstříc potřebám uživatelů, je vývoj nástrojů a výzkumných rozhraní, které umožňují práci s daty bez nutnosti technologických znalostí pokročilé extrakce a otevírají je tak k využití badatelům. Studie řeší problematiku zpřístupnění archivních webových dat, přibližuje snahy o formulování teoretického a metodologického rámce a navrhuje design pro přístup a pro další zpracování dat, který je aplikován v unikátním výzkumném rozhraní pro vytěžování velkých dat z webových archivů s využitím pokročilých postupů strojového zpracování pro generování a kategorizaci textových výstupů.
Název v anglickém jazyce
Internet as a Source of Research: Access to Archived Web Resources and Possibilities of Their Processing
Popis výsledku anglicky
The Internet has become a natural communication platform for modern society. Web archives, which began in the 1990s to capture and preserve changing web content, have thus become key sources for research in the recent past. The analysis of their data is complicated by, for example, insufficient competencies of researchers, the need for computing resources or legislation. One way to meet the needs of users is to develop tools and research interfaces that allow to work with data without the need for technological knowledge of advanced extraction and thus open it to researchers. The study addresses the issue of access to archival web data, approaches efforts to formulate a theoretical and methodological framework and proposes a design for access and further data processing, which is applied in a unique research interface for extracting large data from web archives using advanced machine learning to generate and categorization of text outputs.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
50804 - Library science
Návaznosti výsledku
Projekt
<a href="/cs/project/DG18P02OVV016" target="_blank" >DG18P02OVV016: Vývoj centralizovaného rozhraní pro vytěžování velkých dat z webových archivů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Teorie vědy / Theory of Science
ISSN
1210-0250
e-ISSN
1804-6347
Svazek periodika
44
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
28
Strana od-do
59-87
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—