Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F08%3A10079301" target="_blank" >RIV/00216208:11320/08:10079301 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Victor
Popis výsledku v původním jazyce
Victor is a tool for cleaning web pages. It employs a sequence-labeling approach based on Conditional Random Fields (CRF). Every block of text in the analyzed web page is assigned a set of features extracted from the textual content and HTML structure ofthe page. Text blocks are automatically labeled either as content segments containing main web page content, which should be preserved, or as noisy segments not suitable for further linguistic processing, which should be eliminated.
Název v anglickém jazyce
Victor
Popis výsledku anglicky
Victor is a tool for cleaning web pages. It employs a sequence-labeling approach based on Conditional Random Fields (CRF). Every block of text in the analyzed web page is assigned a set of features extracted from the textual content and HTML structure ofthe page. Text blocks are automatically labeled either as content segments containing main web page content, which should be preserved, or as noisy segments not suitable for further linguistic processing, which should be eliminated.
Klasifikace
Druh
R - Software
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GD201%2F05%2FH014" target="_blank" >GD201/05/H014: Collegium Informaticum</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Victor
Technické parametry
http://ufal.mff.cuni.cz/victor/
Ekonomické parametry
100000
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova v Praze