W2C - Web To Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F11%3A10109519" target="_blank" >RIV/00216208:11320/11:10109519 - isvavai.cz</a>
Výsledek na webu
<a href="http://ufal.mff.cuni.cz/~majlis/w2c/" target="_blank" >http://ufal.mff.cuni.cz/~majlis/w2c/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
W2C - Web To Corpus
Popis výsledku v původním jazyce
W2C is a collection of software and data. The software part radically facilitates creating a new text corpora for a given language, using text materials freely available on the Internet. A special attention was given to components for filtering that allow to keep the material quality very high. The data part contains corpora for more than 100 languages, with around 10 million words in each. This language data resource can be used especially by researchers specialized at developing multilingual technologies.
Název v anglickém jazyce
W2C - Web To Corpus
Popis výsledku anglicky
W2C is a collection of software and data. The software part radically facilitates creating a new text corpora for a given language, using text materials freely available on the Internet. A special attention was given to components for filtering that allow to keep the material quality very high. The data part contains corpora for more than 100 languages, with around 10 million words in each. This language data resource can be used especially by researchers specialized at developing multilingual technologies.
Klasifikace
Druh
R - Software
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/1ET201120505" target="_blank" >1ET201120505: Od jazyka ke znalostem a sémantickému webu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
UFAL-SW-W2C-1.0
Technické parametry
http://ufal.mff.cuni.cz/~majlis/w2c/
Ekonomické parametry
1 060 000 CZK
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova v Praze