CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F17%3A10372328" target="_blank" >RIV/00216208:11320/17:10372328 - isvavai.cz</a>
Výsledek na webu
<a href="http://hdl.handle.net/11234/1-1989" target="_blank" >http://hdl.handle.net/11234/1-1989</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings
Popis výsledku v původním jazyce
Automatic segmentation, tokenization and morphological and syntactic annotations of raw texts in 45 languages, generated by UDPipe (http://ufal.mff.cuni.cz/udpipe), together with word embeddings of dimension 100 computed from lowercased texts by word2vec (https://code.google.com/archive/p/word2vec/).
Název v anglickém jazyce
CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings
Popis výsledku anglicky
Automatic segmentation, tokenization and morphological and syntactic annotations of raw texts in 45 languages, generated by UDPipe (http://ufal.mff.cuni.cz/udpipe), together with word embeddings of dimension 100 computed from lowercased texts by word2vec (https://code.google.com/archive/p/word2vec/).
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/GA15-10472S" target="_blank" >GA15-10472S: Morfologicky a syntakticky anotované korpusy mnoha jazyků</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
[http://hdl.handle.net/11234/1-1
Technické parametry
Výsledek volně dostupný na adrese http://hdl.handle.net/11234/1-1989.
Ekonomické parametry
90 miliard slov ve více než 40 jazycích, analyzovaných na morfosyntaktické rovině, je unikátní zdroj, pro mnohé uživatele nenahraditelný vlastními silami, takže lze sotva vyčíslit, jak velké náklady jim to ušetří.
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova v Praze