CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F17%3A10372328" target="_blank" >RIV/00216208:11320/17:10372328 - isvavai.cz</a>
Result on the web
<a href="http://hdl.handle.net/11234/1-1989" target="_blank" >http://hdl.handle.net/11234/1-1989</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings
Original language description
Automatic segmentation, tokenization and morphological and syntactic annotations of raw texts in 45 languages, generated by UDPipe (http://ufal.mff.cuni.cz/udpipe), together with word embeddings of dimension 100 computed from lowercased texts by word2vec (https://code.google.com/archive/p/word2vec/).
Czech name
—
Czech description
—
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Result continuities
Project
<a href="/en/project/GA15-10472S" target="_blank" >GA15-10472S: Morphologically and Syntactically Annotated Corpora of Many Languages</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2017
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
[http://hdl.handle.net/11234/1-1
Technical parameters
Výsledek volně dostupný na adrese http://hdl.handle.net/11234/1-1989.
Economical parameters
90 miliard slov ve více než 40 jazycích, analyzovaných na morfosyntaktické rovině, je unikátní zdroj, pro mnohé uživatele nenahraditelný vlastními silami, takže lze sotva vyčíslit, jak velké náklady jim to ušetří.
Owner IČO
00216208
Owner name
Univerzita Karlova v Praze