Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F17%3A10372328" target="_blank" >RIV/00216208:11320/17:10372328 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://hdl.handle.net/11234/1-1989" target="_blank" >http://hdl.handle.net/11234/1-1989</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings

  • Popis výsledku v původním jazyce

    Automatic segmentation, tokenization and morphological and syntactic annotations of raw texts in 45 languages, generated by UDPipe (http://ufal.mff.cuni.cz/udpipe), together with word embeddings of dimension 100 computed from lowercased texts by word2vec (https://code.google.com/archive/p/word2vec/).

  • Název v anglickém jazyce

    CoNLL 2017 Shared Task - Automatically Annotated Raw Texts and Word Embeddings

  • Popis výsledku anglicky

    Automatic segmentation, tokenization and morphological and syntactic annotations of raw texts in 45 languages, generated by UDPipe (http://ufal.mff.cuni.cz/udpipe), together with word embeddings of dimension 100 computed from lowercased texts by word2vec (https://code.google.com/archive/p/word2vec/).

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/GA15-10472S" target="_blank" >GA15-10472S: Morfologicky a syntakticky anotované korpusy mnoha jazyků</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2017

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    [http://hdl.handle.net/11234/1-1

  • Technické parametry

    Výsledek volně dostupný na adrese http://hdl.handle.net/11234/1-1989.

  • Ekonomické parametry

    90 miliard slov ve více než 40 jazycích, analyzovaných na morfosyntaktické rovině, je unikátní zdroj, pro mnohé uživatele nenahraditelný vlastními silami, takže lze sotva vyčíslit, jak velké náklady jim to ušetří.

  • IČO vlastníka výsledku

    00216208

  • Název vlastníka

    Univerzita Karlova v Praze