Prague Dependency Treebank 3.5
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F18%3A10405623" target="_blank" >RIV/00216208:11320/18:10405623 - isvavai.cz</a>
Výsledek na webu
<a href="http://ufal.mff.cuni.cz/pdt3.5" target="_blank" >http://ufal.mff.cuni.cz/pdt3.5</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Prague Dependency Treebank 3.5
Popis výsledku v původním jazyce
Závislostní korpus anotovaný na rovině morfologické (2 miliony slov), syntaktické (1,5 milionu slov) a sémantické (přes 0,8 milionu slov, tedy 49,5 tis. vět). Obsahuje všechny PDT anotace originálních textů, které vznikly v rámci různých projektů na UFALu mezi roky 1996 a 2018 (PDT 1.0, PDT 2.0, PDT 2.5, PDT 3.0, PDiT 1.0 and PDiT 2.0) a jejich opravy; seznam autorů pokrývá autory všech publikovaných korpusů.
Název v anglickém jazyce
Prague Dependency Treebank 3.5
Popis výsledku anglicky
The Prague Dependency Treebank 3.5 is the 2018 edition of the core Prague Dependency Treebank (PDT). It contains all PDT annotation made at the Institute of Formal and Applied Linguistics under various projects between 1996 and 2018 on the original texts, i.e., all annotation from PDT 1.0, PDT 2.0, PDT 2.5, PDT 3.0, PDiT 1.0 and PDiT 2.0, plus corrections, new structure of basic documentation and new list of authors covering all previous editions. The Prague Dependency Treebank 3.5 (PDT 3.5) contains the same texts as the previous versions since 2.0; there are 49,431 annotated sentences (over 800 thousand nodes) on all layers, from tectogrammatical to words, and additional sentences on the analytical (surface dependency syntax) and morphological layers of annotation (approx. 2 million words in total). Closely linked to the tectogarammtical layer is the annotation of sentence information structure, multiword expressions, coreference, bridging relations and discourse relations.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
PDT35
Technické parametry
Výsledek volně dostupný na adrese http://ufal.mff.cuni.cz/pdt3.5.
Ekonomické parametry
5,000,000 CZK
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova