Prague Dependency Treebank - Consolidated 2.0 (PDT-C 2.0)
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F24%3A10493011" target="_blank" >RIV/00216208:11320/24:10493011 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216208:11210/24:10493011
Výsledek na webu
<a href="http://hdl.handle.net/11234/1-5813" target="_blank" >http://hdl.handle.net/11234/1-5813</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Prague Dependency Treebank - Consolidated 2.0 (PDT-C 2.0)
Popis výsledku v původním jazyce
A manually annotated and genre-diversified language resource with rich linguistic information from morphology and syntax to semantics, the Prague Dependency Treebank - Consolidated 2.0 (PDT-C 2.0) is a consolidated release of the existing PDT-corpora of Czech data, uniformly annotated using the standard PDT scheme. PDT-corpora included in PDT-C: Prague Dependency Treebank (written newspaper and journal texts from three genres); Czech part of Prague Czech-English Dependency Treebank (translated financial texts, from English), Prague Dependency Treebank of Spoken Czech (spoken data, including audio and transcripts and multiple speech reconstruction annotation); PDT-Faust (user-generated texts). The separately published original treebanks are published in one package, to allow easier data handling for all the datasets and they are enhanced with further manual linguistic annotation. In the previous PDT-C 1.0 version, the data was enhanced with a manual linguistic annotation at the morphological layer. For
Název v anglickém jazyce
Prague Dependency Treebank - Consolidated 2.0 (PDT-C 2.0)
Popis výsledku anglicky
A manually annotated and genre-diversified language resource with rich linguistic information from morphology and syntax to semantics, the Prague Dependency Treebank - Consolidated 2.0 (PDT-C 2.0) is a consolidated release of the existing PDT-corpora of Czech data, uniformly annotated using the standard PDT scheme. PDT-corpora included in PDT-C: Prague Dependency Treebank (written newspaper and journal texts from three genres); Czech part of Prague Czech-English Dependency Treebank (translated financial texts, from English), Prague Dependency Treebank of Spoken Czech (spoken data, including audio and transcripts and multiple speech reconstruction annotation); PDT-Faust (user-generated texts). The separately published original treebanks are published in one package, to allow easier data handling for all the datasets and they are enhanced with further manual linguistic annotation. In the previous PDT-C 1.0 version, the data was enhanced with a manual linguistic annotation at the morphological layer. For
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
PDT-C20
Technické parametry
Výsledek volně dostupný na adrese http://hdl.handle.net/11234/1-5813.
Ekonomické parametry
7,000,000 CZK
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova