DeriNet v2.1
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F21%3A10440798" target="_blank" >RIV/00216208:11320/21:10440798 - isvavai.cz</a>
Výsledek na webu
<a href="http://hdl.handle.net/11234/1-3765" target="_blank" >http://hdl.handle.net/11234/1-3765</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
DeriNet v2.1
Popis výsledku v původním jazyce
DeriNet je lexikální síť, která modeluje derivační vztahy ve slovníku češtiny. Uzly sítě odpovídají českým lexémům, zatímco hrany představují slovotvorné vztahy mezi odvozeným slovem a jeho základním slovem / slovy. Současná verze, DeriNet 2.1, obsahuje 1 039 012 lexemes (extrahovány ze slovníku MorfFlex CZ 2.0) spojených 782 814 derivačními relacemi, 50 533 ortografickými variantami, 1 952 vztahů skládání, 295 univerbizačními vztahy a 144 konverzními vztahy. Ve srovnání s předchozí verzí obsahuje verze 2.1 anotace ortografických variant, plně automaticky generovanou anotaci hranic afixů (kromě kořenů anotovaných v 2.0), 202 affixoidů sloužících jako základ pro skládání, anotaci četností lexémů z korpusů, anotaci slovesných tříd a pilotní anotaci univerbace. Sada tagů pro slovní druhy byla převedena na Universal POS z projektu Universal Dependencies.
Název v anglickém jazyce
DeriNet v2.1
Popis výsledku anglicky
DeriNet is a lexical network which models derivational relations in the lexicon of Czech. Nodes of the network correspond to Czech lexemes, while edges represent word-formational relations between a derived word and its base word / words. The present version, DeriNet 2.1, contains 1,039,012 lexemes (sampled from the MorfFlex CZ 2.0 dictionary) connected by 782,814 derivational, 50,533 orthographic variant, 1,952 compounding, 295 univerbation and 144 conversion relations. Compared to the previous version, version 2.1 contains annotations of orthographic variants, full automatically generated annotation of affix morpheme boundaries (in addition to the roots annotated in 2.0), 202 affixoid lexemes serving as bases for compounding, annotation of corpus frequency of lexemes, annotation of verbal conjugation classes and a pilot annotation of univerbation. The set of part-of-speech tags was converted to Universal POS from the Universal Dependencies project.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
[http://hdl.handle.net/11234/1-3
Technické parametry
Výsledek volně dostupný na adrese http://hdl.handle.net/11234/1-3765.
Ekonomické parametry
300000
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova