Lexikální síť DeriNet: elektronický zdroj pro výzkum derivace v češtině
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F16%3A10335408" target="_blank" >RIV/00216208:11320/16:10335408 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=20QfqNjgB-" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=20QfqNjgB-</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Lexikální síť DeriNet: elektronický zdroj pro výzkum derivace v češtině
Popis výsledku v původním jazyce
Článek představuje lexikální databázi DeriNet, která obsahuje téměř 1 milion českých slov propojených více než 700 tisíci hranami odpovídajícími vztahu mezi slovem odvozeným a základovým. V textu je popsán proces budování této databáze, lingvistická rozhodnutí, která bylo nutné během tohoto procesu učinit, i možné využití a výhledy.
Název v anglickém jazyce
The DeriNet Lexical Network: a Language Data Resource for Research into Derivation in Czech
Popis výsledku anglicky
In the present paper, the lexical database DeriNet is introduced which includes more than 969 thousand Czech word interconnected with 718 thousand links corresponding to derivational relations (relations between a base word and a word derived from it). Derivational relations were identified by semi-automatic procedures and manual annotation. As the DeriNet network is fully compatible with a big inflectional dictionary of Czech (MorfFlex CZ), it can be used as a resource for an integrating approach to derivational and inflectional morphology of Czech both in linguistic research and in natural language processing.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Časopis pro moderní filologii
ISSN
0008-7386
e-ISSN
—
Svazek periodika
98
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
15
Strana od-do
62-76
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—