Word Formation Analyzer for Czech: Automatic Parent Retrieval and Classification of Word Formation Processes
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3A10456878" target="_blank" >RIV/00216208:11320/22:10456878 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=aPNRh9i34E" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=aPNRh9i34E</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.14712/00326585.019" target="_blank" >10.14712/00326585.019</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Word Formation Analyzer for Czech: Automatic Parent Retrieval and Classification of Word Formation Processes
Popis výsledku v původním jazyce
We present a deep-learning tool called Word Formation Analyzer for Czech, which, given an input lexeme, automatically retrieves the lemma or lemmas from which the input lexeme was formed. We call this task parent retrieval. Furthermore, based on the number of words in the output sequence and its comparison to the input, the input word is classified into one of three categories: compound, derivative or unmotivated. We call this task word formation classification. In the task of parent retrieval, Word Formation Analyzer for Czech achieved an accuracy of 71%. In word formation classification, the tool achieved an accuracy of 87%.
Název v anglickém jazyce
Word Formation Analyzer for Czech: Automatic Parent Retrieval and Classification of Word Formation Processes
Popis výsledku anglicky
We present a deep-learning tool called Word Formation Analyzer for Czech, which, given an input lexeme, automatically retrieves the lemma or lemmas from which the input lexeme was formed. We call this task parent retrieval. Furthermore, based on the number of words in the output sequence and its comparison to the input, the input word is classified into one of three categories: compound, derivative or unmotivated. We call this task word formation classification. In the task of parent retrieval, Word Formation Analyzer for Czech achieved an accuracy of 71%. In word formation classification, the tool achieved an accuracy of 87%.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
The Prague Bulletin of Mathematical Linguistics
ISSN
0032-6585
e-ISSN
1804-0462
Svazek periodika
Neuveden
Číslo periodika v rámci svazku
118
Stát vydavatele periodika
CZ - Česká republika
Počet stran výsledku
19
Strana od-do
55-73
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—