Evaluating Automatic idiom Annotation in Spoken Corpora:the Case of Somatic Idioms
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F15%3A10319647" target="_blank" >RIV/00216208:11210/15:10319647 - isvavai.cz</a>
Výsledek na webu
<a href="http://korpus.sk/~slovko/2015/Proceedings_Slovko_2015.pdf" target="_blank" >http://korpus.sk/~slovko/2015/Proceedings_Slovko_2015.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Evaluating Automatic idiom Annotation in Spoken Corpora:the Case of Somatic Idioms
Popis výsledku v původním jazyce
In this study, we aim to verify the reliability of the annotation of idioms in spoken corpora. Idioms are searched for and annotated using a special tool. Some Czech idioms come in different lengths, word order permutations and variants. These propertiesgreatly complicate their identification. Somatic idioms are among the most common idioms in language. They can be easily retrieved by keyword (the name of the part of the human body). They are suitable for verifying the accuracy of annotation. For the evaluation, we use the well-known precision and recall measures.
Název v anglickém jazyce
Evaluating Automatic idiom Annotation in Spoken Corpora:the Case of Somatic Idioms
Popis výsledku anglicky
In this study, we aim to verify the reliability of the annotation of idioms in spoken corpora. Idioms are searched for and annotated using a special tool. Some Czech idioms come in different lengths, word order permutations and variants. These propertiesgreatly complicate their identification. Somatic idioms are among the most common idioms in language. They can be easily retrieved by keyword (the name of the part of the human body). They are suitable for verifying the accuracy of annotation. For the evaluation, we use the well-known precision and recall measures.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2011023" target="_blank" >LM2011023: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Natural Language Processing, Corpus Linguistics, Lexicography.
ISBN
978-3-942303-32-3
ISSN
—
e-ISSN
—
Počet stran výsledku
5
Strana od-do
72-76
Název nakladatele
Slovenská akadémia vied
Místo vydání
Bratislava
Místo konání akce
Bratislava
Datum konání akce
21. 10. 2015
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—