An Analysis of Annotation of Verb-Noun Idiomatic Combinations in a Parallel Dependency Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F13%3A10194682" target="_blank" >RIV/00216208:11320/13:10194682 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.aclweb.org/anthology-new/W/W13/W13-1009.pdf" target="_blank" >http://www.aclweb.org/anthology-new/W/W13/W13-1009.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
An Analysis of Annotation of Verb-Noun Idiomatic Combinations in a Parallel Dependency Corpus
Popis výsledku v původním jazyce
While working on valency lexicons for Czech and English, it was necessary to define treatment of multiword entities (MWEs) with the verb as the central lexical unit. We present a corpus-based study, concentrating on multilayer specification of verbal MWEs, their properties in Czech and English, and a comparison between the two languages using the parallel Czech-English Dependency Treebank (PCEDT). This comparison revealed interesting differences in the use of verbal MWEs in translation (discovering thatsuch MWEs are actually rarely translated as MWEs, at least between Czech and English) as well as some inconsistencies in their annotation.
Název v anglickém jazyce
An Analysis of Annotation of Verb-Noun Idiomatic Combinations in a Parallel Dependency Corpus
Popis výsledku anglicky
While working on valency lexicons for Czech and English, it was necessary to define treatment of multiword entities (MWEs) with the verb as the central lexical unit. We present a corpus-based study, concentrating on multilayer specification of verbal MWEs, their properties in Czech and English, and a comparison between the two languages using the parallel Czech-English Dependency Treebank (PCEDT). This comparison revealed interesting differences in the use of verbal MWEs in translation (discovering thatsuch MWEs are actually rarely translated as MWEs, at least between Czech and English) as well as some inconsistencies in their annotation.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GP13-03351P" target="_blank" >GP13-03351P: Srovnání české a anglické valence sloves na základě korpusového materiálu (teorie a praxe)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
The 9th Workshop on Multiword Expressions (MWE 2013)
ISBN
978-1-937284-47-3
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
58-63
Název nakladatele
Association for Computational Linguistics
Místo vydání
Atlanta, Georgia, USA
Místo konání akce
Atlanta, Georgia, USA
Datum konání akce
13. 6. 2013
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—