Syntactic-Semantic Classes of Context-Sensitive Synonyms Based on a Bilingual Corpus
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F20%3A10424506" target="_blank" >RIV/00216208:11320/20:10424506 - isvavai.cz</a>
Výsledek na webu
<a href="http://ufal.mff.cuni.cz/biblio/attachments/2020-uresova-p3028634649548701313.pdf" target="_blank" >http://ufal.mff.cuni.cz/biblio/attachments/2020-uresova-p3028634649548701313.pdf</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-030-66527-2_18" target="_blank" >10.1007/978-3-030-66527-2_18</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Syntactic-Semantic Classes of Context-Sensitive Synonyms Based on a Bilingual Corpus
Popis výsledku v původním jazyce
This paper summarizes findings of a three-year study on verb synonymy in translation based on both syntactic and semantic criteria and reports on recent results extending this work. Primary language resources used are existing Czech and English lexical and corpus resources, namely the Prague Dependency Treebank-style valency lexicons, FrameNet, VerbNet, PropBank, WordNet and the parallel Prague Czech-English Dependency Treebank, which contains deep syntactic and partially semantic annotation of running texts. The resulting lexicon (called formerly CzEngClass, now SynSemClass) and all associated resources linked to the existing lexicons and corpora following from this project are publicly and freely available. While the project proper assumes manual annotation work, we expect to use the resulting resource (together with the existing ones) as a necessary resource for developing automatic methods for extending such a lexicon, or creating similar lexicons for other languages.
Název v anglickém jazyce
Syntactic-Semantic Classes of Context-Sensitive Synonyms Based on a Bilingual Corpus
Popis výsledku anglicky
This paper summarizes findings of a three-year study on verb synonymy in translation based on both syntactic and semantic criteria and reports on recent results extending this work. Primary language resources used are existing Czech and English lexical and corpus resources, namely the Prague Dependency Treebank-style valency lexicons, FrameNet, VerbNet, PropBank, WordNet and the parallel Prague Czech-English Dependency Treebank, which contains deep syntactic and partially semantic annotation of running texts. The resulting lexicon (called formerly CzEngClass, now SynSemClass) and all associated resources linked to the existing lexicons and corpora following from this project are publicly and freely available. While the project proper assumes manual annotation work, we expect to use the resulting resource (together with the existing ones) as a necessary resource for developing automatic methods for extending such a lexicon, or creating similar lexicons for other languages.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Human Language Technology. Challenges for Computer Science and Linguistics. 8th Language and Technology Conference, LTC 2017, Revised Selected Papers
ISBN
978-3-030-66527-2
ISSN
—
e-ISSN
—
Počet stran výsledku
14
Strana od-do
242-255
Název nakladatele
Springer International Publishing
Místo vydání
Cham, Switzerland
Místo konání akce
Poznań, Poland
Datum konání akce
17. 11. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—