Reranking Hypotheses of Machine-Translated Queries for Cross-Lingual Information Retrieval
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F16%3A10335525" target="_blank" >RIV/00216208:11320/16:10335525 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-44564-9_5" target="_blank" >http://dx.doi.org/10.1007/978-3-319-44564-9_5</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-44564-9_5" target="_blank" >10.1007/978-3-319-44564-9_5</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Reranking Hypotheses of Machine-Translated Queries for Cross-Lingual Information Retrieval
Popis výsledku v původním jazyce
Machine Translation (MT) systems employed to translate queries for Cross-Lingual Information Retrieval typically produce single translation with maximum translation quality. This, however, might not be optimal with respect to retrieval quality and other translation variants might lead to better retrieval results. In this paper, we explore a method exploiting multiple translations produced by an MT system, which are reranked using a supervised machine-learning method trained to directly optimize the retrieval quality. We experiment with various types of features and the results obtained on the medical-domain test collection from the CLEF eHealth Lab series show significant improvement of retrieval quality compared to a system using single translation provided by MT.
Název v anglickém jazyce
Reranking Hypotheses of Machine-Translated Queries for Cross-Lingual Information Retrieval
Popis výsledku anglicky
Machine Translation (MT) systems employed to translate queries for Cross-Lingual Information Retrieval typically produce single translation with maximum translation quality. This, however, might not be optimal with respect to retrieval quality and other translation variants might lead to better retrieval results. In this paper, we explore a method exploiting multiple translations produced by an MT system, which are reranked using a supervised machine-learning method trained to directly optimize the retrieval quality. We experiment with various types of features and the results obtained on the medical-domain test collection from the CLEF eHealth Lab series show significant improvement of retrieval quality compared to a system using single translation provided by MT.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GBP103%2F12%2FG084" target="_blank" >GBP103/12/G084: Centrum pro multi-modální interpretaci dat velkého rozsahu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Experimental IR Meets Multilinguality, Multimodality, and Interaction 7th International Conference of the CLEF Association
ISBN
978-3-319-44563-2
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
13
Strana od-do
54-66
Název nakladatele
Springer
Místo vydání
Berlin, Germany
Místo konání akce
Évora, Portugal
Datum konání akce
5. 9. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—