Segmented Retrieval
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F17%3A00094425" target="_blank" >RIV/00216224:14330/17:00094425 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Segmented Retrieval
Popis výsledku v původním jazyce
Modern text retrieval systems employ text segmentation during the indexing of documents. We show that, rather than returning the segments to the user, significant improvements are achieved on the semantic text similarity task by combining all segments from a single document into one result with an aggregate similarity score. Following an analysis of the SemEval-2016 and 2017 task 3 datasets, we design a segment decay weighting method that achieves state the art results on subtask B and can be readily implemented into existing inverted-index-based search engines.
Název v anglickém jazyce
Segmented Retrieval
Popis výsledku anglicky
Modern text retrieval systems employ text segmentation during the indexing of documents. We show that, rather than returning the segments to the user, significant improvements are achieved on the semantic text similarity task by combining all segments from a single document into one result with an aggregate similarity score. Following an analysis of the SemEval-2016 and 2017 task 3 datasets, we design a segment decay weighting method that achieves state the art results on subtask B and can be readily implemented into existing inverted-index-based search engines.
Klasifikace
Druh
V<sub>souhrn</sub> - Souhrnná výzkumná zpráva
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/TD03000295" target="_blank" >TD03000295: Inteligentní software pro sémantické hledání dokumentů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Počet stran výsledku
20
Místo vydání
Brno
Název nakladatele resp. objednatele
Technologická agentura České republiky
Verze
—