Heterogeneous Queries for Synoptic and Phrasal Search
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F14%3A00077319" target="_blank" >RIV/00216224:14330/14:00077319 - isvavai.cz</a>
Výsledek na webu
<a href="http://ceur-ws.org/Vol-1180/" target="_blank" >http://ceur-ws.org/Vol-1180/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Heterogeneous Queries for Synoptic and Phrasal Search
Popis výsledku v původním jazyce
This paper describes our approaches for the Plagiarism Detection ? Source Retrieval task of PAN 2014. We combined and improved methodology used at PAN 2012 and PAN 2013. Our system combines three types of queries: The keywords-based queries; the paragraph-based queries; and the headers-based queries. The queries are distinguished also by other properties such as the phrase query or the positional query. The queries are submitted to two search engines ? Chatnoir and Indri ? according to their properties.The query?s position serves for the search control, minimization of the total number of executed queries is the system?s priority. Downloaded documents are textually compared with the suspicious document and if a similarity is found, the downloaded document is reported.
Název v anglickém jazyce
Heterogeneous Queries for Synoptic and Phrasal Search
Popis výsledku anglicky
This paper describes our approaches for the Plagiarism Detection ? Source Retrieval task of PAN 2014. We combined and improved methodology used at PAN 2012 and PAN 2013. Our system combines three types of queries: The keywords-based queries; the paragraph-based queries; and the headers-based queries. The queries are distinguished also by other properties such as the phrase query or the positional query. The queries are submitted to two search engines ? Chatnoir and Indri ? according to their properties.The query?s position serves for the search control, minimization of the total number of executed queries is the system?s priority. Downloaded documents are textually compared with the suspicious document and if a similarity is found, the downloaded document is reported.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LG13010" target="_blank" >LG13010: Zastoupení ČR v European Research Consortium for Informatics and Mathematics</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
CLEF2014 Working Notes
ISBN
—
ISSN
1613-0073
e-ISSN
—
Počet stran výsledku
4
Strana od-do
1017-1020
Název nakladatele
CEUR, Aachen University
Místo vydání
Sheffield, UK
Místo konání akce
Sheffield, UK
Datum konání akce
1. 1. 2014
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—