Diverse queries and feature type selection for plagiarism discovery: Notebook for PAN at CLEF 2013
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F13%3A00087410" target="_blank" >RIV/00216224:14330/13:00087410 - isvavai.cz</a>
Výsledek na webu
<a href="http://ceur-ws.org/Vol-1179/" target="_blank" >http://ceur-ws.org/Vol-1179/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Diverse queries and feature type selection for plagiarism discovery: Notebook for PAN at CLEF 2013
Popis výsledku v původním jazyce
This paper describes approaches used for the Plagiarism Detection task in PAN 2013 international competition on uncovering plagiarism, authorship, and social software misuse. We present modified three-way search methodology for Source Retrieval subtask and analyse snippet similarity performance. The results show, that presented approach is adaptable in real-world plagiarism situations. For the Detailed Comparison task, we discuss feature type selection and global postprocessing. Resulting performance issignificantly better with the described modifications, and further improvement is still possible.
Název v anglickém jazyce
Diverse queries and feature type selection for plagiarism discovery: Notebook for PAN at CLEF 2013
Popis výsledku anglicky
This paper describes approaches used for the Plagiarism Detection task in PAN 2013 international competition on uncovering plagiarism, authorship, and social software misuse. We present modified three-way search methodology for Source Retrieval subtask and analyse snippet similarity performance. The results show, that presented approach is adaptable in real-world plagiarism situations. For the Detailed Comparison task, we discuss feature type selection and global postprocessing. Resulting performance issignificantly better with the described modifications, and further improvement is still possible.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LG13010" target="_blank" >LG13010: Zastoupení ČR v European Research Consortium for Informatics and Mathematics</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2013
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
2013 Cross Language Evaluation Forum Conference, CLEF 2013, CEUR Workshop Proceedings Volume 1179
ISBN
—
ISSN
1613-0073
e-ISSN
—
Počet stran výsledku
8
Strana od-do
"nestránkováno"
Název nakladatele
CEUR
Místo vydání
Valencia; Spain
Místo konání akce
Valencia; Spain
Datum konání akce
1. 1. 2013
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—