Využití moderních přístupů pro detekci plagiátů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500856" target="_blank" >RIV/49777513:23520/08:00500856 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Využití moderních přístupů pro detekci plagiátů
Popis výsledku v původním jazyce
V tomto článku se zabýváme moderními přístupy pro detekci plagiátů textových dokumentů. Naše metoda využívá normalizaci textu a latentní sémantickou nalýzu pro nalezení ksrytých vztahů mezi dokumenty. Dále uvádíme předběžné experimenty provedené na testovacím korpusu, který obsahuje 950 textových dokumentů o politice. Předaběžné experimenty naznačují výhodnost naší metody a zlepšení výsledků oproti ostatním přístupům. V závěru článku diskutujeme využití WordNet tezauru pro zlepšení přesnosti současnýchmetod a možnosti identifikace plagiátů, které byly přeloženy do jiných jazyků.
Název v anglickém jazyce
The Use of Current Approaches for Plagiarism Detection
Popis výsledku anglicky
This paper deals with modern appreaches for plagiarism detection. We propose a method that employes text normalization and Latent Semantic Analysis to infer latent semantic association among documents. Further, we introduce preliminar experiments on ourtesting corpus, which consists of 950 documents about politics. Our preliminar experiments indicate better results for our approach than the other tested methods. Finally, we discuss the use of WordNet to improve the accuracy of plagiarism detection method. Another issue is the identification of translated documents.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06009" target="_blank" >2C06009: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Informačné technológie
ISBN
978-80-969184-8-5
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
—
Název nakladatele
PONT
Místo vydání
Deňa
Místo konání akce
Hrebienok
Datum konání akce
26. 9. 2008
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—