Multilingual Plagiarism Detection
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00502253" target="_blank" >RIV/49777513:23520/08:00502253 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Multilingual Plagiarism Detection
Popis výsledku v původním jazyce
Multilingual text processing has been gaining more and more attentin in recent. years. This trend has been accentuated by the global integration of European states and the vanishing cultural and social boundaries. Multilingual text processing has becomean important field brigning a lot of new and interesting problems. This paper describes a novel approach to multilingual plagiarism detection. We propose a new method called MLPlag for plagiarism detection in multilingual environment. This method is based on alanylis of word positions.It utilizes the EuroWordNet thesaurus which transform words into language independent form. This allows to identify documents plagiarized from sources written in other languages. We performed and evaluated our experimentson monolingual and multilingual corpora and results are presented in this paper.
Název v anglickém jazyce
Multilingual Plagiarism Detection
Popis výsledku anglicky
Multilingual text processing has been gaining more and more attentin in recent. years. This trend has been accentuated by the global integration of European states and the vanishing cultural and social boundaries. Multilingual text processing has becomean important field brigning a lot of new and interesting problems. This paper describes a novel approach to multilingual plagiarism detection. We propose a new method called MLPlag for plagiarism detection in multilingual environment. This method is based on alanylis of word positions.It utilizes the EuroWordNet thesaurus which transform words into language independent form. This allows to identify documents plagiarized from sources written in other languages. We performed and evaluated our experimentson monolingual and multilingual corpora and results are presented in this paper.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/2C06009" target="_blank" >2C06009: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Artificial Intelligence: Methodology, Systems and Applications
ISBN
978-3-540-85775-4
ISSN
—
e-ISSN
—
Počet stran výsledku
9
Strana od-do
—
Název nakladatele
Springer
Místo vydání
Berlin
Místo konání akce
Jiaozuo
Datum konání akce
17. 5. 2008
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000259298300008