Cross-Language Source Code Plagiarism Detection using Explicit Semantic Analysis and Scored Greedy String Tilling
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F62156489%3A43110%2F20%3A43918181" target="_blank" >RIV/62156489:43110/20:43918181 - isvavai.cz</a>
Výsledek na webu
<a href="https://doi.org/10.1145/3383583.3398594" target="_blank" >https://doi.org/10.1145/3383583.3398594</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1145/3383583.3398594" target="_blank" >10.1145/3383583.3398594</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Cross-Language Source Code Plagiarism Detection using Explicit Semantic Analysis and Scored Greedy String Tilling
Popis výsledku v původním jazyce
We present a method for source code plagiarism detection that is independent of the programming language. Our method EsaGst combines Explicit Semantic Analysis and Greedy String Tiling. Using 25 cases of source code plagiarism in C++, Java, JavaScript, PHP, and Python, we show that EsaGst outperforms a baseline method in identifying plagiarism across programming languages.
Název v anglickém jazyce
Cross-Language Source Code Plagiarism Detection using Explicit Semantic Analysis and Scored Greedy String Tilling
Popis výsledku anglicky
We present a method for source code plagiarism detection that is independent of the programming language. Our method EsaGst combines Explicit Semantic Analysis and Greedy String Tiling. Using 25 cases of source code plagiarism in C++, Java, JavaScript, PHP, and Python, we show that EsaGst outperforms a baseline method in identifying plagiarism across programming languages.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
50803 - Information science (social aspects)
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the ACM/IEEE Joint Conference on Digital Libraries in 2020 (JCDL '20)
ISBN
978-1-4503-7585-6
ISSN
—
e-ISSN
—
Počet stran výsledku
2
Strana od-do
523-524
Název nakladatele
Association for Computing Machinery (ACM)
Místo vydání
New York
Místo konání akce
Wu-chan
Datum konání akce
1. 8. 2020
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—