Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Využití moderních přístupů pro detekci plagiátů

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F08%3A00500856" target="_blank" >RIV/49777513:23520/08:00500856 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Využití moderních přístupů pro detekci plagiátů

  • Popis výsledku v původním jazyce

    V tomto článku se zabýváme moderními přístupy pro detekci plagiátů textových dokumentů. Naše metoda využívá normalizaci textu a latentní sémantickou nalýzu pro nalezení ksrytých vztahů mezi dokumenty. Dále uvádíme předběžné experimenty provedené na testovacím korpusu, který obsahuje 950 textových dokumentů o politice. Předaběžné experimenty naznačují výhodnost naší metody a zlepšení výsledků oproti ostatním přístupům. V závěru článku diskutujeme využití WordNet tezauru pro zlepšení přesnosti současnýchmetod a možnosti identifikace plagiátů, které byly přeloženy do jiných jazyků.

  • Název v anglickém jazyce

    The Use of Current Approaches for Plagiarism Detection

  • Popis výsledku anglicky

    This paper deals with modern appreaches for plagiarism detection. We propose a method that employes text normalization and Latent Semantic Analysis to infer latent semantic association among documents. Further, we introduce preliminar experiments on ourtesting corpus, which consists of 950 documents about politics. Our preliminar experiments indicate better results for our approach than the other tested methods. Finally, we discuss the use of WordNet to improve the accuracy of plagiarism detection method. Another issue is the identification of translated documents.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    JC - Počítačový hardware a software

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/2C06009" target="_blank" >2C06009: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2008

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Informačné technológie

  • ISBN

    978-80-969184-8-5

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    4

  • Strana od-do

  • Název nakladatele

    PONT

  • Místo vydání

    Deňa

  • Místo konání akce

    Hrebienok

  • Datum konání akce

    26. 9. 2008

  • Typ akce podle státní příslušnosti

    EUR - Evropská akce

  • Kód UT WoS článku