Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

AUTOMATIC LEMMATIZATION OF ANCIENT GREEK INSCRIPTIONS: A PRESENTATION OF AGILE

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F25%3A4IQH7Y6K" target="_blank" >RIV/00216208:11320/25:4IQH7Y6K - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://www.scopus.com/inward/record.uri?eid=2-s2.0-85201624017&doi=10.19272%2f202413701002&partnerID=40&md5=77d1f4c3bfb4d6a8b4ea4d655af04d6f" target="_blank" >https://www.scopus.com/inward/record.uri?eid=2-s2.0-85201624017&doi=10.19272%2f202413701002&partnerID=40&md5=77d1f4c3bfb4d6a8b4ea4d655af04d6f</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.19272/202413701002" target="_blank" >10.19272/202413701002</a>

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    AUTOMATIC LEMMATIZATION OF ANCIENT GREEK INSCRIPTIONS: A PRESENTATION OF AGILE

  • Popis výsledku v původním jazyce

    In this paper, we present the first automatic lemmatizer for Ancient Greek Inscriptions (AGILe). Lemmatization of ancient texts, the process of tagging each word with the base form equal to the dictionary entry, benefits researchers, since searches on a lemmatized corpus can retrieve all occurrences of a lemma in one query. Whereas the corpus of literary texts (e.g. the Thesaurus Linguae Graecae) has been lemmatized, the vast majority of Ancient Greek inscriptions has not. Lemmatization is useful especially for inscriptions, since these are texts with a great amount of dialectal and spelling variation, but to lemmatize this vast corpus by hand would be an enormous task. We evaluated the performance of five existing automatic lemmatizers, developed for literary Greek, on epigraphic texts. Since their performance was disappointing (61.5% accuracy at best), we developed a new lemmatizer dedicated to Greek inscriptions. The performance of our lemmatizer is 85.6%. We provide a detailed error analysis as well as concrete suggestions for future improvement, as first steps towards the integration of AGILe in an online corpus of inscriptions. © 2024 Fabrizio Serra Editore Srl. All rights reserved.

  • Název v anglickém jazyce

    AUTOMATIC LEMMATIZATION OF ANCIENT GREEK INSCRIPTIONS: A PRESENTATION OF AGILE

  • Popis výsledku anglicky

    In this paper, we present the first automatic lemmatizer for Ancient Greek Inscriptions (AGILe). Lemmatization of ancient texts, the process of tagging each word with the base form equal to the dictionary entry, benefits researchers, since searches on a lemmatized corpus can retrieve all occurrences of a lemma in one query. Whereas the corpus of literary texts (e.g. the Thesaurus Linguae Graecae) has been lemmatized, the vast majority of Ancient Greek inscriptions has not. Lemmatization is useful especially for inscriptions, since these are texts with a great amount of dialectal and spelling variation, but to lemmatize this vast corpus by hand would be an enormous task. We evaluated the performance of five existing automatic lemmatizers, developed for literary Greek, on epigraphic texts. Since their performance was disappointing (61.5% accuracy at best), we developed a new lemmatizer dedicated to Greek inscriptions. The performance of our lemmatizer is 85.6%. We provide a detailed error analysis as well as concrete suggestions for future improvement, as first steps towards the integration of AGILe in an online corpus of inscriptions. © 2024 Fabrizio Serra Editore Srl. All rights reserved.

Klasifikace

  • Druh

    J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

  • Návaznosti

Ostatní

  • Rok uplatnění

    2024

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Journal of Epigraphic Studies

  • ISSN

    2611-979X

  • e-ISSN

  • Svazek periodika

    7

  • Číslo periodika v rámci svazku

    2024

  • Stát vydavatele periodika

    US - Spojené státy americké

  • Počet stran výsledku

    22

  • Strana od-do

    29-50

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus

    2-s2.0-85201624017