Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Unsupervised Extraction of Morphological Categories for Morphemes

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F24%3A10492904" target="_blank" >RIV/00216208:11320/24:10492904 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://link.springer.com/chapter/10.1007/978-3-031-70563-2_19" target="_blank" >https://link.springer.com/chapter/10.1007/978-3-031-70563-2_19</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.1007/978-3-031-70563-2_19" target="_blank" >10.1007/978-3-031-70563-2_19</a>

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Unsupervised Extraction of Morphological Categories for Morphemes

  • Popis výsledku v původním jazyce

    Words in natural language can be assigned to specific morphological categories. For example, the English word &apos;apples&apos; can be described using morphological labels like N;PL. The conditional probabilities on such word forms given the labels would reveal for English that the morpheme &apos;s&apos; is present almost always when the label N;PL appears. This indicates that the morphological properties of a word can be traced to its morphemes. We do not have any data resource that associates morphemes with morphological categories. We use UniMorph schema and datasets for universal morphological annotation as a source of morphological categories and morpheme segmentation. We align morphemes (or exponents) with the corresponding morphological categories based on the UniMorph schema for 12 languages. Given the multilingual nature of the task, we utilize unsupervised methods based on the INCREMENT P measure and IBM Models as we test out the effectiveness of alignment methods used in statistical machine translation. Our results in

  • Název v anglickém jazyce

    Unsupervised Extraction of Morphological Categories for Morphemes

  • Popis výsledku anglicky

    Words in natural language can be assigned to specific morphological categories. For example, the English word &apos;apples&apos; can be described using morphological labels like N;PL. The conditional probabilities on such word forms given the labels would reveal for English that the morpheme &apos;s&apos; is present almost always when the label N;PL appears. This indicates that the morphological properties of a word can be traced to its morphemes. We do not have any data resource that associates morphemes with morphological categories. We use UniMorph schema and datasets for universal morphological annotation as a source of morphological categories and morpheme segmentation. We align morphemes (or exponents) with the corresponding morphological categories based on the UniMorph schema for 12 languages. Given the multilingual nature of the task, we utilize unsupervised methods based on the INCREMENT P measure and IBM Models as we test out the effectiveness of alignment methods used in statistical machine translation. Our results in

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

  • Návaznosti

    S - Specificky vyzkum na vysokych skolach<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2024

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    27th International Conference on Text, Speech and Dialogue

  • ISBN

    978-3-031-70563-2

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    13

  • Strana od-do

    239-251

  • Název nakladatele

    Springer

  • Místo vydání

    Cham, Switzerland

  • Místo konání akce

    Brno, Czechia

  • Datum konání akce

    11. 9. 2024

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku