Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

CAMELMORPH MSA: A Large-Scale Open-Source Morphological Analyzer for Modern Standard Arabic

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F25%3A2NQF9GKA" target="_blank" >RIV/00216208:11320/25:2NQF9GKA - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://www.scopus.com/inward/record.uri?eid=2-s2.0-85195933677&partnerID=40&md5=260415359b3ee72ba12d0a5c5abd55d2" target="_blank" >https://www.scopus.com/inward/record.uri?eid=2-s2.0-85195933677&partnerID=40&md5=260415359b3ee72ba12d0a5c5abd55d2</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    CAMELMORPH MSA: A Large-Scale Open-Source Morphological Analyzer for Modern Standard Arabic

  • Popis výsledku v původním jazyce

    We present CAMELMORPH MSA, the largest open-source Modern Standard Arabic morphological analyzer and generator. CAMELMORPH MSA has over 100K lemmas, and includes rarely modeled morphological features of Modern Standard Arabic with Classical Arabic origins. CAMELMORPH MSA can produce ∼1.45B analyses and ∼535M unique diacritizations, almost an order of magnitude larger than SAMA (Maamouri et al., 2010c), in addition to having ∼36% less OOV rate than SAMA on a 10B word corpus. Furthermore, CAMELMORPH MSA fills the gaps of many lemma paradigms by modeling linguistic phenomena consistently. CAMELMORPH MSA seamlessly integrates with the Camel Tools Python toolkit (Obeid et al., 2020), ensuring ease of use and accessibility. © 2024 ELRA Language Resource Association: CC BY-NC 4.0.

  • Název v anglickém jazyce

    CAMELMORPH MSA: A Large-Scale Open-Source Morphological Analyzer for Modern Standard Arabic

  • Popis výsledku anglicky

    We present CAMELMORPH MSA, the largest open-source Modern Standard Arabic morphological analyzer and generator. CAMELMORPH MSA has over 100K lemmas, and includes rarely modeled morphological features of Modern Standard Arabic with Classical Arabic origins. CAMELMORPH MSA can produce ∼1.45B analyses and ∼535M unique diacritizations, almost an order of magnitude larger than SAMA (Maamouri et al., 2010c), in addition to having ∼36% less OOV rate than SAMA on a 10B word corpus. Furthermore, CAMELMORPH MSA fills the gaps of many lemma paradigms by modeling linguistic phenomena consistently. CAMELMORPH MSA seamlessly integrates with the Camel Tools Python toolkit (Obeid et al., 2020), ensuring ease of use and accessibility. © 2024 ELRA Language Resource Association: CC BY-NC 4.0.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

  • Návaznosti

Ostatní

  • Rok uplatnění

    2024

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    LREC-COLING 2024 Main conference proceedings

  • ISBN

    978-2-493-81410-4

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    9

  • Strana od-do

    2683-2691

  • Název nakladatele

  • Místo vydání

  • Místo konání akce

    Torino, Italia

  • Datum konání akce

    1. 1. 2025

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku