Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Aranea Go Middle East: Persicum

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F22%3AMG8E7ZQC" target="_blank" >RIV/00216208:11320/22:MG8E7ZQC - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://nlp.fi.muni.cz/raslan/raslan22.pdf#page=113" target="_blank" >https://nlp.fi.muni.cz/raslan/raslan22.pdf#page=113</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Aranea Go Middle East: Persicum

  • Popis výsledku v původním jazyce

    Our paper introduces the creation and annotation of Araneum Persicum, a new Persian web-crawled corpus. Some problems encountered during the process of filtration and annotation are shown, and an ensemble approach adopted for lemmatization and morphosyntactic annotation is introduced. It is also argued that Romanization can be helpful in developing corpora for languages not based on Latin script.

  • Název v anglickém jazyce

    Aranea Go Middle East: Persicum

  • Popis výsledku anglicky

    Our paper introduces the creation and annotation of Araneum Persicum, a new Persian web-crawled corpus. Some problems encountered during the process of filtration and annotation are shown, and an ensemble approach adopted for lemmatization and morphosyntactic annotation is introduced. It is also argued that Romanization can be helpful in developing corpora for languages not based on Latin script.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

  • Návaznosti

Ostatní

  • Rok uplatnění

    2022

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    RASLAN 2022 Recent Advances in Slavonic Natural Language Processing

  • ISBN

    978-80-263-1752-4

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    9

  • Strana od-do

    113-121

  • Název nakladatele

    Tribun EU

  • Místo vydání

  • Místo konání akce

    Karlova Studánka, Czech Republic

  • Datum konání akce

    1. 1. 2022

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku