Lemmatization, morphological annotation and disambiguation of the slovak text - Web interface
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A90101%2F21%3A10441770" target="_blank" >RIV/00216208:90101/21:10441770 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=aPysUcbzeF" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=aPysUcbzeF</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
slovinština
Název v původním jazyce
Lematizácia, morfologická anotácia a dezambiguácia slovenského textu - webové rozhranie
Popis výsledku v původním jazyce
Lemmatizácia, morfologická (alebo morfosyntaktická) anotácia (MSD) a disambiguácia je základným a nevyhnutným krokom v spracovaní prirodzeného jazyka jazykov so strednou úrovňou skloňovania. Predstavujeme webové rozhranie demonštrujúce de facto predvolenú lemmatizáciu a MSD pre slovenčinu, ako sú používané v hlavných slovenských korpusoch (s niekoľkými vylepšeniami, ktoré sa v korpusoch ešte neaplikujú). Rozhranie je možné využiť najmä na prezentačné alebo pedagogické účely, pričom morfologické značky sú rozšírené a vysvetlené pomocou jednoduchého jazyka vo viacerých jazykoch, vrátane dvoch rôznych terminologických registrov slovenčiny (odborný lingvistický alebo jeden "bežný").
Název v anglickém jazyce
Lemmatization, morphological annotation and disambiguation of the slovak text - Web interface
Popis výsledku anglicky
Lemmatization, morphological (or morphosyntactic) annotation (MSD) and disambiguation is a basic and indispensable step in Natural Language Processing of languages with a moderate level of inflection. We present a web interface demonstrating the de facto default lemmatization and MSD for Slovak, as used in major Slovak corpora (with several enhancements yet to be applied in the corpora). The interface can be used chiefly for presentation or pedagogical purposes, with the morphological tags expanded and explained using plain language in several languages, including two different terminological registers of Slovak (professional linguistic or a "common" one).
Klasifikace
Druh
J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Slovenská reč
ISSN
0037-6981
e-ISSN
1338-4279
Svazek periodika
86
Číslo periodika v rámci svazku
1
Stát vydavatele periodika
SK - Slovenská republika
Počet stran výsledku
6
Strana od-do
104-109
Kód UT WoS článku
—
EID výsledku v databázi Scopus
2-s2.0-85120352732