Korpusové zpracování korespondenčních textů: problematika morfologického značkování

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F11%3A00050589" target="_blank" >RIV/00216224:14210/11:00050589 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Jazyk výsledku
čeština
Název v původním jazyce
Korpusové zpracování korespondenčních textů: problematika morfologického značkování
Popis výsledku v původním jazyce
Příspěvek shrnuje zkušenosti s korpusovým zpracováním korespondenčních textů. Pozornost je věnována hlavně lemmatizaci, morfologickému značkování a desambiguaci textů se značnou frekvencí substandardních jazykových jevů. Je uveden postup nutných úprav morfologického analyzátoru, podíl ruční editace a získané výsledky.
Název v anglickém jazyce
Corpus processing of corresponding texts: problems of morphological tagging
Popis výsledku anglicky
This presentation summarizes the experience with the corpus processing of the corresponding texts. Attention is paid mainly lemmatization, morphological tagging and disambiguation of texts with a high frequency of substandard linguistic phenomena. The procedure for necessary adjustments of morphological analyzer, the proportion of manual editing and the results obtained are specified.

Projekt
<a href="/cs/project/GAP406%2F10%2F0823" target="_blank" >GAP406/10/0823: Soukromá korespondence 20. století. Rozšíření korpusových zdrojů, nové možnosti lingvistického využití</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Podobné výsledky(10)