Corpus processing of corresponding texts : problems of morphological tagging

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14210%2F13%3A00066038" target="_blank" >RIV/00216224:14210/13:00066038 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—

Alternative languages

Result language
čeština
Original language name
Korpusové zpracování korespondenčních textů : morfologické značkování
Original language description
Článek shrnuje zkušenosti s korpusovým zpracováním korespondenčních textů. Pozornost je věnována především lemmatizaci, morfologickému značkování a desambiguaci textů s vysokou frekvencí substandardních jazykových jevů. Při analýze jazyka soukromé korespondence byly také využity zkušenosti získané při morfologickém značkování Brněnského mluveného korpusu. Morfologický analyzátor ajka byl doplněn o nejfrekventovanější substandardní lemmata a slovní tvary, které se vyskytly ve zkoumaných korespondenčníchtextech. V článku jsou dále popsány nutné úpravy morfologického analyzátoru, podíl ruční anotace a získané výsledky.
Czech name
Korpusové zpracování korespondenčních textů : morfologické značkování
Czech description
Článek shrnuje zkušenosti s korpusovým zpracováním korespondenčních textů. Pozornost je věnována především lemmatizaci, morfologickému značkování a desambiguaci textů s vysokou frekvencí substandardních jazykových jevů. Při analýze jazyka soukromé korespondence byly také využity zkušenosti získané při morfologickém značkování Brněnského mluveného korpusu. Morfologický analyzátor ajka byl doplněn o nejfrekventovanější substandardní lemmata a slovní tvary, které se vyskytly ve zkoumaných korespondenčníchtextech. V článku jsou dále popsány nutné úpravy morfologického analyzátoru, podíl ruční anotace a získané výsledky.

Classification

Type
C - Chapter in a specialist book
CEP classification
AI - Linguistics
OECD FORD branch
—

Result continuities

Project
<a href="/en/project/GAP406%2F10%2F0823" target="_blank" >GAP406/10/0823: 20th century private correspondence. Corpus sources extension, new possibilities of linguistic application</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

Publication year
2013
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

Book/collection name
Soukromá korespondence jako lingvistický pramen
ISBN
9788021061408
Number of pages of the result
13
Pages from-to
19-31
Number of pages of the book
188
Publisher name
Masarykova univerzita
Place of publication
Brno
UT code for WoS chapter
—

Similar results(10)

Corpus processing of corresponding texts: problems of morphological tagging Present-day Czech private correspondence in an electronic corpus Morphological tagging of KSK (Corpus of Private Corespondence)

What are you looking for?

Quick search

Smart search

Corpus processing of corresponding texts : problems of morphological tagging

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Data specific for result type

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Data specific for result type

Data specific for result type

Similar results(10)