From Czech Morphology through Partial Parsing to Disambiguation
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F03%3A00008612" target="_blank" >RIV/00216224:14330/03:00008612 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
From Czech Morphology through Partial Parsing to Disambiguation
Popis výsledku v původním jazyce
This paper deals with a complex system of processing raw Czech texts. Several modules were implemented which perform different levels of processing. These modules can easily be incorporated into many other linguistic applications and some of them are already exploited in this way. The first level of processing raw texts represents a reliable morphological analysis -- we give a survey of the effective implementation of the robust morphological analyser for Czech named ajka. Texts tagged by ajka can be further processed by the partial parser Dis and its extension VaDis which is based on verb valencies. The output of these systems serves for automatic partial disambiguation of input texts.The tools described in this paper are widely used for parsing largecorpora and can be employed in the initial phase of semantic analysis.
Název v anglickém jazyce
From Czech Morphology through Partial Parsing to Disambiguation
Popis výsledku anglicky
This paper deals with a complex system of processing raw Czech texts. Several modules were implemented which perform different levels of processing. These modules can easily be incorporated into many other linguistic applications and some of them are already exploited in this way. The first level of processing raw texts represents a reliable morphological analysis -- we give a survey of the effective implementation of the robust morphological analyser for Czech named ajka. Texts tagged by ajka can be further processed by the partial parser Dis and its extension VaDis which is based on verb valencies. The output of these systems serves for automatic partial disambiguation of input texts.The tools described in this paper are widely used for parsing largecorpora and can be employed in the initial phase of semantic analysis.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2003
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Computational Linguistics and Intelligent Text Processing
ISBN
3-540-00532-3
ISSN
—
e-ISSN
—
Počet stran výsledku
10
Strana od-do
126
Název nakladatele
Springer-Verlag
Místo vydání
Berlin
Místo konání akce
February 2003, Mexico City, Mexico
Datum konání akce
1. 1. 2003
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—