O segmentaci českých vět
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F06%3A10077913" target="_blank" >RIV/00216208:11320/06:10077913 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
O segmentaci českých vět
Popis výsledku v původním jazyce
Příspěvek zavádí pojem (větného) segmentu, jednotky, která je lingvisticky motivovaná a přitom snadno automaticky rozpoznatelná. Rozpoznání segmentů umožňuje určovat segmentační strukturu věty (reprezentovanou segmentačním schématem), na jejímž základě lze vymezit jednotlivé klauze souvětí a jejich vzájemný vztah, a tím i syntaktickou strukturu souvětí. Metoda segmentace je navržena pro automatické zpracování češtiny, jazyka s relativně velmi volným slovosledem. V příspěvku je dále popsána sada jednoduchých pravidel, která je využita pro budování segmentačních schémat. Výsledky segmentace jsou vyhodnoceny vzhledem k malému ručně anotovanému korpusu českých vět.
Název v anglickém jazyce
On segmentation of Czech sentences
Popis výsledku anglicky
On segmentation of Czech sentences. The paper introduces a concept of segments, linguistically motivated and easily detectable language units. These segments may be subsequently combined into clauses and thus provide a structure of a complex sentence with regard to the mutual relationship of individual clauses. The method has been developed for Czech as a language representing languages with relatively high degree of word-order freedom. The paper introduces important terms and describes a segmentation chart. It also contains a simple set of rules applied for the segmentation of a small set of Czech sentences. The segmentation results are evaluated against a small hand-annotated corpus of Czech complex sentences.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/1ET100300517" target="_blank" >1ET100300517: Metody inteligentních systémů a jejich aplikace při dobývání znalostí a zpracování přirozeného jazyka</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of ITAT 2006 (Information Technologies - Application and Theory)
ISBN
80-969184-4-3
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
—
Název nakladatele
Univerzita Pavla Jozefa Šafárika, Košice, Slovakia
Místo vydání
Košice, Slovakia
Místo konání akce
Bystrá dolina, Nízke Tatry, Slovakia
Datum konání akce
26. 9. 2006
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—