Extraction of Syntactic Structures Based on the Czech Parser Synt
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00024368" target="_blank" >RIV/00216224:14330/08:00024368 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Extraction of Syntactic Structures Based on the Czech Parser Synt
Original language description
In this paper we describe the usage of the syntactic parser Synt to gain information about syntactic structures (such as noun or verb phrases) of common sentences in Czech. These structures are from the analysis point of view usually identical to nonterminals in the grammar used by the parser to find possible valid derivations of the given sentence. The parser has been extended in such a way that enables its highly ambiguous output to be used for extracting those syntactic structures unambiguously and gives several ways how to identify them. To achieve this, some previously unused results of syntactic analysis have been evolved leading to more precise morphological analysis and hence also deeper distinction among various syntactic (sub)structures. Finally, we present an application for shallow valency extraction.
Czech name
Extrakce synaktických struktur na základě analyzátoru češtiny Synt
Czech description
Článek popisuje využití syntaktického analyzátoru Synt k získání informací o syntaktických strukturách z běžného českého textu. Tyto struktury z pohledu analýzy zpravidla odpovídají neterminálům v gramatice využívané parserem k nalezení platných odvozenízadané věty. Tento parser byl rozšířen tak, aby nabízel několik způsobů, jak využít jeho masivně víceznačný výstup k jednoznačné extrakci syntaktických struktur. Za tímto účelem byly zapojeny i některé dosud nevyužité výsledky syntaktické analýzy vedoucí ke zpřesnění morfologické analýzy a tím i k většímu rozlišení různých syntaktických (pod)struktur. Závěrem je představeno využití pro hrubou extrakci slovesných valencí.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of Recent Advances in Slavonic Natural Language Processing 2008
ISBN
978-80-210-4741-9
ISSN
—
e-ISSN
—
Number of pages
7
Pages from-to
—
Publisher name
Masaryk University
Place of publication
Brno
Event location
Karlova Studánka, Czech Republic
Event date
Jan 1, 2008
Type of event by nationality
CST - Celostátní akce
UT code for WoS article
—