Syntactic parser SET
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F12%3A00058274" target="_blank" >RIV/00216224:14330/12:00058274 - isvavai.cz</a>
Result on the web
<a href="http://nlp.fi.muni.cz/projects/set" target="_blank" >http://nlp.fi.muni.cz/projects/set</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Syntactic parser SET
Original language description
The SET (Syntactic Engineering Tool) project aims to develop a new approach to syntactic analysis of the natural languages. The new method is based on pattern matching linking rules. SET can be viewed as a tool for fast and efficient automatic syntacticanalysis of the Czech language and for development of rule-based formalisms for syntactic analysis of natural languages. The included formalisms are based on detection of important items in the input sentence and incremental segmentation of the sentence.
Czech name
—
Czech description
—
Classification
Type
R - Software
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Others
Publication year
2012
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
SET 0.6
Technical parameters
Univerzální syntaktický analyzátor přirozených jazyků s gramatikami pro angličtinu a češtinu. Implementace v jazyce Python. Licence: GNU General Public license. Odpovědná osoba pro jednání: doc. RNDr. Aleš Horák, Ph.D.; email: hales@fi.muni.cz; telefon:549496399; adresa: Aleš Horák, Fakulta informatiky Masarykovy univerzity, Botanická 68a, 602 00 Brno.
Economical parameters
Nástroj umožňuje definovat šablony pro automatickou analýzu vztahů mezi slovy (tedy na syntaktické rovině) a efektivně analyzovat textový vstup na základě těchto pravidel. Využívá se k lingvistickému značkování korpusů češtiny o velikosti stovek milionůslovních tvarů. Takováto anotace by jinak vyžadovala mnohaměsíční práci erudovaných lingvistů. Nástroj je rovněž základním prvkem systému pro extrakci informací, který je v současnosti vyvíjen a testován ve spolupráci s ministerstvem vnitra.
Owner IČO
00216224
Owner name
Masarykova univerzita