Syntactic parser SET
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F12%3A00058274" target="_blank" >RIV/00216224:14330/12:00058274 - isvavai.cz</a>
Výsledek na webu
<a href="http://nlp.fi.muni.cz/projects/set" target="_blank" >http://nlp.fi.muni.cz/projects/set</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Syntactic parser SET
Popis výsledku v původním jazyce
The SET (Syntactic Engineering Tool) project aims to develop a new approach to syntactic analysis of the natural languages. The new method is based on pattern matching linking rules. SET can be viewed as a tool for fast and efficient automatic syntacticanalysis of the Czech language and for development of rule-based formalisms for syntactic analysis of natural languages. The included formalisms are based on detection of important items in the input sentence and incremental segmentation of the sentence.
Název v anglickém jazyce
Syntactic parser SET
Popis výsledku anglicky
The SET (Syntactic Engineering Tool) project aims to develop a new approach to syntactic analysis of the natural languages. The new method is based on pattern matching linking rules. SET can be viewed as a tool for fast and efficient automatic syntacticanalysis of the Czech language and for development of rule-based formalisms for syntactic analysis of natural languages. The included formalisms are based on detection of important items in the input sentence and incremental segmentation of the sentence.
Klasifikace
Druh
R - Software
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
SET 0.6
Technické parametry
Univerzální syntaktický analyzátor přirozených jazyků s gramatikami pro angličtinu a češtinu. Implementace v jazyce Python. Licence: GNU General Public license. Odpovědná osoba pro jednání: doc. RNDr. Aleš Horák, Ph.D.; email: hales@fi.muni.cz; telefon:549496399; adresa: Aleš Horák, Fakulta informatiky Masarykovy univerzity, Botanická 68a, 602 00 Brno.
Ekonomické parametry
Nástroj umožňuje definovat šablony pro automatickou analýzu vztahů mezi slovy (tedy na syntaktické rovině) a efektivně analyzovat textový vstup na základě těchto pravidel. Využívá se k lingvistickému značkování korpusů češtiny o velikosti stovek milionůslovních tvarů. Takováto anotace by jinak vyžadovala mnohaměsíční práci erudovaných lingvistů. Nástroj je rovněž základním prvkem systému pro extrakci informací, který je v současnosti vyvíjen a testován ve spolupráci s ministerstvem vnitra.
IČO vlastníka výsledku
00216224
Název vlastníka
Masarykova univerzita