The Extraction of Terms Consisting of Several Words from Texts in Natural Languages Using the Syntactic Patterns IN NATURAL LANGUAGES USING THE SYNTACTIC PATTERNS
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A90101%2F21%3A10442050" target="_blank" >RIV/00216208:90101/21:10442050 - isvavai.cz</a>
Výsledek na webu
<a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=TS3wKvdkq" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=TS3wKvdkq</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
ruština
Název v původním jazyce
Podchod K Izvlečeniju Mnogoslovnych Terminov Iz Tekstov Na Estestvennom Jazyke S Primeneniem Sintaksičeskich Šablonov
Popis výsledku v původním jazyce
Pri rešenii zadači izvlečenija mnogoslovnych terminov na osnove lingvističeskich metodov analiza tekstov voznikaet sledujuščaja problema: ekspert-lingvist ne obladaet navykami v oblasti razrabotki programmnych sistem, no ot nego trebuetsja predstavlenie svoich znanij v vide fragmentov programmnoj sistemy ili nekotorych konstrukcij na opredelennom formalnom jazyke. S drugoj storony, razrabotčiki programmnych sistem v bolšinstve slučaev ne obladajut neobchodimymi kompetencijami v lingvistike. Dannoe obstojatelstvo poroždaet semantičeskij razryv meždu metodami lingvističeskogo analiza tekstov i ich predstavleniem v vide programmnoj realizacii. V dannoj rabote predstavlen podchod k izvlečeniju mnogoslovnych terminov na osnove sintaksičeskich šablonov, otličajuščijsja adaptaciej na rabotu s lingvistom i ne trebujuščij ot lingvista dopolnitelnych navykov i znanij ispolzovanija različnych jazykov opisanija sintaksičeskich šablonov.Byl razrabotan prototip programmnoj sistemy, pozvoljajuščij polzovatelju opisyvat sintaksičeskie šablony bez znanija formalnogo jazyka. Takže razrabotannaja programmnaja sistema otličaetsja ot analogov naličiem vozmožnosti ispolzovanija sintaksičeskich šablonov vo vnešnich sistemach dlja analiza tekstov. Servernaja čast prototipa programmnoj sistemy imeet programmnyj interfejs dlja vypolnenija sintaksičeskich šablonov.
Název v anglickém jazyce
The Extraction of Terms Consisting of Several Words from Texts in Natural Languages Using the Syntactic Patterns IN NATURAL LANGUAGES USING THE SYNTACTIC PATTERNS
Popis výsledku anglicky
Two problems arise when extracting terms consisting of several words using linguistic methods of text analysis: 1. A linguist has no skills in software systems development, however he (she) is required to present his (her) knowledge in the form of software system fragments or constructions in a formal language. 2. Most software developers are not qualified enough in linguistics. This problem creates a semantic gap between the methods of linguistic analysis of texts and their software implementation. The article presents an approach to extract the terms consisting of several words based on syntactic patterns tailored for a linguist. The proposed approach does not require additional skills and usage of various languages to describe syntactic patterns by a linguist. The prototype of the software system was developed. The software system allows describing syntactic patterns without having knowledge of a formal language. Moreover, as against the analogs the developed system is capable to use syntactic patterns in external systems for text analysis. The server of the prototype has an interface to make the syntactic patterns.
Klasifikace
Druh
J<sub>ost</sub> - Ostatní články v recenzovaných periodicích
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
—
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název periodika
Avtomatizacija processov upravlenija
ISSN
1991-2927
e-ISSN
—
Svazek periodika
65
Číslo periodika v rámci svazku
3
Stát vydavatele periodika
RU - Ruská federace
Počet stran výsledku
9
Strana od-do
87-95
Kód UT WoS článku
—
EID výsledku v databázi Scopus
—