Power Networks Dialogs - Enhancing Domain-Specific Text Processing Techniques and Resources
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00024367" target="_blank" >RIV/00216224:14330/08:00024367 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Power Networks Dialogs - Enhancing Domain-Specific Text Processing Techniques and Resources
Original language description
In this paper, we describe the process of development of the analytical approaches adapted for the work with technical texts specialized at the domain of electrical power networks (EPN) topics. The process includes improving the quality of the EPN resources. The new data represent one of the largest domain specific corpora containing more than 5 million of text tokens. We show the details of building a new the large domain-specific corpus, its analysis and further processing such as filtering, morphological and syntactical analysis and phrase detection and present, how they help to improve the dialog system.
Czech name
Dialogy o elektrorozvodných sítích - rozšíření doménově specifických zdrojů a technik zpracování textu
Czech description
Článek popisuje rozvoj analytických přístupů pro práci s doménově specifickými daty (doména elektrorozvodných sítí). Představuje nově vytvořený doménově specifický korpus o velikosti 5 milionů slov a zabývá se jeho dalším jazykovým zpracováním na úrovnimorfologické a syntaktické.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of ELNET 2008
ISBN
978-80-248-1875-7
ISSN
—
e-ISSN
—
Number of pages
9
Pages from-to
—
Publisher name
Faculty of Electrical Engineering and Computer Science, VŠB - Technical University of Ostrava
Place of publication
Ostrava
Event location
Ostrava
Event date
Jan 1, 2008
Type of event by nationality
CST - Celostátní akce
UT code for WoS article
—