Dialogy o elektrorozvodných sítích - rozšíření doménově specifických zdrojů a technik zpracování textu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00024367" target="_blank" >RIV/00216224:14330/08:00024367 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Power Networks Dialogs - Enhancing Domain-Specific Text Processing Techniques and Resources
Popis výsledku v původním jazyce
In this paper, we describe the process of development of the analytical approaches adapted for the work with technical texts specialized at the domain of electrical power networks (EPN) topics. The process includes improving the quality of the EPN resources. The new data represent one of the largest domain specific corpora containing more than 5 million of text tokens. We show the details of building a new the large domain-specific corpus, its analysis and further processing such as filtering, morphological and syntactical analysis and phrase detection and present, how they help to improve the dialog system.
Název v anglickém jazyce
Power Networks Dialogs - Enhancing Domain-Specific Text Processing Techniques and Resources
Popis výsledku anglicky
In this paper, we describe the process of development of the analytical approaches adapted for the work with technical texts specialized at the domain of electrical power networks (EPN) topics. The process includes improving the quality of the EPN resources. The new data represent one of the largest domain specific corpora containing more than 5 million of text tokens. We show the details of building a new the large domain-specific corpus, its analysis and further processing such as filtering, morphological and syntactical analysis and phrase detection and present, how they help to improve the dialog system.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of ELNET 2008
ISBN
978-80-248-1875-7
ISSN
—
e-ISSN
—
Počet stran výsledku
9
Strana od-do
—
Název nakladatele
Faculty of Electrical Engineering and Computer Science, VŠB - Technical University of Ostrava
Místo vydání
Ostrava
Místo konání akce
Ostrava
Datum konání akce
1. 1. 2008
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—