Creation of a corpus of training sentences based on automated dialogue analysis
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F01%3A00065256" target="_blank" >RIV/49777513:23520/01:00065256 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Creation of a corpus of training sentences based on automated dialogue analysis
Popis výsledku v původním jazyce
The paper describes an attempt to create the training sentence templates automatically, using a special program package implementing an expecially developed method of a quantitative linguistic analysis of transcribed real dialogues. Firstly, the programpackage generates a set of formulas (templates) consisting of elements of a special grammar and describing the syntatic structure of required sentences. Secondly, it generates a large corpus of unique training sentences using the sentence templates and astochastic context-free grammar. The experimentally created corpus was used for the training of modules of a city information dialogue system.
Název v anglickém jazyce
Creation of a corpus of training sentences based on automated dialogue analysis
Popis výsledku anglicky
The paper describes an attempt to create the training sentence templates automatically, using a special program package implementing an expecially developed method of a quantitative linguistic analysis of transcribed real dialogues. Firstly, the programpackage generates a set of formulas (templates) consisting of elements of a special grammar and describing the syntatic structure of required sentences. Secondly, it generates a large corpus of unique training sentences using the sentence templates and astochastic context-free grammar. The experimentally created corpus was used for the training of modules of a city information dialogue system.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2001
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Creation of a corpus of training sentences based on automated dialogue analysis
ISBN
—
ISSN
—
e-ISSN
—
Počet stran výsledku
9
Strana od-do
—
Název nakladatele
Neuveden
Místo vydání
Neuveden
Místo konání akce
Neuveden
Datum konání akce
1. 1. 2001
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—