Potlačení zaujatosti lexikálního modelu v Hidden Vector State Parser
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000322" target="_blank" >RIV/49777513:23520/07:00000322 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Potlačení zaujatosti lexikálního modelu v Hidden Vector State Parser
Popis výsledku v původním jazyce
Tento článek popisuje implementaci statistického sémantického parseru pro omezenou doménu s malým počtem trénovacích dat. Implementovali jsme hidden vector state model. Model byl implementován v GMTK (graphical modeling toolkit). Do tohoto model jsme implementovali panalizaci za vložení konceptu. Lineární interpolace byla použita pro vyhlazení estimovaných pravděpodobností. Implementaci penalizace za vložení konceptu jsme testovali na korpusu z oblasti zodpovídání dotazí o odjezdech vlaků. Zjistili jsme, že penalizace za vloži konceptu signifikantně zlepšuje tento model. Přesnost základního systému byla zvíšena z 33.7% na 55.4%.
Název v anglickém jazyce
Prior of the Lexical model in the Hidden Vector State Parser
Popis výsledku anglicky
This paper describes an implementation of a statistical semantic parser for a closed domain with limited amount of training data. We implemented the hidden vector state model, which we present as a structure discrimination of a flat-concept model. The model was implemented in the graphical modeling toolkit. We introduced into the hidden vector state model a concept insertion penalty as a part of pattern recognition approach. In our model, the linear interpolation was used for both to deal with unseen words (unobserved input events) in training data and to smooth probabilities of the model. We evaluated the implementation of the concept insertion penalty in our model on a closed domain human-human train timetable dialogue corpus. We found that the concept insertion penalty was indispensable in our implementation of the hidden vector state model on the human-human train timetable dialogue corpus. Accuracy of the baseline system was increased from 33.7% to 55.4%.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/1M0567" target="_blank" >1M0567: Centrum aplikované kybernetiky</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2007
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 11th international conference "Speech and computer" SPECOM'2006
ISBN
5-7452-0074-X
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
94-99
Název nakladatele
Anatolya Publishers
Místo vydání
St. Petersburg
Místo konání akce
St. Petersburg
Datum konání akce
1. 1. 2006
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—