Parameterization of the Input in Training the HVS Semantic Parser
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000341" target="_blank" >RIV/49777513:23520/07:00000341 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Parameterization of the Input in Training the HVS Semantic Parser
Original language description
The aim of this paper is to present an extension of the hidden vector state semantic parser. First, we describe the statistical semantic parsing and its decomposition into the semantic and the lexical model. Subsequently, we present the original hidden vector state parser. Then, we modify its lexical model so that it supports the use of the input sequence of feature vectors instead of the sequence of words. We compose the feature vector from the automatically generated linguistic features (lemma form and morphological tag of the original word). We also examine the effect of including the original word into the feature vector. Finally, we evaluate the modified semantic parser on the Czech Human-Human train timetable corpus. We found that the performanceof the semantic parser improved significantly compared with the baseline hidden vector state parser.
Czech name
Parametrizace vstupu při trénování HVS sémantického parseru
Czech description
Cílem tohoto článku je popis rozšíření původního sémantického parseru se skrytým stavovým vektorem. Nejprve je popsáno statistické sémantické parsování a jeho dekompozice na sémantický a lexikální model. Následně popisujeme původní parser se skrytým stavovým vektorem. Poté popisujeme modifikaci jeho lexikálního modelu tak, že je možné na vstupu parseru použít posloupnost příznakových vektorů namísto posloupnosti slov. Příznakové vektory vytváříme na základě automaticky generovaných lingvistických příznaků (lemma a morfologická značka původního slova). Rovněž popisujeme vliv zahrnutí původního slova do příznakového vektoru. Na závěr práce vyhodnocujeme modifikovaný sémantický parser na českém korpusu obsahujícím dialogy týkající se příjezdů a odjezdů vlaků. Přesnost sémantického parseru vzrostla statisticky významným způsobem v porovnání s výchozím systémem ? původním parserem se skrytým stavovým vektorem.
Classification
Type
D - Article in proceedings
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/1M0567" target="_blank" >1M0567: Centre for Applied Cybernetics</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Lecture Notes in Artificial Intelligence
ISBN
978-3-540-74627-0
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
—
Publisher name
Springer
Place of publication
Berlin
Event location
Pilsen
Event date
Sep 7, 2007
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
000251315900053