Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Potlačení zaujatosti lexikálního modelu v Hidden Vector State Parser

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000322" target="_blank" >RIV/49777513:23520/07:00000322 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Potlačení zaujatosti lexikálního modelu v Hidden Vector State Parser

  • Popis výsledku v původním jazyce

    Tento článek popisuje implementaci statistického sémantického parseru pro omezenou doménu s malým počtem trénovacích dat. Implementovali jsme hidden vector state model. Model byl implementován v GMTK (graphical modeling toolkit). Do tohoto model jsme implementovali panalizaci za vložení konceptu. Lineární interpolace byla použita pro vyhlazení estimovaných pravděpodobností. Implementaci penalizace za vložení konceptu jsme testovali na korpusu z oblasti zodpovídání dotazí o odjezdech vlaků. Zjistili jsme, že penalizace za vloži konceptu signifikantně zlepšuje tento model. Přesnost základního systému byla zvíšena z 33.7% na 55.4%.

  • Název v anglickém jazyce

    Prior of the Lexical model in the Hidden Vector State Parser

  • Popis výsledku anglicky

    This paper describes an implementation of a statistical semantic parser for a closed domain with limited amount of training data. We implemented the hidden vector state model, which we present as a structure discrimination of a flat-concept model. The model was implemented in the graphical modeling toolkit. We introduced into the hidden vector state model a concept insertion penalty as a part of pattern recognition approach. In our model, the linear interpolation was used for both to deal with unseen words (unobserved input events) in training data and to smooth probabilities of the model. We evaluated the implementation of the concept insertion penalty in our model on a closed domain human-human train timetable dialogue corpus. We found that the concept insertion penalty was indispensable in our implementation of the hidden vector state model on the human-human train timetable dialogue corpus. Accuracy of the baseline system was increased from 33.7% to 55.4%.

Klasifikace

  • Druh

    D - Stať ve sborníku

  • CEP obor

    JD - Využití počítačů, robotika a její aplikace

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/1M0567" target="_blank" >1M0567: Centrum aplikované kybernetiky</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2007

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název statě ve sborníku

    Proceedings of the 11th international conference "Speech and computer" SPECOM'2006

  • ISBN

    5-7452-0074-X

  • ISSN

  • e-ISSN

  • Počet stran výsledku

    6

  • Strana od-do

    94-99

  • Název nakladatele

    Anatolya Publishers

  • Místo vydání

    St. Petersburg

  • Místo konání akce

    St. Petersburg

  • Datum konání akce

    1. 1. 2006

  • Typ akce podle státní příslušnosti

    WRD - Celosvětová akce

  • Kód UT WoS článku