Vyhledávání informací v mluvených dokumentech
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F63839172%3A_____%2F06%3A00000337" target="_blank" >RIV/63839172:_____/06:00000337 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216305:26230/06:PU66847
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Information Retrieval from Spoken Documents
Popis výsledku v původním jazyce
This paper describes a designed and implemented system for efficient storage, indexing and search in collections of spoken documents that takes advantage of automatic speech recognition. As the quality of current speech recognizers is not sufficient fora great deal of applications, it is necessary to index the ambiguous output of the recognition, i.,e. the acyclic graphs of word hypotheses --- recognition lattices. Then, it is not possible to directly apply the standard methods known from text-based systems. The paper discusses an optimized indexing system for efficient search in the complex and large data structure that has been developed by our group. The search engine works as a server. The meeting browser JFerret, developed withing the European AMI project, is used as a client to browse search results.
Název v anglickém jazyce
Information Retrieval from Spoken Documents
Popis výsledku anglicky
This paper describes a designed and implemented system for efficient storage, indexing and search in collections of spoken documents that takes advantage of automatic speech recognition. As the quality of current speech recognizers is not sufficient fora great deal of applications, it is necessary to index the ambiguous output of the recognition, i.,e. the acyclic graphs of word hypotheses --- recognition lattices. Then, it is not possible to directly apply the standard methods known from text-based systems. The paper discusses an optimized indexing system for efficient search in the complex and large data structure that has been developed by our group. The search engine works as a server. The meeting browser JFerret, developed withing the European AMI project, is used as a client to browse search results.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JC - Počítačový hardware a software
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA102%2F05%2F0278" target="_blank" >GA102/05/0278: Nové směry ve výzkumu a využití hlasových technologií</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2006
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the Seventh International Conference on Intelligent Text Processing and Computational Linguistics (CICLING 2006)
ISBN
3-540-32205-1
ISSN
—
e-ISSN
—
Počet stran výsledku
6
Strana od-do
410-416
Název nakladatele
Springer-Verlag
Místo vydání
Berlin
Místo konání akce
Mexico City, Mexico
Datum konání akce
1. 1. 2006
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—