Prototyp hlasového interaktivního systému
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F15%3A43927281" target="_blank" >RIV/49777513:23520/15:43927281 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Prototyp hlasového interaktivního systému
Popis výsledku v původním jazyce
Vyvinutá technologie hlasového interaktivního systému s modulem automatického rozpoznávání mluvené řeči slouží k vyhledávání relevantní informace ve velkých audiovizuálních archivech ať už hlasovou nebo psanou formou dialogu - v řešené úloze šlo o archivTV zpravodajských pořadů. Systém je schopen zpracovat mluvenou řeč uživatele a převést ji do textového zápisu a poskytnout uživateli požadovanou odpověď či provést vyžadovaný úkon (poskytnutí informace, provedení žádané akce). Hlasový interaktivní systém pracuje s modulem automatického rozpoznávání řeči (slovník větší než 1 mil slov), modulem počítačové syntézy řeči a dialogovým modulem pro inteligentní interakci. Systém umožňuje automaticky zpracovávat nové zpravodajské pořady. Vstupní audio řetězec je rozpoznán a indexován na slovní a fonetické úrovni. Je využita moderní technologie Docker a dokumentová databáze MongoDB. Interaktivní dialogový systém využívá webové rozhraní HTML5 pro textový vstup v kombinaci s technologií WebRTC, kt
Název v anglickém jazyce
Prototype of the voice interactive system
Popis výsledku anglicky
The developed technology voice interactive system with a module of automatic speech recognition is able to search for the relevant information in large audiovisual archives, whether voice or written form of dialogue - the task domain was an archive of TVnews programs. The system is able to recognize the user's speech and convert it into a text form and provide the user with the desired answer or make a required action (providing information, performing the desired action). The voice interactive systemuses automatic speech recognition module (dictionary of more than one million words), the speech synthesis module and dialog module for intelligent interaction. The system can automatically handle new news programs. The audio input stream is recognized and indexed on verbal and phonetic level. We use modern technology Docker and document database MongoDB. Interactive dialogue system uses HTML5 web interface for the text input in combination with the WebRTC technology, which enables the v
Klasifikace
Druh
Z<sub>polop</sub> - Poloprovoz
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TE01020197" target="_blank" >TE01020197: Centrum aplikované kybernetiky 3</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
ZCU/KKY/2015/015
Číselná identifikace
—
Technické parametry
Poloprovoz je testován Media Tenor, spol. s r.o. Pobřežní 249/46 186 00 Praha 8 IČ 25901800, info Ing. Luděk Müller (Ludek.Muller@speechtech.cz). Pro získání licence je nutný souhlas autorů systému. Uzavřena smlouva s TA ČR (IČ: 72050365) č. 2012TE01020197.
Ekonomické parametry
Poloprovoz umožňuje interaktivní vyhledávání v rozsáhlých audiovizuálních archivech získaných automatickou indexací na textové a fonetické úrovni.
Kategorie aplik. výsledku dle nákladů
—
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni; SpeechTech, s.r.o.
Stát vlastníka
CZ - Česká republika
Druh možnosti využití
A - K využití výsledku jiným subjektem je vždy nutné nabytí licence
Požadavek na licenční poplatek
Z - Poskytovatel licence na výsledek nepožaduje v některých případech licenční poplatek
Adresa www stránky s výsledkem
—