Evaluation of Wav2Vec Speech Recognition for Speakers with Cognitive Disorders
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F22%3A43965701" target="_blank" >RIV/49777513:23520/22:43965701 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00064173:_____/22:43924075 RIV/00216208:11120/22:43924075 RIV/61384399:31140/22:00058688
Výsledek na webu
<a href="https://link.springer.com/chapter/10.1007/978-3-031-16270-1_41" target="_blank" >https://link.springer.com/chapter/10.1007/978-3-031-16270-1_41</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-031-16270-1_41" target="_blank" >10.1007/978-3-031-16270-1_41</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Evaluation of Wav2Vec Speech Recognition for Speakers with Cognitive Disorders
Popis výsledku v původním jazyce
In this paper, we present a spoken dialog system used for collecting data for future research in the field of dementia prediction from speech. The dialog system was used to collect the speech data of patients with mild cognitive deficits. The core task solved by the dialog system was the spoken description of the vivid shore picture for one minute. The patients also performed other simple speech-based tasks. All utterances were recorded and manually transcribed to obtain a ground-truth reference. We describe the architecture of the dialog system as well as the results of the first speech recognition experiments. The zero-shot Wav2Vec 2.0 speech recognizer was used and the recognition accuracy on word- and character-level was evaluated.
Název v anglickém jazyce
Evaluation of Wav2Vec Speech Recognition for Speakers with Cognitive Disorders
Popis výsledku anglicky
In this paper, we present a spoken dialog system used for collecting data for future research in the field of dementia prediction from speech. The dialog system was used to collect the speech data of patients with mild cognitive deficits. The core task solved by the dialog system was the spoken description of the vivid shore picture for one minute. The patients also performed other simple speech-based tasks. All utterances were recorded and manually transcribed to obtain a ground-truth reference. We describe the architecture of the dialog system as well as the results of the first speech recognition experiments. The zero-shot Wav2Vec 2.0 speech recognizer was used and the recognition accuracy on word- and character-level was evaluated.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech, and Dialogue 25th International Conference, TSD 2022, Brno, Czech Republic, September 6–9, 2022, Proceedings
ISBN
978-3-031-16269-5
ISSN
0302-9743
e-ISSN
1611-3349
Počet stran výsledku
12
Strana od-do
501-512
Název nakladatele
Springer International Publishing
Místo vydání
Cham
Místo konání akce
Brno, Czech Republic
Datum konání akce
6. 9. 2022
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—