Spelling-Aware Word-Based End-to-End ASR

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F22%3APU145323" target="_blank" >RIV/00216305:26230/22:PU145323 - isvavai.cz</a>
Výsledek na webu
<a href="https://ieeexplore.ieee.org/document/9833231" target="_blank" >https://ieeexplore.ieee.org/document/9833231</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/LSP.2022.3192199" target="_blank" >10.1109/LSP.2022.3192199</a>

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Spelling-Aware Word-Based End-to-End ASR
Popis výsledku v původním jazyce
We propose a new end-to-end architecture for automatic speech recognition that expands the listen, attend and spell (LAS) paradigm. While the main word-predicting network is trained to predict words, the secondary, speller network, is optimized to predict word spellings from inner representations of the main network (e.g. word embeddings or context vectors from the attention module). We show that this joint training improves the word error rate of a word-based system and enables solving additional tasks, such as out-of-vocabulary word detection and recovery. The tests are conducted on LibriSpeech dataset consisting of 1000h of read speech.
Název v anglickém jazyce
Spelling-Aware Word-Based End-to-End ASR
Popis výsledku anglicky
We propose a new end-to-end architecture for automatic speech recognition that expands the listen, attend and spell (LAS) paradigm. While the main word-predicting network is trained to predict words, the secondary, speller network, is optimized to predict word spellings from inner representations of the main network (e.g. word embeddings or context vectors from the attention module). We show that this joint training improves the word error rate of a word-based system and enables solving additional tasks, such as out-of-vocabulary word detection and recovery. The tests are conducted on LibriSpeech dataset consisting of 1000h of read speech.

Klasifikace

Druh
J<sub>imp</sub> - Článek v periodiku v databázi Web of Science
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Název periodika
IEEE SIGNAL PROCESSING LETTERS
ISSN
1070-9908
e-ISSN
1558-2361
Svazek periodika
29
Číslo periodika v rámci svazku
29
Stát vydavatele periodika
US - Spojené státy americké
Počet stran výsledku
5
Strana od-do
1729-1733
Kód UT WoS článku
000842088200001
EID výsledku v databázi Scopus
2-s2.0-85135242842

Podobné výsledky(10)

Speech Enhancement Using End-to-End Speech Recognition Objectives Lexicon-based vs. Lexicon-free ASR for Norwegian Parliament Speech Transcription Hystoc: Obtaining Word Confidences for Fusion of End-To-End ASR Systems

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Spelling-Aware Word-Based End-to-End ASR

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)