Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Spelling-Aware Word-Based End-to-End ASR

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F22%3APU145323" target="_blank" >RIV/00216305:26230/22:PU145323 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://ieeexplore.ieee.org/document/9833231" target="_blank" >https://ieeexplore.ieee.org/document/9833231</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.1109/LSP.2022.3192199" target="_blank" >10.1109/LSP.2022.3192199</a>

Alternativní jazyky

  • Jazyk výsledku

    angličtina

  • Název v původním jazyce

    Spelling-Aware Word-Based End-to-End ASR

  • Popis výsledku v původním jazyce

    We propose a new end-to-end architecture for automatic speech recognition that expands the listen, attend and spell (LAS) paradigm. While the main word-predicting network is trained to predict words, the secondary, speller network, is optimized to predict word spellings from inner representations of the main network (e.g. word embeddings or context vectors from the attention module). We show that this joint training improves the word error rate of a word-based system and enables solving additional tasks, such as out-of-vocabulary word detection and recovery. The tests are conducted on LibriSpeech dataset consisting of 1000h of read speech.

  • Název v anglickém jazyce

    Spelling-Aware Word-Based End-to-End ASR

  • Popis výsledku anglicky

    We propose a new end-to-end architecture for automatic speech recognition that expands the listen, attend and spell (LAS) paradigm. While the main word-predicting network is trained to predict words, the secondary, speller network, is optimized to predict word spellings from inner representations of the main network (e.g. word embeddings or context vectors from the attention module). We show that this joint training improves the word error rate of a word-based system and enables solving additional tasks, such as out-of-vocabulary word detection and recovery. The tests are conducted on LibriSpeech dataset consisting of 1000h of read speech.

Klasifikace

  • Druh

    J<sub>imp</sub> - Článek v periodiku v databázi Web of Science

  • CEP obor

  • OECD FORD obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

Návaznosti výsledku

  • Projekt

    Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2022

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    IEEE SIGNAL PROCESSING LETTERS

  • ISSN

    1070-9908

  • e-ISSN

    1558-2361

  • Svazek periodika

    29

  • Číslo periodika v rámci svazku

    29

  • Stát vydavatele periodika

    US - Spojené státy americké

  • Počet stran výsledku

    5

  • Strana od-do

    1729-1733

  • Kód UT WoS článku

    000842088200001

  • EID výsledku v databázi Scopus

    2-s2.0-85135242842