Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43930519" target="_blank" >RIV/49777513:23520/16:43930519 - isvavai.cz</a>

  • Výsledek na webu

    <a href="http://www.kky.zcu.cz/cs/sw/ALIGN" target="_blank" >http://www.kky.zcu.cz/cs/sw/ALIGN</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy

  • Popis výsledku v původním jazyce

    Softwarový balíček ALIGN slouží k poloautomatickému zarovnání nahrávek s existujícími textovými přepisy. Časové zarovnání existujících přepisů poskytuje lepší vstupní data pro tvorbu databáze používané pro rychlé vyhledávání (tzv. index) než "klasické" rozpoznávání řeči pouze na základě řečového vstupu, které je pro tyto účely standardně využívané. Důvod je zřejmý - při zarovnávání existujících přepisů pouze generujeme chybějící časové značky, ale z principu zde nemůže dojít k chybnému rozpoznání vyřčeného slova. Zarovnané přepisy lze také využít jako trénovací data pro vývoj lepších modelů pro rozpoznávací systém. V obou výše uvedených bodech předpokládáme, že kvalita textového přepisu je dostatečná - tj. zejména musí jít o doslovný přepis, nikoliv pouze zestručnělé shrnutí obsahu promluvy.

  • Název v anglickém jazyce

    ALIGN - software for semi-automatic alignment of audio recordings with existing text transcripts

  • Popis výsledku anglicky

    ALIGN software package is used for semi-automatic alignment recordings with existing text transcripts. Time alignment of existing transcripts provides better input data for creation of the database used for quick search (so-called Index) than the "traditional" speech recognition using only the speech input, which is usually used for this purpos. The reason is obvious - when we align existing transcripts, we just generate missing time marks and thus it's impossible to introduce recognition errors. Aligned transcripts can also be used as training data for the development of better models for recognition. In both of the above cases, we assume that the quality of the text transcript is sufficient - i.e., in particular, we assume a verbatim transcript, not only a summary of the speech content.

Klasifikace

  • Druh

    R - Software

  • CEP obor

    AF - Dokumentace, knihovnictví, práce s informacemi

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/DG16P02B048" target="_blank" >DG16P02B048: Systém pro trvalé uchování dokumentace a prezentaci historických pramenů z období totalitních režimů</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2016

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    ALIGN

  • Technické parametry

    Akustický a jazykový model rozpoznávacího modulu byl natrénován na datech využívaných v průběhu projektu AMALACH (projekt č. DF12P01OVV022). Jde o přibližně 100 hodin pečlivě přepsaných rozhovorů s pamětníky Holokaustu, vedených v českém jazyce. Přepisy a nahrávky jsou zarovnány přibližně na úrovni jednotlivých vět, což je již pro trénování dostatečné - zarovnání na úroveň slov by vedlo k lepším výsledkům, ale při nutnosti ručního zpracování jde o příliš pracnou záležitost.

  • Ekonomické parametry

    Výsledek je plánovaným výstupem projektu DG16P02B048. Slouží k poloautomatickému zarovnání nahrávek s existujícími textovými přepisy.

  • IČO vlastníka výsledku

    49777513

  • Název vlastníka

    Západočeská univerzita v Plzni