ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43930519" target="_blank" >RIV/49777513:23520/16:43930519 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.kky.zcu.cz/cs/sw/ALIGN" target="_blank" >http://www.kky.zcu.cz/cs/sw/ALIGN</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy
Popis výsledku v původním jazyce
Softwarový balíček ALIGN slouží k poloautomatickému zarovnání nahrávek s existujícími textovými přepisy. Časové zarovnání existujících přepisů poskytuje lepší vstupní data pro tvorbu databáze používané pro rychlé vyhledávání (tzv. index) než "klasické" rozpoznávání řeči pouze na základě řečového vstupu, které je pro tyto účely standardně využívané. Důvod je zřejmý - při zarovnávání existujících přepisů pouze generujeme chybějící časové značky, ale z principu zde nemůže dojít k chybnému rozpoznání vyřčeného slova. Zarovnané přepisy lze také využít jako trénovací data pro vývoj lepších modelů pro rozpoznávací systém. V obou výše uvedených bodech předpokládáme, že kvalita textového přepisu je dostatečná - tj. zejména musí jít o doslovný přepis, nikoliv pouze zestručnělé shrnutí obsahu promluvy.
Název v anglickém jazyce
ALIGN - software for semi-automatic alignment of audio recordings with existing text transcripts
Popis výsledku anglicky
ALIGN software package is used for semi-automatic alignment recordings with existing text transcripts. Time alignment of existing transcripts provides better input data for creation of the database used for quick search (so-called Index) than the "traditional" speech recognition using only the speech input, which is usually used for this purpos. The reason is obvious - when we align existing transcripts, we just generate missing time marks and thus it's impossible to introduce recognition errors. Aligned transcripts can also be used as training data for the development of better models for recognition. In both of the above cases, we assume that the quality of the text transcript is sufficient - i.e., in particular, we assume a verbatim transcript, not only a summary of the speech content.

Klasifikace

Druh
R - Software
CEP obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD obor
—

Návaznosti výsledku

Projekt
<a href="/cs/project/DG16P02B048" target="_blank" >DG16P02B048: Systém pro trvalé uchování dokumentace a prezentaci historických pramenů z období totalitních režimů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Interní identifikační kód produktu
ALIGN
Technické parametry
Akustický a jazykový model rozpoznávacího modulu byl natrénován na datech využívaných v průběhu projektu AMALACH (projekt č. DF12P01OVV022). Jde o přibližně 100 hodin pečlivě přepsaných rozhovorů s pamětníky Holokaustu, vedených v českém jazyce. Přepisy a nahrávky jsou zarovnány přibližně na úrovni jednotlivých vět, což je již pro trénování dostatečné - zarovnání na úroveň slov by vedlo k lepším výsledkům, ale při nutnosti ručního zpracování jde o příliš pracnou záležitost.
Ekonomické parametry
Výsledek je plánovaným výstupem projektu DG16P02B048. Slouží k poloautomatickému zarovnání nahrávek s existujícími textovými přepisy.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni

Podobné výsledky(10)

Text-to-Speech Alignment for Imperfect Transcriptions Automatic speech segmentation based on alignment with a text-to-speech system.Data Alignment and Duration Modelling in VITS

Co hledáte?

Rychlé hledání

Chytré vyhledávání

ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)