ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F16%3A43930519" target="_blank" >RIV/49777513:23520/16:43930519 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.kky.zcu.cz/cs/sw/ALIGN" target="_blank" >http://www.kky.zcu.cz/cs/sw/ALIGN</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
ALIGN - software pro podporu poloautomatického zarovnání nahrávek s existujícími přepisy
Popis výsledku v původním jazyce
Softwarový balíček ALIGN slouží k poloautomatickému zarovnání nahrávek s existujícími textovými přepisy. Časové zarovnání existujících přepisů poskytuje lepší vstupní data pro tvorbu databáze používané pro rychlé vyhledávání (tzv. index) než "klasické" rozpoznávání řeči pouze na základě řečového vstupu, které je pro tyto účely standardně využívané. Důvod je zřejmý - při zarovnávání existujících přepisů pouze generujeme chybějící časové značky, ale z principu zde nemůže dojít k chybnému rozpoznání vyřčeného slova. Zarovnané přepisy lze také využít jako trénovací data pro vývoj lepších modelů pro rozpoznávací systém. V obou výše uvedených bodech předpokládáme, že kvalita textového přepisu je dostatečná - tj. zejména musí jít o doslovný přepis, nikoliv pouze zestručnělé shrnutí obsahu promluvy.
Název v anglickém jazyce
ALIGN - software for semi-automatic alignment of audio recordings with existing text transcripts
Popis výsledku anglicky
ALIGN software package is used for semi-automatic alignment recordings with existing text transcripts. Time alignment of existing transcripts provides better input data for creation of the database used for quick search (so-called Index) than the "traditional" speech recognition using only the speech input, which is usually used for this purpos. The reason is obvious - when we align existing transcripts, we just generate missing time marks and thus it's impossible to introduce recognition errors. Aligned transcripts can also be used as training data for the development of better models for recognition. In both of the above cases, we assume that the quality of the text transcript is sufficient - i.e., in particular, we assume a verbatim transcript, not only a summary of the speech content.
Klasifikace
Druh
R - Software
CEP obor
AF - Dokumentace, knihovnictví, práce s informacemi
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/DG16P02B048" target="_blank" >DG16P02B048: Systém pro trvalé uchování dokumentace a prezentaci historických pramenů z období totalitních režimů</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
ALIGN
Technické parametry
Akustický a jazykový model rozpoznávacího modulu byl natrénován na datech využívaných v průběhu projektu AMALACH (projekt č. DF12P01OVV022). Jde o přibližně 100 hodin pečlivě přepsaných rozhovorů s pamětníky Holokaustu, vedených v českém jazyce. Přepisy a nahrávky jsou zarovnány přibližně na úrovni jednotlivých vět, což je již pro trénování dostatečné - zarovnání na úroveň slov by vedlo k lepším výsledkům, ale při nutnosti ručního zpracování jde o příliš pracnou záležitost.
Ekonomické parametry
Výsledek je plánovaným výstupem projektu DG16P02B048. Slouží k poloautomatickému zarovnání nahrávek s existujícími textovými přepisy.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni