ATCC: Pronunciation lexicon and n-gram counts for ASR modul
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F12%3A43917947" target="_blank" >RIV/49777513:23520/12:43917947 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.kky.zcu.cz/cs/sw/blp-atcc-lm4asr" target="_blank" >http://www.kky.zcu.cz/cs/sw/blp-atcc-lm4asr</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
ATCC: Pronunciation lexicon and n-gram counts for ASR modul
Popis výsledku v původním jazyce
Software-speech corpus contains dictionaries and statistics of words, word bigrams and trigrams obtained from transcriptions of pilot communication with air traffic controllers in different air traffic services (TWR, APP, ACC) Air Traffic Control. Recordings are manually annotated (transcribed with the addition of non-speech events - breaths, noise). The designations of origin (aircraft / control) is manualy determined. A total of 20.54 hours record format 8 kHz, 16 bit PCM, mono. Pronunciation dictionaries and words statistics are suitable for the construction of language model for automatic speech recognition system testing especially for noisy environments. The speech corpus is planned outcome of the project "Intelligent technology to improve air traffic safety", registration number TA01030476, and was created with the financial support of TA ČR.
Název v anglickém jazyce
ATCC: Pronunciation lexicon and n-gram counts for ASR modul
Popis výsledku anglicky
Software-speech corpus contains dictionaries and statistics of words, word bigrams and trigrams obtained from transcriptions of pilot communication with air traffic controllers in different air traffic services (TWR, APP, ACC) Air Traffic Control. Recordings are manually annotated (transcribed with the addition of non-speech events - breaths, noise). The designations of origin (aircraft / control) is manualy determined. A total of 20.54 hours record format 8 kHz, 16 bit PCM, mono. Pronunciation dictionaries and words statistics are suitable for the construction of language model for automatic speech recognition system testing especially for noisy environments. The speech corpus is planned outcome of the project "Intelligent technology to improve air traffic safety", registration number TA01030476, and was created with the financial support of TA ČR.
Klasifikace
Druh
R - Software
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA01030476" target="_blank" >TA01030476: Inteligentní technologie pro zvýšení bezpečnosti letového provozu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
blp-atcc-lm4asr
Technické parametry
Slovníky a jazykový model z komunikace pilot/řídící letového provozu vznikly v rámci řešení projektu TA01030476 a jsou k dispozici pro nekomerční účely. Distribuce nakladatelstvím LINDAT-Clarin, UFAL MFF UK, bližší informace viz http://www.kky.zcu.cz/cs/sw/blp-atcc-lm4asr
Ekonomické parametry
Výsledek je plánovaným výstupem projektu TA01030476 Inteligentní technologie pro zvýšení bezpečnosti letového provozu. Slovníky a jazykový model slouží ke konstrukci a objektivnímu vyhodnocení přesnosti systému rozpoznávání řeči.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni