ATCC: Pronunciation lexicon and n-gram counts for ASR modul
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F12%3A43917947" target="_blank" >RIV/49777513:23520/12:43917947 - isvavai.cz</a>
Result on the web
<a href="http://www.kky.zcu.cz/cs/sw/blp-atcc-lm4asr" target="_blank" >http://www.kky.zcu.cz/cs/sw/blp-atcc-lm4asr</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
ATCC: Pronunciation lexicon and n-gram counts for ASR modul
Original language description
Software-speech corpus contains dictionaries and statistics of words, word bigrams and trigrams obtained from transcriptions of pilot communication with air traffic controllers in different air traffic services (TWR, APP, ACC) Air Traffic Control. Recordings are manually annotated (transcribed with the addition of non-speech events - breaths, noise). The designations of origin (aircraft / control) is manualy determined. A total of 20.54 hours record format 8 kHz, 16 bit PCM, mono. Pronunciation dictionaries and words statistics are suitable for the construction of language model for automatic speech recognition system testing especially for noisy environments. The speech corpus is planned outcome of the project "Intelligent technology to improve air traffic safety", registration number TA01030476, and was created with the financial support of TA ČR.
Czech name
—
Czech description
—
Classification
Type
R - Software
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/TA01030476" target="_blank" >TA01030476: Intelligent technologies for improving air traffic security</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2012
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
blp-atcc-lm4asr
Technical parameters
Slovníky a jazykový model z komunikace pilot/řídící letového provozu vznikly v rámci řešení projektu TA01030476 a jsou k dispozici pro nekomerční účely. Distribuce nakladatelstvím LINDAT-Clarin, UFAL MFF UK, bližší informace viz http://www.kky.zcu.cz/cs/sw/blp-atcc-lm4asr
Economical parameters
Výsledek je plánovaným výstupem projektu TA01030476 Inteligentní technologie pro zvýšení bezpečnosti letového provozu. Slovníky a jazykový model slouží ke konstrukci a objektivnímu vyhodnocení přesnosti systému rozpoznávání řeči.
Owner IČO
49777513
Owner name
Západočeská univerzita v Plzni