Korpus pečlivě artikulované řeči
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F23%3A43970900" target="_blank" >RIV/49777513:23520/23:43970900 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/25347659:_____/23:N0000009
Výsledek na webu
<a href="https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-5331" target="_blank" >https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-5331</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Korpus pečlivě artikulované řeči
Popis výsledku v původním jazyce
Jde o databázi dvou hlasů, mužského a ženského, které byly nahrány nadstandardně pečlivou výslovností. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA a X-SAMPA), hranice fónů (fonetická segmentace), trvání jednotlivých fónů a časové průběhy základní hlasivkové frekvence v jednotlivých nahrávkách. Všechny uvedené charakteristiky byly získány automaticky, tedy bez ručních oprav, s přesností danou aktuálně použitými technologiemi. Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIAH-CZ (https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-5331) s omezením na využití v akademické sféře. Pečlivá výslovnost je důležitá např. pro posluchače se sluchovým postižením nebo při výuce cizích jazyků. Tato data mohou být použita pro výzkum v oblasti vzdělávání s využitím řečových technologií, kde vysoká srozumitelnost je často klíčový předpoklad úspěšné využitelnosti. Data mohou být rovněž všeobecně zajímavá pro pracoviště zabývající se fonetickými a artikulačními vlastnostmi mluvené řeči.
Název v anglickém jazyce
Corpus of precisely articulated Czech speech
Popis výsledku anglicky
The corpus contains speech data of 2 Czech native speakers, male and female. The speech is very precisely articulated up to hyper-articulated, and the speech rate is low. The speech data with a highlighted articulation is suitable for teaching foreigners the Czech language, and it can also be used for people with hearing or speech impairment. The recorded sentences can be used either directly, e.g., as a part of educational material, or as source data for building complex educational systems incorporating speech synthesis technology. All recorded sentences were precisely orthographically annotated and phonetically segmented, i.e., split into phones, using modern neural network-based methods.
Klasifikace
Druh
A - Audiovizuální tvorba
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/TL05000546" target="_blank" >TL05000546: Využití multimediálního výkladového slovníku pro moderní výuku češtiny</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
ISBN
—
Místo vydání
—
Název nakladatele resp. objednatele
—
Verze
—
Identifikační číslo nosiče
—