Databáze řečových korpusů laryngektomických pacientů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957861" target="_blank" >RIV/49777513:23520/19:43957861 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb" target="_blank" >https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Databáze řečových korpusů laryngektomických pacientů
Popis výsledku v původním jazyce
Dokument popisuje výsledek TH02010307-V15 (Databáze řečových korpusů laryngektomických pacientů), který je plánovaným výsledkem projektu TA ČR TH02010307 „Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii“. Jde o databázi hlasů pacientů, kteří dali souhlas s uveřejněním svých nahrávek pořízených před výkonem totální laryngektomie (LET) nebo podobného chirurgického zákroku v oblasti krku a hlasivek. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA, SAMPA), hranice fónů (segmentace), okamžiky uzavření hlasivek (tzv. pitch-marky), atp., získané s přesností danou aktuálně použitými technologiemi (tj. bez ručních oprav). Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIN (clarin.eu) s omezením na využití v akademické sféře. Data mohou být zajímavá pro pracoviště zkoumající chování selhávajícího či jinak poškozeného hlasu (patologie hlasu apod.). Vzhledem k cílové skupině uživatelů (tj. především pacientů ORL pracovišť v ČR) jsou věty v českém jazyce. Nahrávky hlasů uživatelů (pacientů) tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Rekonstrukcí hlasu uživatele označujeme schopnost generovat původní hlas uživatele (v nejvyšší možné kvalitě a v identitě co nejvíce podobné původnímu hlasu) pomocí externího zařízení (tzv. syntetizéru řeči, resp. systému syntézy řeči z textu – TTS). Cílem je přitom generovat libovolnou řeč v daném hlase.
Název v anglickém jazyce
Database of speech corpora of Czech laryngectomy patients
Popis výsledku anglicky
The corpus contains Czech speech of laryngectomy patients recorded before a surgery causing their voice to be lost in order to preserve the voice which can be later used for personalized text-to-speech system. Individual utterances were selected from the language by a special algorithm to cover as much phonetic and prosodic features as possible
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/TH02010307" target="_blank" >TH02010307: Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
laryngo-corpusdb
Technické parametry
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. Korpus obsahuje data 3 řečníků, celkem 3980 vět. Data zahrnují audio nahrávky, pitch-marky, textové anotace, fonetickou transkripci, segmentaci a další informace. Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-3142. Bližší informace na https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb - Ing. Martin Grůber, Ph.D., nadřazené pracoviště: NTIS , E-mail: gruber@ntis.zcu.cz, Telefon: 37763 2512
Ekonomické parametry
Databáze řečových korpusů je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni