Database of speech corpora of Czech laryngectomy patients
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957861" target="_blank" >RIV/49777513:23520/19:43957861 - isvavai.cz</a>
Result on the web
<a href="https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb" target="_blank" >https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Databáze řečových korpusů laryngektomických pacientů
Original language description
Dokument popisuje výsledek TH02010307-V15 (Databáze řečových korpusů laryngektomických pacientů), který je plánovaným výsledkem projektu TA ČR TH02010307 „Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii“. Jde o databázi hlasů pacientů, kteří dali souhlas s uveřejněním svých nahrávek pořízených před výkonem totální laryngektomie (LET) nebo podobného chirurgického zákroku v oblasti krku a hlasivek. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA, SAMPA), hranice fónů (segmentace), okamžiky uzavření hlasivek (tzv. pitch-marky), atp., získané s přesností danou aktuálně použitými technologiemi (tj. bez ručních oprav). Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIN (clarin.eu) s omezením na využití v akademické sféře. Data mohou být zajímavá pro pracoviště zkoumající chování selhávajícího či jinak poškozeného hlasu (patologie hlasu apod.). Vzhledem k cílové skupině uživatelů (tj. především pacientů ORL pracovišť v ČR) jsou věty v českém jazyce. Nahrávky hlasů uživatelů (pacientů) tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Rekonstrukcí hlasu uživatele označujeme schopnost generovat původní hlas uživatele (v nejvyšší možné kvalitě a v identitě co nejvíce podobné původnímu hlasu) pomocí externího zařízení (tzv. syntetizéru řeči, resp. systému syntézy řeči z textu – TTS). Cílem je přitom generovat libovolnou řeč v daném hlase.
Czech name
Databáze řečových korpusů laryngektomických pacientů
Czech description
Dokument popisuje výsledek TH02010307-V15 (Databáze řečových korpusů laryngektomických pacientů), který je plánovaným výsledkem projektu TA ČR TH02010307 „Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii“. Jde o databázi hlasů pacientů, kteří dali souhlas s uveřejněním svých nahrávek pořízených před výkonem totální laryngektomie (LET) nebo podobného chirurgického zákroku v oblasti krku a hlasivek. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA, SAMPA), hranice fónů (segmentace), okamžiky uzavření hlasivek (tzv. pitch-marky), atp., získané s přesností danou aktuálně použitými technologiemi (tj. bez ručních oprav). Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIN (clarin.eu) s omezením na využití v akademické sféře. Data mohou být zajímavá pro pracoviště zkoumající chování selhávajícího či jinak poškozeného hlasu (patologie hlasu apod.). Vzhledem k cílové skupině uživatelů (tj. především pacientů ORL pracovišť v ČR) jsou věty v českém jazyce. Nahrávky hlasů uživatelů (pacientů) tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Rekonstrukcí hlasu uživatele označujeme schopnost generovat původní hlas uživatele (v nejvyšší možné kvalitě a v identitě co nejvíce podobné původnímu hlasu) pomocí externího zařízení (tzv. syntetizéru řeči, resp. systému syntézy řeči z textu – TTS). Cílem je přitom generovat libovolnou řeč v daném hlase.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
<a href="/en/project/TH02010307" target="_blank" >TH02010307: Automatic voice banking and reconstruction for patients after total laryngectomy</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2019
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
laryngo-corpusdb
Technical parameters
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. Korpus obsahuje data 3 řečníků, celkem 3980 vět. Data zahrnují audio nahrávky, pitch-marky, textové anotace, fonetickou transkripci, segmentaci a další informace. Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-3142. Bližší informace na https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb - Ing. Martin Grůber, Ph.D., nadřazené pracoviště: NTIS , E-mail: gruber@ntis.zcu.cz, Telefon: 37763 2512
Economical parameters
Databáze řečových korpusů je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.
Owner IČO
49777513
Owner name
Západočeská univerzita v Plzni