Databáze řečových korpusů laryngektomických pacientů

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957861" target="_blank" >RIV/49777513:23520/19:43957861 - isvavai.cz</a>
Výsledek na webu
<a href="https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb" target="_blank" >https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Databáze řečových korpusů laryngektomických pacientů
Popis výsledku v původním jazyce
Dokument popisuje výsledek TH02010307-V15 (Databáze řečových korpusů laryngektomických pacientů), který je plánovaným výsledkem projektu TA ČR TH02010307 „Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii“. Jde o databázi hlasů pacientů, kteří dali souhlas s uveřejněním svých nahrávek pořízených před výkonem totální laryngektomie (LET) nebo podobného chirurgického zákroku v oblasti krku a hlasivek. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA, SAMPA), hranice fónů (segmentace), okamžiky uzavření hlasivek (tzv. pitch-marky), atp., získané s přesností danou aktuálně použitými technologiemi (tj. bez ručních oprav). Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIN (clarin.eu) s omezením na využití v akademické sféře. Data mohou být zajímavá pro pracoviště zkoumající chování selhávajícího či jinak poškozeného hlasu (patologie hlasu apod.). Vzhledem k cílové skupině uživatelů (tj. především pacientů ORL pracovišť v ČR) jsou věty v českém jazyce. Nahrávky hlasů uživatelů (pacientů) tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Rekonstrukcí hlasu uživatele označujeme schopnost generovat původní hlas uživatele (v nejvyšší možné kvalitě a v identitě co nejvíce podobné původnímu hlasu) pomocí externího zařízení (tzv. syntetizéru řeči, resp. systému syntézy řeči z textu – TTS). Cílem je přitom generovat libovolnou řeč v daném hlase.
Název v anglickém jazyce
Database of speech corpora of Czech laryngectomy patients
Popis výsledku anglicky
The corpus contains Czech speech of laryngectomy patients recorded before a surgery causing their voice to be lost in order to preserve the voice which can be later used for personalized text-to-speech system. Individual utterances were selected from the language by a special algorithm to cover as much phonetic and prosodic features as possible

Klasifikace

Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems

Návaznosti výsledku

Projekt
<a href="/cs/project/TH02010307" target="_blank" >TH02010307: Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Interní identifikační kód produktu
laryngo-corpusdb
Technické parametry
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. Korpus obsahuje data 3 řečníků, celkem 3980 vět. Data zahrnují audio nahrávky, pitch-marky, textové anotace, fonetickou transkripci, segmentaci a další informace. Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-3142. Bližší informace na https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb - Ing. Martin Grůber, Ph.D., nadřazené pracoviště: NTIS , E-mail: gruber@ntis.zcu.cz, Telefon: 37763 2512
Ekonomické parametry
Databáze řečových korpusů je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni

Podobné výsledky(10)

Systém konzervace hlasu pro pacienty s poškozením hlasu Speech Corpus Preparation for Voice Banking of Laryngectomised Patients Comparison of methods for determining speech voicing based on tests performed on paired consonants and continuous speech

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Databáze řečových korpusů laryngektomických pacientů

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)