All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Database of speech corpora of Czech laryngectomy patients

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F19%3A43957861" target="_blank" >RIV/49777513:23520/19:43957861 - isvavai.cz</a>

  • Result on the web

    <a href="https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb" target="_blank" >https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb</a>

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    čeština

  • Original language name

    Databáze řečových korpusů laryngektomických pacientů

  • Original language description

    Dokument popisuje výsledek TH02010307-V15 (Databáze řečových korpusů laryngektomických pacientů), který je plánovaným výsledkem projektu TA ČR TH02010307 „Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii“. Jde o databázi hlasů pacientů, kteří dali souhlas s uveřejněním svých nahrávek pořízených před výkonem totální laryngektomie (LET) nebo podobného chirurgického zákroku v oblasti krku a hlasivek. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA, SAMPA), hranice fónů (segmentace), okamžiky uzavření hlasivek (tzv. pitch-marky), atp., získané s přesností danou aktuálně použitými technologiemi (tj. bez ručních oprav). Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIN (clarin.eu) s omezením na využití v akademické sféře. Data mohou být zajímavá pro pracoviště zkoumající chování selhávajícího či jinak poškozeného hlasu (patologie hlasu apod.). Vzhledem k cílové skupině uživatelů (tj. především pacientů ORL pracovišť v ČR) jsou věty v českém jazyce. Nahrávky hlasů uživatelů (pacientů) tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Rekonstrukcí hlasu uživatele označujeme schopnost generovat původní hlas uživatele (v nejvyšší možné kvalitě a v identitě co nejvíce podobné původnímu hlasu) pomocí externího zařízení (tzv. syntetizéru řeči, resp. systému syntézy řeči z textu – TTS). Cílem je přitom generovat libovolnou řeč v daném hlase.

  • Czech name

    Databáze řečových korpusů laryngektomických pacientů

  • Czech description

    Dokument popisuje výsledek TH02010307-V15 (Databáze řečových korpusů laryngektomických pacientů), který je plánovaným výsledkem projektu TA ČR TH02010307 „Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii“. Jde o databázi hlasů pacientů, kteří dali souhlas s uveřejněním svých nahrávek pořízených před výkonem totální laryngektomie (LET) nebo podobného chirurgického zákroku v oblasti krku a hlasivek. Součástí databáze (DB) jsou kromě vlastních nahrávek i anotace, fonetické přepisy (ve fonetických abecedách IPA, SAMPA), hranice fónů (segmentace), okamžiky uzavření hlasivek (tzv. pitch-marky), atp., získané s přesností danou aktuálně použitými technologiemi (tj. bez ručních oprav). Databáze byla zveřejněna v infrastruktuře LINDAT/CLARIN (clarin.eu) s omezením na využití v akademické sféře. Data mohou být zajímavá pro pracoviště zkoumající chování selhávajícího či jinak poškozeného hlasu (patologie hlasu apod.). Vzhledem k cílové skupině uživatelů (tj. především pacientů ORL pracovišť v ČR) jsou věty v českém jazyce. Nahrávky hlasů uživatelů (pacientů) tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních. Rekonstrukcí hlasu uživatele označujeme schopnost generovat původní hlas uživatele (v nejvyšší možné kvalitě a v identitě co nejvíce podobné původnímu hlasu) pomocí externího zařízení (tzv. syntetizéru řeči, resp. systému syntézy řeči z textu – TTS). Cílem je přitom generovat libovolnou řeč v daném hlase.

Classification

  • Type

    R - Software

  • CEP classification

  • OECD FORD branch

    20205 - Automation and control systems

Result continuities

  • Project

    <a href="/en/project/TH02010307" target="_blank" >TH02010307: Automatic voice banking and reconstruction for patients after total laryngectomy</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

  • Publication year

    2019

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Internal product ID

    laryngo-corpusdb

  • Technical parameters

    Projekt &quot;Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii&quot; - TH02010307, 01/ 2017 - 12/2020. Korpus obsahuje data 3 řečníků, celkem 3980 vět. Data zahrnují audio nahrávky, pitch-marky, textové anotace, fonetickou transkripci, segmentaci a další informace. Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-3142. Bližší informace na https://www.kky.zcu.cz/cs/sw/laryngo-corpusdb - Ing. Martin Grůber, Ph.D., nadřazené pracoviště: NTIS , E-mail: gruber@ntis.zcu.cz, Telefon: 37763 2512

  • Economical parameters

    Databáze řečových korpusů je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.

  • Owner IČO

    49777513

  • Owner name

    Západočeská univerzita v Plzni