All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Sentence database for voice-impaired speakers recording

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F17%3A43949848" target="_blank" >RIV/49777513:23520/17:43949848 - isvavai.cz</a>

  • Result on the web

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    čeština

  • Original language name

    Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu

  • Original language description

    Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.

  • Czech name

    Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu

  • Czech description

    Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.

Classification

  • Type

    R - Software

  • CEP classification

  • OECD FORD branch

    20205 - Automation and control systems

Result continuities

  • Project

    <a href="/en/project/TH02010307" target="_blank" >TH02010307: Automatic voice banking and reconstruction for patients after total laryngectomy</a><br>

  • Continuities

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Others

  • Publication year

    2017

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Internal product ID

    laryngo_textdb

  • Technical parameters

    Projekt &quot;Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii&quot; - TH02010307, 01/ 2017 - 12/2020. XML dokument, 3500 vět, každá věta obsahuje textový zápis, fonetický přepis (IPA + SAMPA abecedy), očekávanou prozodickou realizaci, typ věty, úroveň na které byla vybrána a očekávané pořadí při nahrávání (pro dodržení maximalizace pokrytí). Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2585 Bližší informace na http://www.kky.zcu.cz/cs/sw/laryngo_textdb - Ing. Daniel Tihelka, Ph.D., nadřazené pracoviště: NTIS , E-mail: dtihelka@ntis.zcu.cz, Telefon: 37763 2531

  • Economical parameters

    Databáze vět je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.

  • Owner IČO

    49777513

  • Owner name

    Západočeská univerzita v Plzni