Sentence database for voice-impaired speakers recording
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F17%3A43949848" target="_blank" >RIV/49777513:23520/17:43949848 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu
Original language description
Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.
Czech name
Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu
Czech description
Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
<a href="/en/project/TH02010307" target="_blank" >TH02010307: Automatic voice banking and reconstruction for patients after total laryngectomy</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2017
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
laryngo_textdb
Technical parameters
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. XML dokument, 3500 vět, každá věta obsahuje textový zápis, fonetický přepis (IPA + SAMPA abecedy), očekávanou prozodickou realizaci, typ věty, úroveň na které byla vybrána a očekávané pořadí při nahrávání (pro dodržení maximalizace pokrytí). Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2585 Bližší informace na http://www.kky.zcu.cz/cs/sw/laryngo_textdb - Ing. Daniel Tihelka, Ph.D., nadřazené pracoviště: NTIS , E-mail: dtihelka@ntis.zcu.cz, Telefon: 37763 2531
Economical parameters
Databáze vět je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.
Owner IČO
49777513
Owner name
Západočeská univerzita v Plzni