Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F17%3A43949848" target="_blank" >RIV/49777513:23520/17:43949848 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu
Popis výsledku v původním jazyce
Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.
Název v anglickém jazyce
Sentence database for voice-impaired speakers recording
Popis výsledku anglicky
The database of sentences has a form of XML document and contains a specially selected list of sentences that all (or their part) are aimed to be recorded in the defined ordering by a patient with indicated total or partial laryngectomy or other threat of voice loss, or by a generally voice untrained speaker (referred to as the user). In addition, information such as phonetic form or the assumed prosodic form are given for each sentence. Recordings of the sentences from this database are the essential basis for the further build of voice modules allowing to reconstruct the voice of the recorded user. Thus, they are the fundamental input of the entire automated voice preservation platform. With regard to the target group of users who are expect to have a somewhat damaged voice and hence a limited ability to speak, it is not possible to determine in advance how many sentences will they eventually be able or willing to record. Unlike the choice of sentences for the recording of a professional (or trained) speaker, the sentences in this database were limited by the length (rather shorter sentences) and the complexity (without foreign or long words). Also, a special multi-level algorithm was used for the final selection of sentences in order to iteratively increase the phonetic and prosodic coverage of the resulting list of sentences. The sentence database is used in the supervised voice recording application, and in the course of project solution, it will be integrated into the automated voice preservation platform, where it will be used by the unsupervised voice recording module.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/TH02010307" target="_blank" >TH02010307: Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
laryngo_textdb
Technické parametry
Projekt "Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii" - TH02010307, 01/ 2017 - 12/2020. XML dokument, 3500 vět, každá věta obsahuje textový zápis, fonetický přepis (IPA + SAMPA abecedy), očekávanou prozodickou realizaci, typ věty, úroveň na které byla vybrána a očekávané pořadí při nahrávání (pro dodržení maximalizace pokrytí). Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2585 Bližší informace na http://www.kky.zcu.cz/cs/sw/laryngo_textdb - Ing. Daniel Tihelka, Ph.D., nadřazené pracoviště: NTIS , E-mail: dtihelka@ntis.zcu.cz, Telefon: 37763 2531
Ekonomické parametry
Databáze vět je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni