Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F17%3A43949848" target="_blank" >RIV/49777513:23520/17:43949848 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Databáze vět vhodných pro nahrávání pacientů s poškozením hlasu

  • Popis výsledku v původním jazyce

    Databáze vět má formu XML dokumentu a obsahuje speciálně vybraný seznam vět, které (nebo jejichž část) by měl pacient s indikovanou totální nebo parciální laryngektomií nebo jinou hrozbou ztráty hlasu, či obecně jiný hlasově neškolený uživatel (dále jen uživatel) nahrát v definovaném pořadí. Ke každé větě jsou navíc uvedeny doplňující informace, jako například její fonetická forma nebo předpokládaná prozodická realizace. Nahrávky vět z této databáze tvoří nezbytný základ pro další vytváření hlasových balíčků umožňujících rekonstrukci hlasu nahraného uživatele na vybraných platformách a zařízeních, jsou tedy základním vstupem celé platformy automatické hlasové konzervace. S ohledem na cílovou skupinu uživatelů, u kterých předpokládáme do jisté míry poškozený hlas a tedy i omezenou schopnost mluvit, ale nelze předem určit, kolik vět nakonec budou schopni nebo ochotni nahrát. Na rozdíl od výběru vět pro nahrávání profesionálního (nebo školeného) řečníka byly věty do této databáze omezeny délkou (spíše kratší věty) a složitostí (bez cizích nebo dlouhých slov) a pro finální výběr vět byl použit speciální více-úrovňový algoritmus, který postupně zvyšoval nároky na fonetické a prozodické pokrytí výsledného seznamu vět. Vytvořená databáze vět se využívá v aplikaci pro dozorované nahrávání hlasu a v dalších obdobích řešení projektu bude integrována do platformy automatické hlasové konzervace, kde bude využívána v modulu pro nedozorované nahrávání vět.

  • Název v anglickém jazyce

    Sentence database for voice-impaired speakers recording

  • Popis výsledku anglicky

    The database of sentences has a form of XML document and contains a specially selected list of sentences that all (or their part) are aimed to be recorded in the defined ordering by a patient with indicated total or partial laryngectomy or other threat of voice loss, or by a generally voice untrained speaker (referred to as the user). In addition, information such as phonetic form or the assumed prosodic form are given for each sentence. Recordings of the sentences from this database are the essential basis for the further build of voice modules allowing to reconstruct the voice of the recorded user. Thus, they are the fundamental input of the entire automated voice preservation platform. With regard to the target group of users who are expect to have a somewhat damaged voice and hence a limited ability to speak, it is not possible to determine in advance how many sentences will they eventually be able or willing to record. Unlike the choice of sentences for the recording of a professional (or trained) speaker, the sentences in this database were limited by the length (rather shorter sentences) and the complexity (without foreign or long words). Also, a special multi-level algorithm was used for the final selection of sentences in order to iteratively increase the phonetic and prosodic coverage of the resulting list of sentences. The sentence database is used in the supervised voice recording application, and in the course of project solution, it will be integrated into the automated voice preservation platform, where it will be used by the unsupervised voice recording module.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    20205 - Automation and control systems

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/TH02010307" target="_blank" >TH02010307: Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2017

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    laryngo_textdb

  • Technické parametry

    Projekt &quot;Automatická konzervace a rekonstrukce hlasu se zaměřením na pacienty po totální laryngektomii&quot; - TH02010307, 01/ 2017 - 12/2020. XML dokument, 3500 vět, každá věta obsahuje textový zápis, fonetický přepis (IPA + SAMPA abecedy), očekávanou prozodickou realizaci, typ věty, úroveň na které byla vybrána a očekávané pořadí při nahrávání (pro dodržení maximalizace pokrytí). Korpus je volně dostupný pro nekomerční účely na https://lindat.mff.cuni.cz/repository/xmlui/handle/11234/1-2585 Bližší informace na http://www.kky.zcu.cz/cs/sw/laryngo_textdb - Ing. Daniel Tihelka, Ph.D., nadřazené pracoviště: NTIS , E-mail: dtihelka@ntis.zcu.cz, Telefon: 37763 2531

  • Ekonomické parametry

    Databáze vět je k dispozici zdarma pro nekomerční účely a je distribuován nakladatelstvím LINDAT-Clarin. LINDAT-Clarin je koncipován jako český „uzel“ mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a je rozšířen i na projekt “T4ME Net” (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a základních technologií mezi institucemi a jednotlivci ve vědě a výzkumu.

  • IČO vlastníka výsledku

    49777513

  • Název vlastníka

    Západočeská univerzita v Plzni