Zohlednění variability v textech z omezené oblasti
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F14%3A43923284" target="_blank" >RIV/49777513:23520/14:43923284 - isvavai.cz</a>
Výsledek na webu
<a href="http://hdl.handle.net/11025/21253" target="_blank" >http://hdl.handle.net/11025/21253</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Zohlednění variability v textech z omezené oblasti
Popis výsledku v původním jazyce
V případě syntézy řeči z limitované oblasti je vhodné vybírat věty pro nahrávání (textový korpus) z dané omezené oblasti. Texty z limitovaných oblastí však mohou být velmi variabilní, proto je v příspěvku prezentován algoritmus výběru frází z dostupné množiny textů z dané oblasti na základě četnosti slov (unigramů) a dvojic slov (bigramů).
Název v anglickém jazyce
Consideration of variability in texts from a limited area
Popis výsledku anglicky
In the case of speech synthesis from a limited area, it is advisable to select sentences for recording (text corpus) from the given limited area. However, texts from limited areas can be very variable, so the paper presents an algorithm for selecting phrases from the available set of texts from the given area based on the frequency of words (unigrams) and pairs of words (bigrams).
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/ED1.1.00%2F02.0090" target="_blank" >ED1.1.00/02.0090: NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů