T5G2P: Multilingual Grapheme-to-Phoneme Conversion with Text-to-Text Transfer Transformer
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F23%3A43969588" target="_blank" >RIV/49777513:23520/23:43969588 - isvavai.cz</a>
Výsledek na webu
<a href="https://link.springer.com/chapter/10.1007/978-3-031-47665-5_27" target="_blank" >https://link.springer.com/chapter/10.1007/978-3-031-47665-5_27</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-031-47665-5_27" target="_blank" >10.1007/978-3-031-47665-5_27</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
T5G2P: Multilingual Grapheme-to-Phoneme Conversion with Text-to-Text Transfer Transformer
Popis výsledku v původním jazyce
In recent years, the Text-to-Text Transfer Transformer (T5) neural network has proved more powerful for many text-related tasks, including the grapheme-to-phoneme conversion (G2P). The paper describes the training process of T5-base models for several languages. It shows the advantages of training G2P models using that language-specific basis over the G2P models fine-tuned from the multilingual base model. The paper also explains the reasons for training G2P models on whole sentences (not a dictionary) and evaluates the trained G2P models on unseen sentences and words.
Název v anglickém jazyce
T5G2P: Multilingual Grapheme-to-Phoneme Conversion with Text-to-Text Transfer Transformer
Popis výsledku anglicky
In recent years, the Text-to-Text Transfer Transformer (T5) neural network has proved more powerful for many text-related tasks, including the grapheme-to-phoneme conversion (G2P). The paper describes the training process of T5-base models for several languages. It shows the advantages of training G2P models using that language-specific basis over the G2P models fine-tuned from the multilingual base model. The paper also explains the reasons for training G2P models on whole sentences (not a dictionary) and evaluates the trained G2P models on unseen sentences and words.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
<a href="/cs/project/GA21-14758S" target="_blank" >GA21-14758S: Prozodická fráze v současné mluvené češtině: význam, rovnováha, stochastické vzorce</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Pattern Recognition, 7th Asian Conference, ACPR 2023 Kitakyushu, Japan, November 5–8, 2023 Proceedings, Part III
ISBN
978-3-031-47664-8
ISSN
0302-9743
e-ISSN
1611-3349
Počet stran výsledku
10
Strana od-do
336-345
Název nakladatele
Springer
Místo vydání
Heidelberg
Místo konání akce
Kitakyushu, Japan
Datum konání akce
5. 11. 2023
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—