Word embeddings for text generation
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F21%3A43964184" target="_blank" >RIV/49777513:23520/21:43964184 - isvavai.cz</a>
Result on the web
<a href="http://www.kky.zcu.cz/cs/sw/word-embeddings" target="_blank" >http://www.kky.zcu.cz/cs/sw/word-embeddings</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Word embeddings pro generování textu
Original language description
Word embeddings pro generování textu jsou automaticky vytvářeny pomocí modelů hlubokých neuronových sítí. Struktura této sítě vychází z architektury Transformer a způsob trénování je postaven na modelu T5 (Text-to-text transfer Transformer). Model byl předtrénován na české podmnožině korpusu CommonCrawl, součástí modelu je SentencePiece tokenizer, který byl natrénován na téže sadě.
Czech name
Word embeddings pro generování textu
Czech description
Word embeddings pro generování textu jsou automaticky vytvářeny pomocí modelů hlubokých neuronových sítí. Struktura této sítě vychází z architektury Transformer a způsob trénování je postaven na modelu T5 (Text-to-text transfer Transformer). Model byl předtrénován na české podmnožině korpusu CommonCrawl, součástí modelu je SentencePiece tokenizer, který byl natrénován na téže sadě.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
—
Continuities
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Others
Publication year
2021
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
ZCU/KKY/2021/030
Technical parameters
Software provádí sumarizaci pomocí detekce tématu a doplňování chybějící interpunkce ve výstupu rozpoznávače řeči. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o. Bližší informace k technickým parametrům SW podá Ing. Jan Švec, Ph.D., Západočeská univerzita v Plzni, Univerzitní 22, 306 14, Plzeň, e-mail: honzas@kky.zcu.cz, dále také na http://www.kky.zcu.cz/cs/sw/word-embeddings
Economical parameters
Redukce ruční práce pro zpracování textu a generování promluv pro hlasové dialogové systémy. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o.
Owner IČO
25247930
Owner name
SpeechTech, s.r.o.