All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Word embeddings for text generation

The result's identifiers

  • Result code in IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F21%3A43964184" target="_blank" >RIV/49777513:23520/21:43964184 - isvavai.cz</a>

  • Result on the web

    <a href="http://www.kky.zcu.cz/cs/sw/word-embeddings" target="_blank" >http://www.kky.zcu.cz/cs/sw/word-embeddings</a>

  • DOI - Digital Object Identifier

Alternative languages

  • Result language

    čeština

  • Original language name

    Word embeddings pro generování textu

  • Original language description

    Word embeddings pro generování textu jsou automaticky vytvářeny pomocí modelů hlubokých neuronových sítí. Struktura této sítě vychází z architektury Transformer a způsob trénování je postaven na modelu T5 (Text-to-text transfer Transformer). Model byl předtrénován na české podmnožině korpusu CommonCrawl, součástí modelu je SentencePiece tokenizer, který byl natrénován na téže sadě.

  • Czech name

    Word embeddings pro generování textu

  • Czech description

    Word embeddings pro generování textu jsou automaticky vytvářeny pomocí modelů hlubokých neuronových sítí. Struktura této sítě vychází z architektury Transformer a způsob trénování je postaven na modelu T5 (Text-to-text transfer Transformer). Model byl předtrénován na české podmnožině korpusu CommonCrawl, součástí modelu je SentencePiece tokenizer, který byl natrénován na téže sadě.

Classification

  • Type

    R - Software

  • CEP classification

  • OECD FORD branch

    20205 - Automation and control systems

Result continuities

  • Project

  • Continuities

    N - Vyzkumna aktivita podporovana z neverejnych zdroju

Others

  • Publication year

    2021

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

  • Internal product ID

    ZCU/KKY/2021/030

  • Technical parameters

    Software provádí sumarizaci pomocí detekce tématu a doplňování chybějící interpunkce ve výstupu rozpoznávače řeči. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o. Bližší informace k technickým parametrům SW podá Ing. Jan Švec, Ph.D., Západočeská univerzita v Plzni, Univerzitní 22, 306 14, Plzeň, e-mail: honzas@kky.zcu.cz, dále také na http://www.kky.zcu.cz/cs/sw/word-embeddings

  • Economical parameters

    Redukce ruční práce pro zpracování textu a generování promluv pro hlasové dialogové systémy. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o.

  • Owner IČO

    25247930

  • Owner name

    SpeechTech, s.r.o.