Word embedding for punctuation detection and summarization
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F20%3A43961334" target="_blank" >RIV/49777513:23520/20:43961334 - isvavai.cz</a>
Result on the web
<a href="http://www.kky.zcu.cz/cs/sw/sum-punc-we" target="_blank" >http://www.kky.zcu.cz/cs/sw/sum-punc-we</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Word embeddings pro detekci interpunkce a sumarizaci
Original language description
Software sestává ze dvou částí modulů: modul pro sumarizaci textu do krátkých frází (témat) a modul pro doplňování interpunkce do textu. Modul pro sumarizaci predikuje pro vstupní text témata z hierarchie 577 definovaných témat. Modul pro doplňování interpunkce umožňuje doplnit chybějící interpunkce především ve výstupu rozpoznávače řeči. Zároveň dokáže obnovit velikost písmen a opravit chyby v koncovém i/y po obojetných souhláskách.
Czech name
Word embeddings pro detekci interpunkce a sumarizaci
Czech description
Software sestává ze dvou částí modulů: modul pro sumarizaci textu do krátkých frází (témat) a modul pro doplňování interpunkce do textu. Modul pro sumarizaci predikuje pro vstupní text témata z hierarchie 577 definovaných témat. Modul pro doplňování interpunkce umožňuje doplnit chybějící interpunkce především ve výstupu rozpoznávače řeči. Zároveň dokáže obnovit velikost písmen a opravit chyby v koncovém i/y po obojetných souhláskách.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
—
Continuities
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Others
Publication year
2020
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
sum-punc-we
Technical parameters
Software provádí sumarizaci pomocí detekce tématu a doplňování chybějící interpunkce ve výstupu rozpoznávače řeči. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o. Bližší informace k technickým parametrům SW podá Ing. Jan Švec, Ph.D., Západočeská univerzita v Plzni, Univerzitní 22, 306 14, Plzeň, e-mail: honzas@kky.zcu.cz, dále také na http://www.kky.zcu.cz/cs/sw/sum-punc-we#
Economical parameters
Software zásadním způsobem redukuje potřebu lidské práce při zpracování výstupu ze systému rozpoznávání řeči. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o.
Owner IČO
49777513
Owner name
Západočeská univerzita v Plzni