Word embeddings pro detekci interpunkce a sumarizaci
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F20%3A43961334" target="_blank" >RIV/49777513:23520/20:43961334 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.kky.zcu.cz/cs/sw/sum-punc-we" target="_blank" >http://www.kky.zcu.cz/cs/sw/sum-punc-we</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Word embeddings pro detekci interpunkce a sumarizaci
Popis výsledku v původním jazyce
Software sestává ze dvou částí modulů: modul pro sumarizaci textu do krátkých frází (témat) a modul pro doplňování interpunkce do textu. Modul pro sumarizaci predikuje pro vstupní text témata z hierarchie 577 definovaných témat. Modul pro doplňování interpunkce umožňuje doplnit chybějící interpunkce především ve výstupu rozpoznávače řeči. Zároveň dokáže obnovit velikost písmen a opravit chyby v koncovém i/y po obojetných souhláskách.
Název v anglickém jazyce
Word embedding for punctuation detection and summarization
Popis výsledku anglicky
The software consists of two parts of modules: a module for summarizing text into short phrases (topics) and a module for adding punctuation to the text. Summary module predicts topics from a hierarchy of 577 defined topics for the input text. Module for completing punctuation allows you restore missing punctuation, especially in speech recognizer output. It can also restores case and corrects errors in i/y following some consonants.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
—
Návaznosti
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Ostatní
Rok uplatnění
2020
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
sum-punc-we
Technické parametry
Software provádí sumarizaci pomocí detekce tématu a doplňování chybějící interpunkce ve výstupu rozpoznávače řeči. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o. Bližší informace k technickým parametrům SW podá Ing. Jan Švec, Ph.D., Západočeská univerzita v Plzni, Univerzitní 22, 306 14, Plzeň, e-mail: honzas@kky.zcu.cz, dále také na http://www.kky.zcu.cz/cs/sw/sum-punc-we#
Ekonomické parametry
Software zásadním způsobem redukuje potřebu lidské práce při zpracování výstupu ze systému rozpoznávání řeči. Software je výsledkem smluvního výzkumu objednaného společností SpeechTech, s.r.o.
IČO vlastníka výsledku
49777513
Název vlastníka
Západočeská univerzita v Plzni