Word-level annotation error detector

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F25247930%3A_____%2F12%3A%230000035" target="_blank" >RIV/25247930:_____/12:#0000035 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html" target="_blank" >http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html</a>
DOI - Digital Object Identifier
—

Jazyk výsledku
angličtina
Název v původním jazyce
Word-level annotation error detector
Popis výsledku v původním jazyce
The software is a programme package which includes programmes for the initialization of appropriate classifiers/detectors, training the parameters of the classifiers/detectors, and prediction (application of the classifiers/detectors to the data). As theclassification/detection is performed on word level, any word-level based features can be used. The purpose of the classifiers/detectors is to detect whether each word in the input data is annotated correctly or whether it is misannotated. In this way,speech corpora used to prepare speech unit inventories can be optimized for quality.
Název v anglickém jazyce
Word-level annotation error detector
Popis výsledku anglicky
The software is a programme package which includes programmes for the initialization of appropriate classifiers/detectors, training the parameters of the classifiers/detectors, and prediction (application of the classifiers/detectors to the data). As theclassification/detection is performed on word level, any word-level based features can be used. The purpose of the classifiers/detectors is to detect whether each word in the input data is annotated correctly or whether it is misannotated. In this way,speech corpora used to prepare speech unit inventories can be optimized for quality.

Projekt
<a href="/cs/project/FR-TI1%2F518" target="_blank" >FR-TI1/518: *Inteligentní telefonní asistentka</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Rok uplatnění
2012
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.

Interní identifikační kód produktu
WLEVEL-ANNOT-DETECTION
Technické parametry
Software má podobu platformově nezávislého programového balíku, ovládaného z příkazového řádku (konzole). Software obsahuje programy pro inicializaci a trénování klaifikátorů a pro predikci pomocí klasifikátorů. Programy jsou psané v platformově nezávislém programovacím jazyce Python verze 2.7. Kromě standardních pythonovských modulů se využívají i následující moduly: NumPy 1.6.2 a scikit-learn 0.12.1. Programy aktuálně běží pod OS Linux i Windows. Bližší informace: Jiří Zahradil, jiri.zahradil@speechtech.cz, http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html
Ekonomické parametry
SW umožňuje efektivně vyhledávat anotační chyby v rozsáhlých řečových korpusech. Díky tomu je možné docílit významné úspory nákladů spojených s ověřováním kvality z korpusů vzniklých hlasových inventářů.
IČO vlastníka výsledku
25247930
Název vlastníka
SpeechTech, s.r.o.

Podobné výsledky(10)