Word-level annotation error detector
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F25247930%3A_____%2F12%3A%230000035" target="_blank" >RIV/25247930:_____/12:#0000035 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html" target="_blank" >http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Word-level annotation error detector
Popis výsledku v původním jazyce
The software is a programme package which includes programmes for the initialization of appropriate classifiers/detectors, training the parameters of the classifiers/detectors, and prediction (application of the classifiers/detectors to the data). As theclassification/detection is performed on word level, any word-level based features can be used. The purpose of the classifiers/detectors is to detect whether each word in the input data is annotated correctly or whether it is misannotated. In this way,speech corpora used to prepare speech unit inventories can be optimized for quality.
Název v anglickém jazyce
Word-level annotation error detector
Popis výsledku anglicky
The software is a programme package which includes programmes for the initialization of appropriate classifiers/detectors, training the parameters of the classifiers/detectors, and prediction (application of the classifiers/detectors to the data). As theclassification/detection is performed on word level, any word-level based features can be used. The purpose of the classifiers/detectors is to detect whether each word in the input data is annotated correctly or whether it is misannotated. In this way,speech corpora used to prepare speech unit inventories can be optimized for quality.
Klasifikace
Druh
R - Software
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/FR-TI1%2F518" target="_blank" >FR-TI1/518: *Inteligentní telefonní asistentka</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
WLEVEL-ANNOT-DETECTION
Technické parametry
Software má podobu platformově nezávislého programového balíku, ovládaného z příkazového řádku (konzole). Software obsahuje programy pro inicializaci a trénování klaifikátorů a pro predikci pomocí klasifikátorů. Programy jsou psané v platformově nezávislém programovacím jazyce Python verze 2.7. Kromě standardních pythonovských modulů se využívají i následující moduly: NumPy 1.6.2 a scikit-learn 0.12.1. Programy aktuálně běží pod OS Linux i Windows. Bližší informace: Jiří Zahradil, jiri.zahradil@speechtech.cz, http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html
Ekonomické parametry
SW umožňuje efektivně vyhledávat anotační chyby v rozsáhlých řečových korpusech. Díky tomu je možné docílit významné úspory nákladů spojených s ověřováním kvality z korpusů vzniklých hlasových inventářů.
IČO vlastníka výsledku
25247930
Název vlastníka
SpeechTech, s.r.o.