Word-level annotation error detector
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F25247930%3A_____%2F12%3A%230000035" target="_blank" >RIV/25247930:_____/12:#0000035 - isvavai.cz</a>
Result on the web
<a href="http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html" target="_blank" >http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Word-level annotation error detector
Original language description
The software is a programme package which includes programmes for the initialization of appropriate classifiers/detectors, training the parameters of the classifiers/detectors, and prediction (application of the classifiers/detectors to the data). As theclassification/detection is performed on word level, any word-level based features can be used. The purpose of the classifiers/detectors is to detect whether each word in the input data is annotated correctly or whether it is misannotated. In this way,speech corpora used to prepare speech unit inventories can be optimized for quality.
Czech name
—
Czech description
—
Classification
Type
R - Software
CEP classification
JD - Use of computers, robotics and its application
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/FR-TI1%2F518" target="_blank" >FR-TI1/518: *Intelligent phone assistant</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2012
Confidentiality
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Data specific for result type
Internal product ID
WLEVEL-ANNOT-DETECTION
Technical parameters
Software má podobu platformově nezávislého programového balíku, ovládaného z příkazového řádku (konzole). Software obsahuje programy pro inicializaci a trénování klaifikátorů a pro predikci pomocí klasifikátorů. Programy jsou psané v platformově nezávislém programovacím jazyce Python verze 2.7. Kromě standardních pythonovských modulů se využívají i následující moduly: NumPy 1.6.2 a scikit-learn 0.12.1. Programy aktuálně běží pod OS Linux i Windows. Bližší informace: Jiří Zahradil, jiri.zahradil@speechtech.cz, http://www.speechtech.cz/cs/component/content/article/36-projekt/72-word-level-error-detector.html
Economical parameters
SW umožňuje efektivně vyhledávat anotační chyby v rozsáhlých řečových korpusech. Díky tomu je možné docílit významné úspory nákladů spojených s ověřováním kvality z korpusů vzniklých hlasových inventářů.
Owner IČO
25247930
Owner name
SpeechTech, s.r.o.