Robust processing of recordings for operations and security
Project goals
The project is proposed by two top Czech research groups working in the field of speech data mining: BUT Speech@FIT (Brno) and Department of Cybernetics of University of West Bohemia (Pilsen). Its goal is to unify and coordinate R&D in the area of speech data mining from realistic recordings and tight cooperation with law enforcement agencies. The project aims at robust automatic speech recognition, determination who speaks when in a recording (diarization) and querying by acoustic examples. The investigated technologies build on a common framework of neural architectures for machine learning. The planned outputs include 5 software tools that will be tested by two units of Czech Police. The project also foresees an intensive international cooperation on both scientific and LEA levels.
Keywords
speech data miningoperationsinvestigationsecurityspeech recognitiondiarizationartificial intelligence
Public support
Provider
Ministry of Interior
Programme
—
Call for proposals
SMV02020VJ001
Main participants
Vysoké učení technické v Brně / Fakulta informačních technologií
Contest type
VS - Public tender
Contract ID
VJ01010108 - Smlouva o poskytnutí podpory
Alternative language
Project name in Czech
Robustní zpracování nahrávek pro operativu a bezpečnost
Annotation in Czech
Projekt je navržen dvěma předními českými výzkumnými pracovišti v oboru dolování informací z řeči: skupinou BUT Speech@FIT na VUT v Brně a Katedrou kybernetiky ZČU v Plzni. Jeho cílem je sjednocení a koordinace výzkumu a vývoje v oboru dolování informací z řeči z reálných nahrávek a úzká spolupráce s bezpečnostními sbory. Projekt se zaměřuje na robustní automatické rozpoznávání řeči, určení kdy kdo mluví v nahrávce (diarizace) a prohledávání pomocí akustických dotazů. Zkoumané technologie staví na společném rámci neurálních architektur strojového učení. Plánovaným výstupem projektu je 5 softwarových nástrojů, které budou testovány dvěma útvary Policie ČR. V rámci projektu je plánována intenzivní vědecká i bezpečnostní mezinárodní spolupráce.
Scientific branches
R&D category
AP - Applied research
OECD FORD - main branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - secondary branch
20202 - Communication engineering and systems
OECD FORD - another secondary branch
20203 - Telecommunications
AF - Documentation, librarianship, work with information
BC - Theory and management systems
BD - Information theory
IN - Informatics
JW - Navigation, connection, detection and countermeasure
Solution timeline
Realization period - beginning
Oct 1, 2020
Realization period - end
Sep 30, 2025
Project status
K - Ending multi-year project
Latest support payment
Feb 27, 2024
Data delivery to CEP
Confidentiality
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Data delivery code
CEP25-MV0-VJ-R
Data delivery date
Feb 19, 2025
Finance
Total approved costs
51,232 thou. CZK
Public financial support
51,232 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
51 232 CZK thou.
Public support
51 232 CZK thou.
100%
Provider
Ministry of Interior
OECD FORD
Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Solution period
01. 10. 2020 - 30. 09. 2025