Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka
Veřejná podpora
Poskytovatel
Ministerstvo kultury
Program
Program NAKI III - program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030
Veřejná soutěž
SMK02023DH001
Hlavní účastníci
Univerzita Palackého v Olomouci / Přírodovědecká fakulta<br>Ústav pro jazyk český AV ČR, v. v. i.<br>Vysoké učení technické v Brně / Fakulta informačních technologií
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
DH23P03OVV010
Alternativní jazyk
Název projektu anglicky
Language memory of the regions of the Czech Republic. Machine learning methods for preservation, documentation and presentation of the Czech dialects
Anotace anglicky
The aim of the project is to adapt existing technologies and develop completely new procedures for the use of artificial intelligence in the automatic processing of natural spoken language in its regionally diverse forms, specifically on the model of Czech dialects. It will be the first project of its kind – automatic speech recognition has so far been applied exclusively to speech with a majority of standard (canonical) language. Such a unique project will significantly streamline work with authentic sound material, the manual processing of which is (not only for linguists) nowadays extremely time-consuming. At the same time, it will enable easier and more effective documentation of the Czech language dialects and an interactive presentation of this disappearing linguistic heritage. The goal will be achieved by (1) creating an innovative Methodology for the transfer of structured knowledge from dialectology to machine learning, (2) intensive work on data sets, especially building a Dialect Speech Database for the professional public, whose fulfillment by representative audio recordings will be ensured by one of the project partners (an owner of the largest archive of this kind in the Czech Republic), (3) creation of several software packages, namely The dialect detector based on audio recording, Speech recognizer adapted to generate dialectological transcription from audio recordings, and Multilingual recognizer of West Slavic languages for generating folklore transcription from audio recordings, (4) creation of three specialized Maps of dialect differential phonetic phenomena with interactive and multimedia elements, and especially (5) the creation of the application Language Memory of the Regions of the Czech Republic. It will be open to the general public for community contributions, map browsing and listening to dialect recordings. The project publications will include a book and a number of journal and conference papers.
Vědní obory
Kategorie VaV
AP - Aplikovaný výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - další vedlejší obor
50701 - Cultural and economic geography
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>AI - Jazykověda<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>DE - Zemský magnetismus, geodesie, geografie<br>IN - Informatika
Termíny řešení
Zahájení řešení
1. 3. 2023
Ukončení řešení
31. 12. 2027
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
16. 3. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-MK0-DH-R
Datum dodání záznamu
19. 2. 2024
Finance
Celkové uznané náklady
24 145 tis. Kč
Výše podpory ze státního rozpočtu
24 145 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč