Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka

Veřejná podpora

Poskytovatel
Ministerstvo kultury
Program
Program NAKI III - program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030
Veřejná soutěž
SMK02023DH001
Hlavní účastníci
Univerzita Palackého v Olomouci / Přírodovědecká fakulta Ústav pro jazyk český AV ČR, v. v. i. Vysoké učení technické v Brně / Fakulta informačních technologií
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
DH23P03OVV010

Alternativní jazyk

Název projektu anglicky
Language memory of the regions of the Czech Republic. Machine learning methods for preservation, documentation and presentation of the Czech dialects
Anotace anglicky
The aim of the project is to adapt existing technologies and develop completely new procedures for the use of artificial intelligence in the automatic processing of natural spoken language in its regionally diverse forms, specifically on the model of Czech dialects. It will be the first project of its kind – automatic speech recognition has so far been applied exclusively to speech with a majority of standard (canonical) language. Such a unique project will significantly streamline work with authentic sound material, the manual processing of which is (not only for linguists) nowadays extremely time-consuming. At the same time, it will enable easier and more effective documentation of the Czech language dialects and an interactive presentation of this disappearing linguistic heritage. The goal will be achieved by (1) creating an innovative Methodology for the transfer of structured knowledge from dialectology to machine learning, (2) intensive work on data sets, especially building a Dialect Speech Database for the professional public, whose fulfillment by representative audio recordings will be ensured by one of the project partners (an owner of the largest archive of this kind in the Czech Republic), (3) creation of several software packages, namely The dialect detector based on audio recording, Speech recognizer adapted to generate dialectological transcription from audio recordings, and Multilingual recognizer of West Slavic languages for generating folklore transcription from audio recordings, (4) creation of three specialized Maps of dialect differential phonetic phenomena with interactive and multimedia elements, and especially (5) the creation of the application Language Memory of the Regions of the Czech Republic. It will be open to the general public for community contributions, map browsing and listening to dialect recordings. The project publications will include a book and a number of journal and conference papers.

Vědní obory

Kategorie VaV
AP - Aplikovaný výzkum
OECD FORD - hlavní obor
60203 - Linguistics
OECD FORD - vedlejší obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - další vedlejší obor
50701 - Cultural and economic geography
CEP - odpovídající obory (dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi AI - Jazykověda BC - Teorie a systémy řízení BD - Teorie informace DE - Zemský magnetismus, geodesie, geografie IN - Informatika

Termíny řešení

Zahájení řešení
1. 3. 2023
Ukončení řešení
31. 12. 2027
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
16. 3. 2023

Dodání dat do CEP

Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP25-MK0-DH-R
Datum dodání záznamu
13. 2. 2025

Finance

Celkové uznané náklady
24 143 tis. Kč
Výše podpory ze státního rozpočtu
24 143 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč

Podobné projekty(10)

Český jazykový atlas - Dodatky (GA405/06/0293) Atlas českého jazyka 2027 (DH23P03OVV050) Zvukové záznamy českých nářečí - jejich archivace a další využití (IAA0061601)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka

Veřejná podpora

Alternativní jazyk

Vědní obory

Termíny řešení

Dodání dat do CEP

Finance

Podobné projekty(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Cíle projektu

Veřejná podpora

Veřejná podpora

Alternativní jazyk

Alternativní jazyk

Vědní obory

Vědní obory

Termíny řešení

Termíny řešení

Dodání dat do CEP

Dodání dat do CEP

Finance

Finance

Podobné projekty(10)