Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka

Veřejná podpora

  • Poskytovatel

    Ministerstvo kultury

  • Program

    Program NAKI III - program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030

  • Veřejná soutěž

    SMK02023DH001

  • Hlavní účastníci

    Univerzita Palackého v Olomouci / Přírodovědecká fakulta<br>Ústav pro jazyk český AV ČR, v. v. i.<br>Vysoké učení technické v Brně / Fakulta informačních technologií

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    DH23P03OVV010

Alternativní jazyk

  • Název projektu anglicky

    Language memory of the regions of the Czech Republic. Machine learning methods for preservation, documentation and presentation of the Czech dialects

  • Anotace anglicky

    The aim of the project is to adapt existing technologies and develop completely new procedures for the use of artificial intelligence in the automatic processing of natural spoken language in its regionally diverse forms, specifically on the model of Czech dialects. It will be the first project of its kind – automatic speech recognition has so far been applied exclusively to speech with a majority of standard (canonical) language. Such a unique project will significantly streamline work with authentic sound material, the manual processing of which is (not only for linguists) nowadays extremely time-consuming. At the same time, it will enable easier and more effective documentation of the Czech language dialects and an interactive presentation of this disappearing linguistic heritage. The goal will be achieved by (1) creating an innovative Methodology for the transfer of structured knowledge from dialectology to machine learning, (2) intensive work on data sets, especially building a Dialect Speech Database for the professional public, whose fulfillment by representative audio recordings will be ensured by one of the project partners (an owner of the largest archive of this kind in the Czech Republic), (3) creation of several software packages, namely The dialect detector based on audio recording, Speech recognizer adapted to generate dialectological transcription from audio recordings, and Multilingual recognizer of West Slavic languages for generating folklore transcription from audio recordings, (4) creation of three specialized Maps of dialect differential phonetic phenomena with interactive and multimedia elements, and especially (5) the creation of the application Language Memory of the Regions of the Czech Republic. It will be open to the general public for community contributions, map browsing and listening to dialect recordings. The project publications will include a book and a number of journal and conference papers.

Vědní obory

  • Kategorie VaV

    AP - Aplikovaný výzkum

  • OECD FORD - hlavní obor

    60203 - Linguistics

  • OECD FORD - vedlejší obor

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - další vedlejší obor

    50701 - Cultural and economic geography

  • CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    AF - Dokumentace, knihovnictví, práce s informacemi<br>AI - Jazykověda<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>DE - Zemský magnetismus, geodesie, geografie<br>IN - Informatika

Termíny řešení

  • Zahájení řešení

    1. 3. 2023

  • Ukončení řešení

    31. 12. 2027

  • Poslední stav řešení

    B - Běžící víceletý projekt

  • Poslední uvolnění podpory

    16. 3. 2023

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP24-MK0-DH-R

  • Datum dodání záznamu

    19. 2. 2024

Finance

  • Celkové uznané náklady

    24 145 tis. Kč

  • Výše podpory ze státního rozpočtu

    24 145 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč