Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F25%3APR40073" target="_blank" >RIV/00216305:26230/25:PR40073 - isvavai.cz</a>

  • Nalezeny alternativní kódy

    RIV/61989592:15310/25:73628600

  • Výsledek na webu

    <a href="https://www.fit.vut.cz/research/product/843/" target="_blank" >https://www.fit.vut.cz/research/product/843/</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Metodika pro převod strukturovaných znalostí z oboru dialektologie do strojového učení

  • Popis výsledku v původním jazyce

    Metodika zpracovává problematiku přípravy a využití nářečních dat v dialektologii prostřednictvím moderních technologií strojového učení. Zaměřuje se na procesy konsolidace, standardizace a strukturování audiálních a textových materiálů, které tvoří základ pro vývoj automatických nástrojů pro transkripci řeči. Středobodem je představení postupů uplatnitelných při digitalizaci a normalizaci textových dat, obsahuje rovněž podrobný popis audiální dokumentace nářečí v terénu se zaměřením na různé explorační metody, a to včetně digitální archivace a katalogizace nahrávek. Metodika propojuje teoretické poznatky o sběru a zpracování nářečního materiálu s praktickými postupy, které zahrnují nasazení strojového učení. Důraz je kladen na interdisciplinární přístup, který kombinuje lingvistické znalosti s technologickými nástroji pro automatizaci práce. Součástí metodiky jsou také postupy vizualizace dialektologických dat pomocí tematické kartografie, vedoucí k tvorbě interaktivních zvukových map či webových atlasů. Dokument slouží nejen jako praktický průvodce pro přípravu specifického jazykového materiálu, ale i jako inspirace pro další výzkumné týmy, a to jak v oblasti dialektologie, tak v rámci širšího zapojení strojového učení do humanitních věd.

  • Název v anglickém jazyce

    Methodology for Transferring Structured Knowledge from Dialectology into Machine Learning

  • Popis výsledku anglicky

    The methodology addresses the preparation and utilization of dialect data in dialectology through modern Machine Learning technologies. It focuses on the processes of consolidating, standardizing, and structuring audial and textual materials, which form the foundation for developing automatic speech transcription tools. The core of the study presents procedures applicable to the digitization and normalization of textual data and it includes a detailed description of dialect documentation in the field, emphasizing various exploratory methods, including digital archiving and cataloging of recordings. The methodology connects theoretical knowledge on the collection and processing of dialect material with practical procedures that involve the deployment of Machine Learning. Emphasis is placed on an interdisciplinary approach that combines linguistic expertise with technological tools for workflow automation. The methodology also includes procedures for visualizing dialectological data using thematic cartography, leading to the creation of interactive sound dialect maps and web-based atlases. This document serves not only as a practical guide for preparing specific linguistic material but also as inspiration for other research teams, both in dialectology and in the broader integration of Machine Learning into the humanities.

Klasifikace

  • Druh

    N<sub>metC</sub> - Metodiky certifikované oprávněným orgánem

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/DH23P03OVV010" target="_blank" >DH23P03OVV010: Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2025

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    MK 8564/2025 OVV

  • Číslo předpisu

    NmetS

  • Technické parametry

    Ministerstvo kultury ČR, Odbor výzkumu a vývoje, Osvědčení č. 304 Č.j. MK 8564/2025 OVV, Sp. zn. MK-S 12060/2022 OVV

  • Ekonomické parametry

    V rámci řešení projektu nelze vyčíslit. Ekonomický impakt nebyl primárním cílem metodiky. Využívání představených postupů však může vést ke značnému zefektivnění zpracování dialektologických dat, audiálních i textových, čímž dojde k významné úspoře osobních nákladů dotčených institucí. Zavedení doporučené metodiky může přinést podstatné snížení nákladů na OCR a proofreading nářečních textů, též - v případě vyvinutí automatického přepisovače optimalizovaného právě na česká nářeční data - značnou úsporu v rámci transkripčních prací u materiálu audiálního.

  • Označení certifikačního orgánu

    Ministerstvo kultury ČR, Maltézské náměstí 1, Praha 1, CZ

  • Datum certifikace

  • Způsoby využití výsledku

    C - Výsledek je využíván bez omezení okruhu uživatelů