Automatizace analýzy slovesných tříd pro ohrožené jazyky - RoboCorp
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
SGA0202000001
Hlavní účastníci
Univerzita Palackého v Olomouci / Filozofická fakulta
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
20-18407S
Alternativní jazyk
Název projektu anglicky
Verb Class Analysis Accelerator for Low-Resource Languages - RoboCorp
Anotace anglicky
More than half of world's languages are endangered and expected to die out during this century. Most of such languages are typically not written but their documentation is very time consuming. Yet, the question of quantify, i.e. how much language data has to be aggregated to provide a comprehensive record of a language, has not been resolved. Low-resource languages are typically studied by a single linguist, whose observations pose challenges falsifiability, verifiability, and reproducibility. This project brings together descriptive linguistics, natural language processing, mathematical analysis and machine learning to overcome manpower and methodological challenges faced by low-resource languages. Focusing on the theoretical problem of verb classes, known for its complexity, we create a workflow for three languages of our expertise (Abui, Sawila, Indonesian) significantly accelerating the linguistic analysis of this problem and producing verifiable and reproducible results that will impact the international debate on this topic.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
50803 - Information science (social aspects)
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi
Termíny řešení
Zahájení řešení
1. 1. 2020
Ukončení řešení
30. 6. 2023
Poslední stav řešení
—
Poslední uvolnění podpory
1. 4. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-GA0-GA-R
Datum dodání záznamu
21. 5. 2024
Finance
Celkové uznané náklady
3 896 tis. Kč
Výše podpory ze státního rozpočtu
3 800 tis. Kč
Ostatní veřejné zdroje financování
96 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč