Pokročilé sémantické obohacování vícejazyčných kolekcí literárních textů
Cíle projektu
Cílem projektu je přispět k aktivitám COST Akce CA 16204 - Distant-Reading - v oblastech souvisejících se sémantickým obohacováním rozsáhlých souborů literárních textů v různých jazycích. Budeme zkoumat a vyvíjet pokročilé metody extrakce metadat a anotace obsahu, s cílem explicitní reprezentace široké škály sémantických struktur v textech, nové techniky adaptace stávajících zdrojů a nástrojů pro nové jazyky, oblasti a kontexty, a způsoby efektivní správy shromážděných zdrojů a kontroly jejich kvality a konzistence
Klíčová slova
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
INTER-EXCELLENCE
Veřejná soutěž
INTER-EXCELLENCE 13 (SMSM2018LTC01)
Hlavní účastníci
Vysoké učení technické v Brně / Fakulta informačních technologií
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
MSMT-16506/2018-31
Alternativní jazyk
Název projektu anglicky
Distant Reading for European Literary History
Anotace anglicky
The project will contribute to the activities of COST Action CA 16204 - Distant-Reading - in the areas related to semantic enrichment of large collections of literary texts in various languages. We will research and develop advanced methods of metadata extraction and content annotation, making explicit a wide range of semantic structures in texts, explore novel techniques to adapt existing resources and tools to new languages, domains, and contexts, and study new ways to efficiently manage collected resources and to check their quality and consistency.
Vědní obory
Kategorie VaV
ZV - Základní výzkum
OECD FORD - hlavní obor
20206 - Computer hardware and architecture
OECD FORD - vedlejší obor
—
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory
(dle převodníku)JC - Počítačový hardware a software
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Projekt se zaměřil na metody reprezentace textu, které nejsou závislé na extrakci charakteristik specifických pro konkrétní jazyk, a jsou tedy využitelné pro distanční čtení napříč různými evropskými jazyky. Byly vytvořeny nové alogoritmy a postupy pro reprezentaci klíčových charakteristik, využitelných ve studiích distančního čtení, zveřejněn příslušný software a příspěvky zaměřené na toto téma.
Termíny řešení
Zahájení řešení
1. 6. 2018
Ukončení řešení
31. 10. 2021
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
9. 3. 2021
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP22-MSM-LT-U
Datum dodání záznamu
29. 6. 2022
Finance
Celkové uznané náklady
4 664 tis. Kč
Výše podpory ze státního rozpočtu
4 664 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
4 664 tis. Kč
Statní podpora
4 664 tis. Kč
100%
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
OECD FORD
Computer hardware and architecture
Doba řešení
01. 06. 2018 - 31. 10. 2021