Jazyková výzkumná infrastruktura v České republice
Cíle projektu
Cílem projektu je umožnit výzkum v oblasti jazykových technologií a ve všech humanitních a společenskovědních oborech spjatých s jazykem jako nositelem informace nebo vlastním objektem výzkumu. Její přidanou hodnotou je zejména: – internacionalizace a významné zvýšení mezinárodní úrovně a spolupráce, zejména začleněním do evropské VI CLARIN ERIC; – koncentrace jazykových dat a metadat, jejich standardizace, citovatelnost (pomocí přidělovaných persistentních identifikátorů) podle principů „Force11“ přijatých CLARIN ERIC, Research Data Alliance (RDA), OpenAire a dalšími organizacemi, a zejména úplná otevřenost metadat a naprosté většiny dat v repozitáři LINDAT/CLARIN; – jednotný přístup přes osobní účty výzkumníků na jejich mateřských institucích podle normy Shibboleth a díky začlenění do federace identit a poskytovatelů výzkumných služeb; – systém ukládání výzkumných dat otevřený všem akademickým uživatelům, za podmínky dodržení výše uvedených standardů; – služby a webové aplikace pro zpracování a využívání jazykových dat, a to i vlastních dat uživatelů-výzkumníků, provázané se systémem autentizace pro distribuované zpracování dat v rámci sítě CLARIN; – přístup k datům, vyhledávání pomocí metadat i obsahu vlastních jazykových dat při respektování licenčních podmínek tam, kde je to nezbytné; – široké možnosti vzdělávání studentů na všech stupních jak při tvorbě, tak i využívání jazykových dat a metadat a softwarových nástrojů pro jejich zpracování; – služby široké veřejnosti, zejména zapojením ÚJČ AV ČR jako garanta správy českého jazyka.
Klíčová slova
language resourcesnatural language processinglinguisticsdigital humanities
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
Projekty velkých výzkumných infrastruktur
Veřejná soutěž
—
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
VL - Schváleno vládou
Číslo smlouvy
MSMT-1000/2016
Alternativní jazyk
Název projektu anglicky
Language Research Infrastructure in the Czech Republic
Anotace anglicky
The goal of the project is to facilitate research in the area of language technology and in all social sciences and humanities related to language as an information medium or an object of research itself. The added value of the Research Infrastructure is - internationalization of research and significantly higher level of international collaboration through CLARIN ERIC; - availability of language resources, their metadata, standardization, persistent identification according to the Force11 principles adopted by CLARIN ERIC, RDA, OpenAIRE and other organizations, openness in distribution of data and metadata in the LINDAT/CLARIN repository; - single sign-on through individual accounts of researchers from their home institutions using Shibboleth authentication; - depositing system open to all researchers from all types of institutions, provided all standards are followed; - web services and web applications for use and processing of language resources, including researchers’ own data, linked to distributed processing authorization within CLARIN; - data access, search by metadata as well as by content while respecting individual license agreements; - wide education possibilities for students at all levels of the educational system, enabling them to use as well as to create language resources, metadata, and software tools for language processing; - providing services for the general public, primarily by the integration of the Institute of the Czech Language as the Czech Language overseeing institution.
Vědní obory
Kategorie VaV
IF - Infrastruktura výzkumu, vývoje a inovací
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
IN - Informatika
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory
(dle převodníku)10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
60201 - General language studies
60202 - Specific languages
60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Cíle projektu byly splněny, a to jak na národní, tak na mezinárodní úrovni. Projekt se pevně etabloval jako klíčová součást sítě CLARIN v Evropě a poskytuje všechny zdroje a služby, které patřily k jeho cílům stanoveným na počátku. Jedná se o unikátní infrastrukturu v ČR, která je dobře napojená, hojně využívaná a mezinárodně uznávaná jak pro svou technickou základnu, tak pro datové zdroje, které vytvořila a nabídla k otevřenému a bezplatnému přístupu.
Termíny řešení
Zahájení řešení
1. 1. 2016
Ukončení řešení
31. 12. 2019
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
15. 2. 2019
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP20-MSM-LM-U/03:1
Datum dodání záznamu
25. 6. 2020
Finance
Celkové uznané náklady
63 896 tis. Kč
Výše podpory ze státního rozpočtu
63 896 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Základní informace
Uznané náklady
63 896 tis. Kč
Statní podpora
63 896 tis. Kč
100%
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
CEP
AI - Jazykověda
Doba řešení
01. 01. 2016 - 31. 12. 2019