All

What are you looking for?

All

Projects

Results

Organizations

Quick search

Projects supported by TA ČR
Excellent projects
Projects with the highest public support
Current projects

Smart search

That is how I find a specific +word
That is how I leave the -word out of the results
“That is how I can find the whole phrase”

EN

Čeština English

LINDAT-CLARIN: Institute for analysis, processing and distribution of linguistic data

Public support

Provider
Ministry of Education, Youth and Sports
Programme
—
Call for proposals
—
Main participants
Masarykova univerzita / Fakulta informatiky<br>Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VL - Approved by the Government
Contract ID
23754/2010-320

Alternative language

Project name in Czech
LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat
Annotation in Czech
Projekt LINDAT-CLARIN je koncipován jako český uzel mezinárodní sítě Clarin (Common Language Resources and Technology Infrastructure, FP7-RI-2122230) a projektu META-NET (Technologies for the Multilingual European Information Society, NoE, 2011-2014, FP7-ICT-4-249119) pro volné sdílení jazykových dat a pokročilých technologií mezi institucemi a jednotlivci ve vědě a výzkumu. Tyto evropské projekty mají za cíl překážky volného přístupu k jazykovým datům postupně odstranit a umožnit národně distribuované,ale technologicky jednotné poskytování jazykových dat a souvisejících technologií všem zájemcům. V oblasti anotace dat je cílem projektu pořídit tato data v dostatečném rozsahu pro praktickou aplikaci statistického modelování jazyka jako nutnou podmínkupro aplikaci těchto modelů v praxi (korektory textu, automatický překlad, extrakce informací z textu, porozumění textu, dialogové systémy apod.). V oblasti distribuce dat je cílem poskytovat službu repozitáře pro úschovu, licencování a poskytování dat vrámci celoevropské sítě Clarin a META-SHARE (součást projektu META-NET). V oblasti technologické i v oblasti lidských zdrojů je cílem vybudování know-how v oblasti sběru, úschovy, tvorby a distribuce dat, které bude možno poskytovat i externím subjektům. Přitom je třeba vyškolit jazykové odborníky i odborníky z oblasti technologií (informatika, statistika, matematické modelování) tak, aby byli schopni v tomto výrazné mezioborovém projektu efektivně pracovat. Nezanedbatelným cílem projektu je vychovat další vědeckou generaci, která bude umět s jazykovými daty pracovat, správně je analyzovat a používat v národním i mezinárodním kontextu, a spolupracovat v rámci EU i mimo ni na budoucích projektech využívajících moderní jazykové technologie.

Scientific branches

R&D category
IF - RDI infrastructure
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
IN - Informatics
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The large infrastructure is very well anchored into the international research community both in Europe and overseas. It has already been used by large user community. This signals that the infrastructure has achieved a mature phase that enables even more robust use in the future. The current portfolio of services is covering toolset necessary for computer assisted linguistic analysis.

Solution timeline

Realization period - beginning
Jan 1, 2010
Realization period - end
Dec 31, 2015
Project status
U - Finished project
Latest support payment
Jul 16, 2015

Data delivery to CEP

Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP16-MSM-LM-U/02:1
Data delivery date
Sep 15, 2017

Finance

Total approved costs
120,904 thou. CZK
Public financial support
120,904 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK

Similar projects(10)

Language Research Infrastructure in the Czech Republic (LM2015071) Digital Research Infrastructure for the Language Technologies, Arts and Humanities (LM2018101) Building of Research Team in the Field of Environmental Modeling and the Use of Geoinformation Systems with the Consequence in Participation in International Networks and Programs (EE2.3.20.0170)