Centre of Computational Linguistics
Public support
Provider
Ministry of Education, Youth and Sports
Programme
—
Call for proposals
SMSM0031008
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
—
Alternative language
Project name in Czech
Centrum komputační lingvistiky
Annotation in Czech
Centrum se bude věnovat výzkumu češtiny na docela nové úrovni, tj. na základě Českého závislostního korpusu, ve kterém už je k dispozici poloautomatická analýza desítek tisíc vět z textů různého druhu (vypracovaná v Laboratoři pro zprac. jazykových datpři ÚFAL MFF UK), na několika úrovních mluvnické stavby. Jde o výzkum teoretických i aplikačních aspektů komputační lingvistiky se zaměřením na češtinu v podobě psané i mluvené s využitím mimořádně rozsáhlých dat pro podrobný gramatický, sémantický alexikální rozbor a popis češtiny na základě strukturních a statistických postupů (matematické a výpočetní základy, metody a algoritmy komputační lingvistiky, metody učení z dat, stochastické i založené na pravidlech). Pozornost bude věnována i zpracovánívíce jazyků pro vyhled. informací ve vícejaz. textech a strojový překlad. Mezinárodní dlouhodobá spolupráce: John Hopkins Univ., Baltimore, Univ. of Pennsylvania, Phil., USA, univerzity v Hamburku, v Saarbrückenu, v Pise, v Edinburghu a INALCO v Paříži.
Scientific branches
R&D category
NV - Nonindustrial research (Applied research excluded Industrial research)
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
AF - Documentation, librarianship, work with information
CEP - another secondary branch
BD - Information theory
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>50803 - Information science (social aspects)<br>50804 - Library science<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
The Center for Computational Linguistics has integrated human and technical resources for speech and language processing, developing databases, algorithms, and software tools for computer analysis and synthesis of Czech, English and other
Solution timeline
Realization period - beginning
Jan 1, 2000
Realization period - end
Jan 1, 2004
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP/2005/MSM/MSM5LN/U/N/4:2
Data delivery date
May 28, 2008
Finance
Total approved costs
132,626 thou. CZK
Public financial support
97,895 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
34,731 thou. CZK