Parsing and multi-word expressions. Towards linguistic precision and computational efficiency in natural language processing (PARSEME)
Public support
Provider
Ministry of Education, Youth and Sports
Programme
COST CZ
Call for proposals
COST CZ 4 (SMSM2014LD4)
Main participants
Univerzita Karlova / Matematicko-fyzikální fakulta
Contest type
VS - Public tender
Contract ID
MSMT-8634/2014-1
Alternative language
Project name in Czech
PARSEME: Parsing a víceslovné výrazy - k jazykovědné přesnosti a výpočetní efektivitě ve zpracování přirozeného jazyka
Annotation in Czech
Cílem projektu je ve spolupráci se zahraničními partnery a s využitím jejich zkušeností významně posílit vlastní výzkum v oblasti zpracování přirozeného jazyka, konkrétně v oblasti analýzy víceslovných výrazů (multiword entities, MWE), a to z hlediska tvaroslovného, syntaktického a zejména významového. Tento cíl má několik postupných (pod)cílů: metodologii výzkumu v této specifické oblasti ze začleněním dosud rozdrobených poznatků mezinárodního konsorcia partnerů, přípravu expertních lingvisticky anotovaných dat (textových korpusů analyzovaných z hlediska MWE), extrakci slovníku MWE z takto připravených dat, a přípravu pilotních experimentů identifikace MWE v textu. Vedlejším, nicméně velmi důležitým cílem z hlediska navazujícího výzkumu je příprava veřejně dostupných anotovaných dat a již zmíněného slovníku ve formátu vhodném pro další zkoumání a navazující metody strojového učení.
Scientific branches
R&D category
ZV - Basic research
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
IN - Informatics
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
We have published 7 proceeding papers, a journal paper, PhD. thesis and an annotated corpus. A Training school took place in Prague. Strong international cooperation started, which is proven by our high attendance at international events, our activity in working groups, but mainly by continuing collaboration after the project funding has ended.
Solution timeline
Realization period - beginning
Apr 1, 2014
Realization period - end
Mar 31, 2017
Project status
U - Finished project
Latest support payment
Feb 28, 2017
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP18-MSM-LD-U/01:1
Data delivery date
Jun 12, 2018
Finance
Total approved costs
2,152 thou. CZK
Public financial support
2,152 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK