Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”
LD14117

PARSEME: Parsing a víceslovné výrazy - k jazykovědné přesnosti a výpočetní efektivitě ve zpracování přirozeného jazyka

Veřejná podpora

  • Poskytovatel

    Ministerstvo školství, mládeže a tělovýchovy

  • Program

    COST CZ

  • Veřejná soutěž

    COST CZ 4 (SMSM2014LD4)

  • Hlavní účastníci

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    MSMT-8634/2014-1

Alternativní jazyk

  • Název projektu anglicky

    Parsing and multi-word expressions. Towards linguistic precision and computational efficiency in natural language processing (PARSEME)

  • Anotace anglicky

    The goal of the proposed project follows from the overall aim of the whole COST Action IC1207. This Action aims at increasing and enhancing the support of the European multilingual heritage from Information and Communication Technologies (ICT). This general aim is addressed through improving linguistic representativeness, precision and computational efficiency of Natural Language Processing (NLP) applications. The Action focuses on the major bottleneck of these applications: Multi-Word Expressions (MWEs), i.e. sequences of words with unpredictable properties such as to count somebody in or to take a haircut. A breakthrough in their modeling and processing can only result from a coordinated effort of multidisciplinary experts in different languages. COST is the most adequate framework answering this need. Fourteen European languages will be addressed from a cross-theoretical and cross-methodological perspective, necessary for coping with current fragmentation issues. Expected deliverables include enhanced language resources and tools, as well as recommendations of best practices for cutting-edge MWE-aware language models. The Action will lead to a better understanding of the nature of MWEs. It will establish a long-lasting collaboration within a multilingual network of MWE specialists. It will pave the way towards competitive next generation text processing tools which will pay greater attention to language phenomena. Specifically, the proposed project will concentrate on the specification of MWE annotation over a large corpus (while, naturally, focusing on the Czech language), annotation of Czech corpus and MWE extraction in the form of an electronic dictionary formatted for future NLP applications. Our goal is to publish all electronic language resources in an open way (using the CC license) for open access in future research as well as applications.

Vědní obory

  • Kategorie VaV

    ZV - Základní výzkum

  • CEP - hlavní obor

    AI - Jazykověda

  • CEP - vedlejší obor

    IN - Informatika

  • CEP - další vedlejší obor

  • OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Hodnocení dokončeného projektu

  • Hodnocení poskytovatelem

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Zhodnocení výsledků projektu

    Během 3 let projektu Parseme bylo publikováno 7 článků ve sbornících, článek v časopise, disertace a anotovaný korpus. V Praze proběhla Training School. Byla navázána silná mezinárodní spolupráce, o čemž svědčí vysoká účast na mezinárodních akcích a aktivita v pracovních skupinách, zejména však pokračování spolupráce po ukončení financování projektu.

Termíny řešení

  • Zahájení řešení

    1. 4. 2014

  • Ukončení řešení

    31. 3. 2017

  • Poslední stav řešení

    U - Ukončený projekt

  • Poslední uvolnění podpory

    28. 2. 2017

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP18-MSM-LD-U/01:1

  • Datum dodání záznamu

    12. 6. 2018

Finance

  • Celkové uznané náklady

    2 152 tis. Kč

  • Výše podpory ze státního rozpočtu

    2 152 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč