All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Linguistic Structure Representation in Neural Networks

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

    Standardní projekty 22 (SGA0201800001)

  • Main participants

    Univerzita Karlova / Matematicko-fyzikální fakulta

  • Contest type

    VS - Public tender

  • Contract ID

    18-02196S

Alternative language

  • Project name in Czech

    Reprezentace lingvistické struktury v neuronových sítích

  • Annotation in Czech

    Během několika posledních let došlo v oblasti zpracování přirozeného jazyka (NLP) k velkému posunu. Původně zavedené statistické metody s lehce interpretovatelnými kroky často využívajícími lingvisticky anotované korpusy začaly být překonávány moderními metodami založenými na hlubokých neuronových sítích. Dnes tyto metody dominují ve většině zavedených úloh NLP, jako je strojový překlad, analýza sentimentu, titulkování obrázků, nebo rozpoznávání řeči. Neuronové sítě řešící tyto úlohy ale jen zřídka využívají lingvistických anotací. Cílem tohoto projektu je neuronové sítě analyzovat a popsat, jakým způsobem a co konkrétně se na jednotlivých NLP úlohách učí. Budeme v nich hledat jazykové rysy a struktury a porovnávat je s anotovanými korpusy nebo zavedenými lingvistickými teoriemi. Budeme se snažit odpovědět na otázky, jak neuronové sítě pracují s funkčními slovy, s negací, s pasivními konstrukcemi, jak jejich vnitřní reprezentace slov ve vektorovém prostoru odpovídá slovním druhům nebo morfologickým rysům, nebo jaké stromové reprezentace věty jsou vhodné pro jaké úlohy.

Scientific branches

  • R&D category

    ZV - Basic research

  • OECD FORD - main branch

    60203 - Linguistics

  • OECD FORD - secondary branch

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AF - Documentation, librarianship, work with information<br>AI - Linguistics<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics

Solution timeline

  • Realization period - beginning

    Jan 1, 2018

  • Realization period - end

    Dec 31, 2020

  • Project status

  • Latest support payment

    Mar 25, 2020

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP21-GA0-GA-R/11:1

  • Data delivery date

    Feb 22, 2021

Finance

  • Total approved costs

    2,989 thou. CZK

  • Public financial support

    2,577 thou. CZK

  • Other public sources

    412 thou. CZK

  • Non public and foreign sources

    0 thou. CZK