All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”
ME 909

Multilingual Automatic Detection of Structural Events in Speech

Public support

  • Provider

    Ministry of Education, Youth and Sports

  • Programme

    KONTAKT

  • Call for proposals

    KONTAKT 5 (SMSM2007ME2)

  • Main participants

  • Contest type

    VS - Public tender

  • Contract ID

    2783/2009-32

Alternative language

  • Project name in Czech

    Vícejazyčná automatická detekce strukturálních událostí v mluvené řeči

  • Annotation in Czech

    Tento projekt má za cíl podpořit užší spolupráci Katedry kybernetiky FAV ZČU v Plzni se špičkovými pracovišti v USA, Human Language Technology Research Institute při University of Texas at Dallas a výzkumným institutem SRI International v oblasti automatického rozpoznávání řeči. Projekt je zaměřen na automatickou detekci ?strukturálních událostí? v mluvené řeči, která je klíčová pro umožnění následného automatického zpracování rozpoznaného textu. Mezi strukturální události v řeči patří hranice vět, ?neplynulosti? a další jevy, které nejsou standardně označeny v ?proudu slov?, který je výstupem konvenčních automatických rozpoznávačů řeči. Hlavním cílem spolupráce je vyvíjení metod pro automatickou detekci strukturálních událostí ve zvukových dokumentechve více různých jazycích, které se od sebe výrazně liší v syntaktické, fonetické i prozodické struktuře. Plánována je práce zejména na angličtině a češtině, počítá se ale i s rozšířením práce na arabštinu a mandarínskou čínštinu, příp. další jazyky.

Scientific branches

  • R&D category

    ZV - Basic research

  • CEP classification - main branch

    JD - Use of computers, robotics and its application

  • CEP - secondary branch

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    20204 - Robotics and automatic control<br>20205 - Automation and control systems

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    We created a Czech speech database with structural metadata. We developed an automatic systém for sentence boundary detection. Systém performance has been analyzed in terms of language, genre, and speaker identity differences. The cooperation among UWB,UT Dallas and SRI Int. has been deepened.

Solution timeline

  • Realization period - beginning

    May 1, 2007

  • Realization period - end

    Dec 31, 2009

  • Project status

    U - Finished project

  • Latest support payment

    Feb 24, 2009

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP10-MSM-ME-U/01:1

  • Data delivery date

    Jun 30, 2010

Finance

  • Total approved costs

    822 thou. CZK

  • Public financial support

    742 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    80 thou. CZK