All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Thesaurus Linguae Arabicae

Public support

  • Provider

    Czech Science Foundation

  • Programme

    Standard projects

  • Call for proposals

  • Main participants

    Univerzita Karlova / Filozofická fakulta

  • Contest type

  • Contract ID

Alternative language

  • Project name in Czech

    Thesaurus Linguae Arabicae

  • Annotation in Czech

    Cílem tohoto projektu je obecně vytvoření korpusu arabských textů. Tento korpus má dále sloužit jak k vědeckým a pedagogickým aplikacím, tak i k přípravě arabsko-českého a česko-arabského slovníku, což je publikace, která oboru jednoznačně chybí. Dalšímbodem je též odzkoušení obecných principů analýzy textů semitských jazyků, které pak budou po nutném přizpůsobení aplikovatelné na analýzu textů v dalších semitských jazycích. Struktura korpusu bude odpovídat proporcím, použitým pro British National Corpus. Počítáme s celkovým rozsahem databáze cca 20-25 milionů slov, z toho 10-12 mil. vlastním scanováním, zbytek z dalších zdrojů ( Internet, výměna částí korpusu s dalšími obdobnými projekty v zahraničí). Projekt bude rozdělen do dvou fází: Fáze přípravná : budování korpusu a odzkoušení přípravných tagovacích technik (na menších částech korpusu), které pak budou sloužit ke zpracování celého korpusu. Jedná se především o postupy, umožňující další automatické zpracování textů, tj. ´disambiguizace´ textu -

Scientific branches

  • R&D category

  • CEP classification - main branch

    AI - Linguistics

  • CEP - secondary branch

  • CEP - another secondary branch

  • OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics

Completed project evaluation

  • Provider evaluation

    V - Vynikající výsledky projektu (s mezinárodním významem atd.)

  • Project results evaluation

    Projekt prokázal vynikající připravenost mladých českých arabistů podstoupit a splnit i nejnáročnější cíle v oblasti elektronických korpusů,anotovaných korpusů, analytických a frazeologických slovníků, které snesou nejpřísnější mezinárodní měřítka. Závěr

Solution timeline

  • Realization period - beginning

    Jan 1, 1997

  • Realization period - end

    Jan 1, 1999

  • Project status

    U - Finished project

  • Latest support payment

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP/2000/GA0/GA00GA/U/6:2

  • Data delivery date

Finance

  • Total approved costs

    946 thou. CZK

  • Public financial support

    946 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK