Thesaurus Linguae Arabicae
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
—
Main participants
Univerzita Karlova / Filozofická fakulta
Contest type
—
Contract ID
—
Alternative language
Project name in Czech
Thesaurus Linguae Arabicae
Annotation in Czech
Cílem tohoto projektu je obecně vytvoření korpusu arabských textů. Tento korpus má dále sloužit jak k vědeckým a pedagogickým aplikacím, tak i k přípravě arabsko-českého a česko-arabského slovníku, což je publikace, která oboru jednoznačně chybí. Dalšímbodem je též odzkoušení obecných principů analýzy textů semitských jazyků, které pak budou po nutném přizpůsobení aplikovatelné na analýzu textů v dalších semitských jazycích. Struktura korpusu bude odpovídat proporcím, použitým pro British National Corpus. Počítáme s celkovým rozsahem databáze cca 20-25 milionů slov, z toho 10-12 mil. vlastním scanováním, zbytek z dalších zdrojů ( Internet, výměna částí korpusu s dalšími obdobnými projekty v zahraničí). Projekt bude rozdělen do dvou fází: Fáze přípravná : budování korpusu a odzkoušení přípravných tagovacích technik (na menších částech korpusu), které pak budou sloužit ke zpracování celého korpusu. Jedná se především o postupy, umožňující další automatické zpracování textů, tj. ´disambiguizace´ textu -
Scientific branches
R&D category
—
CEP classification - main branch
AI - Linguistics
CEP - secondary branch
—
CEP - another secondary branch
—
OECD FORD - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Completed project evaluation
Provider evaluation
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Project results evaluation
Projekt prokázal vynikající připravenost mladých českých arabistů podstoupit a splnit i nejnáročnější cíle v oblasti elektronických korpusů,anotovaných korpusů, analytických a frazeologických slovníků, které snesou nejpřísnější mezinárodní měřítka. Závěr
Solution timeline
Realization period - beginning
Jan 1, 1997
Realization period - end
Jan 1, 1999
Project status
U - Finished project
Latest support payment
—
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP/2000/GA0/GA00GA/U/6:2
Data delivery date
—
Finance
Total approved costs
946 thou. CZK
Public financial support
946 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK