Thesaurus Linguae Arabicae
Veřejná podpora
Poskytovatel
Grantová agentura České republiky
Program
Standardní projekty
Veřejná soutěž
—
Hlavní účastníci
Univerzita Karlova / Filozofická fakulta
Druh soutěže
—
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
Thesaurus Linguae Arabicae
Anotace anglicky
This project at creating electronic corpus of Arabic which will primarily serve for compilation of Arabic-Czech dictionary. Besides, development of techniques for desambiguization of non-vocalized texts will be usable in the analysis of other Semitic languages, too. The structure of the corpus will follow the experience of British National Corpus. The corpus will aim at an extent of about 25 million words, from which we suppose that we will scan about 10-12 million words, the rest will be taken from other sources (Internet, exchange of text-corpora with other project, etc.). The works on the project can be divided into two phases: The preparatory phase, during which we will concentrate on building of the corpus (scanning Arabic texts with Arabic OCR programs) and testing methods for pre-analysis of the non-vocalized Arabic texts and their desambiguation. Since the collecting of data has already started, we suppose that this phase could be concluded (for the preparation of a dictionary) in the second y
Vědní obory
Kategorie VaV
—
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
—
CEP - další vedlejší obor
—
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Projekt prokázal vynikající připravenost mladých českých arabistů podstoupit a splnit i nejnáročnější cíle v oblasti elektronických korpusů,anotovaných korpusů, analytických a frazeologických slovníků, které snesou nejpřísnější mezinárodní měřítka. Závěr
Termíny řešení
Zahájení řešení
1. 1. 1997
Ukončení řešení
1. 1. 1999
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP/2000/GA0/GA00GA/U/6:2
Datum dodání záznamu
—
Finance
Celkové uznané náklady
946 tis. Kč
Výše podpory ze státního rozpočtu
946 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč