Laboratoř počítačového zpracování jazykových dat
Cíle projektu
Cílem projektu je vybudování laboratoře pro progresívní způsoby počítačového zpracování přirozeného jazyka, využitelné v širokém spektru navazujících výzkumných i aplikačních projektů, od analýzy mluvené řeči až po analýzu významu vět, textů a dialogu. Základním paradigmatem vědecké práce laboratoře se stanou empirické počítačové metody popisu chování jazyka (modelování založené na učení z velekoobjemových dat), vhodně doplněné ověřenými poznatky introspektivního poznání.
Klíčová slova
computational linguisticscomputer sciencestochastic modelingfulltext retrievalspeech recogni
Veřejná podpora
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
Program
Posílení výzkumu na vysokých školách
Veřejná soutěž
—
Hlavní účastníci
Univerzita Karlova / Matematicko-fyzikální fakulta
Druh soutěže
—
Číslo smlouvy
—
Alternativní jazyk
Název projektu anglicky
Laboratory of language Data Processing
Anotace anglicky
The project's aim is to create a laboratory for advanced methods of automatic natural language processing. These methods can be applied in a broad spectrum of research and applications, ranging from speech recognition to the analysis of the meaning of sentences, texts and dialogues. The methodological paradigm of the research in the Laboratory will be based on empirical computational methods of the description of language behavior (modeling based on learning from very large language data), suitably complemented by verified findings of introspective inquiries.
Vědní obory
Kategorie VaV
—
CEP - hlavní obor
AI - Jazykověda
CEP - vedlejší obor
AF - Dokumentace, knihovnictví, práce s informacemi
CEP - další vedlejší obor
BD - Teorie informace
OECD FORD - odpovídající obory
(dle převodníku)10102 - Applied mathematics
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
50803 - Information science (social aspects)
50804 - Library science
60201 - General language studies
60202 - Specific languages
60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Laboratoř počítačového zpracování jazykových dat ealizuje koncepci Pražského závislost. korpusu jako tříúrovňového značkování českých textů. Korpus byl označkován na rovině morfolog. a analyt. a v prvním testovacím souboru i na rovině hloubkové syntaxe.
Termíny řešení
Zahájení řešení
1. 1. 1996
Ukončení řešení
1. 1. 2000
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
—
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP/2001/MSM/MSM1VS/U/N/2:1
Datum dodání záznamu
—
Finance
Celkové uznané náklady
31 701 tis. Kč
Výše podpory ze státního rozpočtu
19 887 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč
Uznané náklady
31 701 tis. Kč
Statní podpora
19 887 tis. Kč
0%
Poskytovatel
Ministerstvo školství, mládeže a tělovýchovy
CEP
AI - Jazykověda
Doba řešení
01. 01. 1996 - 01. 01. 2000