Od jazyka ke znalostem a sémantickému webu
Veřejná podpora
Poskytovatel
Akademie věd České republiky
Program
Informační společnost (Národní program výzkumu)
Veřejná soutěž
Informační společnost 2 (SAV02005-IS)
Hlavní účastníci
—
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
1ET201120505
Alternativní jazyk
Název projektu anglicky
From a Natural Language to Knowledge and the Semantic Web
Anotace anglicky
The project "From a Natural Language to Knowledge and the Semantic Web" focuses on the interlinking linguistic and content analysis (and synthesis). It is based on deep syntax analysis as captured in the Prague Dependency Treebank. The project objectiveis to design and implement such representation of knowledge contained in common text that can formally and logically capture the content of a message in natural language. Natural demand for this knowledge representation is language independence. Unavoidable language-dependent phenomena will be exactly determined, language relations defined, and conversions between representations of the same knowledge in different languages will be implemented. The Project will be focused at least on two languages (Czech and English). A sufficient amount of linguistically annotated data necessary for machine learning methods will be also prepared. Project results will be utilizable for information extraction as well as for automatic machine translation.
Vědní obory
Kategorie VaV
NV - Neprůmyslový výzkum (aplikovaný výzkum s výjimkou průmyslového)
CEP - hlavní obor
JD - Využití počítačů, robotika a její aplikace
CEP - vedlejší obor
AI - Jazykověda
CEP - další vedlejší obor
BD - Teorie informace
OECD FORD - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
10102 - Applied mathematics<br>10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)<br>20204 - Robotics and automatic control<br>20205 - Automation and control systems<br>60201 - General language studies<br>60202 - Specific languages<br>60203 - Linguistics
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
V - Vynikající výsledky projektu (s mezinárodním významem atd.)
Zhodnocení výsledků projektu
Možnosti formálního zápisu úplné sémantické reprezentace promluv (sdělení) v přirozeném jazyce (angličtině, češtině, ruštině, hindi). Kromě více než 70 publikací je volně dostupný anotační editor a elektronická anotovaná data, včetně paralelních korpus.
Termíny řešení
Zahájení řešení
1. 1. 2005
Ukončení řešení
31. 12. 2009
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
11. 3. 2009
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP10-AV0-1E-U/01:1
Datum dodání záznamu
15. 4. 2010
Finance
Celkové uznané náklady
16 061 tis. Kč
Výše podpory ze státního rozpočtu
16 061 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč