Aplikace počítačové lingvistiky při tvorbě on-line kurzu češtiny mluvtecesky.net
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14640%2F15%3A00087235" target="_blank" >RIV/00216224:14640/15:00087235 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Aplikace počítačové lingvistiky při tvorbě on-line kurzu češtiny mluvtecesky.net
Popis výsledku v původním jazyce
Příspěvek na příkladu webových stránek mluvtecesky.net ukazuje možnosti využití počítačové lingvistiky při tvorbě kurzů češtiny pro cizince. Počítačovělingvistickou podporu projektu poskytlo Centrum jazykového vzdělávání MU ve spolupráci s Fakultou informatiky MU. Lemmatizací korpusu vytvořených učebních textů s využitím morfologického analyzátoru byl nejprve odvozen frekvenční slovník pro kurz i jednotlivé jeho části ? ten lze využít ke stanovení rozsahu kurzu (počet vyučovaných lexikálních jednotek),určení pokryté slovní zásoby (obecné i odborné), poloautomatické přípravě studijních pomůcek (seznamy slov k jednotlivým lekcím) a do jisté míry i k odstranění překlepů a prosazení jednotné terminologie. Seznam lemmat se stal podkladem pro tvorbu překladového slovníku, který umožňuje studentům kliknutím na slovo v českém textu získat jeho orientační překlad do zvoleného jazyka.
Název v anglickém jazyce
Application of computer linguistics in the creation of the mluvtecesky.net on-line Czech language course
Popis výsledku anglicky
The paper demonstrates the capabilities of computer linguistics in the production of Czech language courses for foreigners. The on-line course mluvtecesky.net has been developed within the CZKey project, whose parts relying on computational linguistics have been contributed by Masaryk University Language Centre and the same university's Natural Language Processing Centre at the Faculty of Informatics. Through lemmatizing the corpus of the created courses texts, a frequency dictionary has been derived, which could be used to estimate the course's size and vocabulary coverage, for production of flashcards and also to reveal some typos and ensure a unified terminology. The word list has been translated into other languages to provide the student with a rough idea of the word's meaning and each word form present in the course text has been linked to a lemma entry in a morphological database that contains full declinations/conjugations.
Klasifikace
Druh
O - Ostatní výsledky
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů