Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných "světů" mluvenosti a psanosti
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F11%3A10108078" target="_blank" >RIV/00216208:11320/11:10108078 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/00216208:11210/11:10108078
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných "světů" mluvenosti a psanosti
Popis výsledku v původním jazyce
Rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny odstraňuje z přepisu mluvených projevů specifické rysy mluvenosti (prvky nespisovné z obecné češtiny i nářečí, nadbytečná "ukazovací" zájmena a navazovacíkonektory, "vycpávky", subjektivní slovosled, opakování a opravy, restarty aj.). Např. z mluveného "takže jako tam byla dobrá parta a dlouho tedy no" vzniká standardizované "Byla tam dlouho dobrá parta." To umožňuje názorné a zajímavé porovnávání autentických mluvených projevů a textů standardizovaných, u nichž je otázka, jak je kategorizovat: jsou to stále ještě texty mluvené - ale korektní, spisovné? Nebo standardizace transformuje mluvený projev do podoby textu psaného? Necháme-li stranou jevy hláskoslovné a tvaroslovné a soustředíme-li se na proměny syntaxe při standardizaci, nabízí se otázka, v čem vlastně je syntaktická identita českého mluveného a psaného textu, jaké syntaktické celky/ jednotky/ konstrukce jsou "přirozené" v mlu
Název v anglickém jazyce
Spoken Czech corpora and their potential use in observing the differing worlds of spoken and written language
Popis výsledku anglicky
The reconstruction of standardized text from the Prague Dependency Treebank of Spoken Czech removes specific aspects of spoken language (non-standard elements from Common Czech and dialects, superfluous demonstrative pronouns and connectors, filler words, subjective word order, repetitions and repairs, restarts etc.). For example, the spoken utterance "takže jako tam byla dobrá parta a dlouho tedy no" ("so like there was a good crowd and for a long time yeah") becomes the standardized sentence "Byla tamdlouho dobrá parta" ("For a long time, there was a good crowd there."). This enables a vivid and interesting comparison of authentic spoken expressions and standardized texts. The question of how to categorize the standardized texts thus arises; they are still spoken texts - but they are correct, standard? Or does standardization transform spoken utterances into written texts? If we leave aside phonetic and morphological phenomena and concentrate on the syntactic transformations which o
Klasifikace
Druh
C - Kapitola v odborné knize
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2011
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název knihy nebo sborníku
Korpusová lingvistika Praha 2011. 2 Výzkum a výstavba korpusů
ISBN
978-80-7422-115-6
Počet stran výsledku
15
Strana od-do
78-92
Počet stran knihy
323
Název nakladatele
Lidové noviny
Místo vydání
Praha
Kód UT WoS kapitoly
—