Spoken Czech corpora and their potential use in observing the differing worlds of spoken and written language
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11320%2F11%3A10108078" target="_blank" >RIV/00216208:11320/11:10108078 - isvavai.cz</a>
Alternative codes found
RIV/00216208:11210/11:10108078
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných "světů" mluvenosti a psanosti
Original language description
Rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny odstraňuje z přepisu mluvených projevů specifické rysy mluvenosti (prvky nespisovné z obecné češtiny i nářečí, nadbytečná "ukazovací" zájmena a navazovacíkonektory, "vycpávky", subjektivní slovosled, opakování a opravy, restarty aj.). Např. z mluveného "takže jako tam byla dobrá parta a dlouho tedy no" vzniká standardizované "Byla tam dlouho dobrá parta." To umožňuje názorné a zajímavé porovnávání autentických mluvených projevů a textů standardizovaných, u nichž je otázka, jak je kategorizovat: jsou to stále ještě texty mluvené - ale korektní, spisovné? Nebo standardizace transformuje mluvený projev do podoby textu psaného? Necháme-li stranou jevy hláskoslovné a tvaroslovné a soustředíme-li se na proměny syntaxe při standardizaci, nabízí se otázka, v čem vlastně je syntaktická identita českého mluveného a psaného textu, jaké syntaktické celky/ jednotky/ konstrukce jsou "přirozené" v mlu
Czech name
Korpusy mluvené češtiny a možnosti jejich využití pro poznání rozdílných "světů" mluvenosti a psanosti
Czech description
Rekonstrukce standardizovaného textu z mluvené řeči v Pražském závislostním korpusu mluvené češtiny odstraňuje z přepisu mluvených projevů specifické rysy mluvenosti (prvky nespisovné z obecné češtiny i nářečí, nadbytečná "ukazovací" zájmena a navazovacíkonektory, "vycpávky", subjektivní slovosled, opakování a opravy, restarty aj.). Např. z mluveného "takže jako tam byla dobrá parta a dlouho tedy no" vzniká standardizované "Byla tam dlouho dobrá parta." To umožňuje názorné a zajímavé porovnávání autentických mluvených projevů a textů standardizovaných, u nichž je otázka, jak je kategorizovat: jsou to stále ještě texty mluvené - ale korektní, spisovné? Nebo standardizace transformuje mluvený projev do podoby textu psaného? Necháme-li stranou jevy hláskoslovné a tvaroslovné a soustředíme-li se na proměny syntaxe při standardizaci, nabízí se otázka, v čem vlastně je syntaktická identita českého mluveného a psaného textu, jaké syntaktické celky/ jednotky/ konstrukce jsou "přirozené" v mlu
Classification
Type
C - Chapter in a specialist book
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
Result was created during the realization of more than one project. More information in the Projects tab.
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2011
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Book/collection name
Korpusová lingvistika Praha 2011. 2 Výzkum a výstavba korpusů
ISBN
978-80-7422-115-6
Number of pages of the result
15
Pages from-to
78-92
Number of pages of the book
323
Publisher name
Lidové noviny
Place of publication
Praha
UT code for WoS chapter
—