A new design of synchronic corpora of written Czech
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F16%3A10332724" target="_blank" >RIV/00216208:11210/16:10332724 - isvavai.cz</a>
Result on the web
<a href="http://sas.ujc.cas.cz/archiv.php?art=4324" target="_blank" >http://sas.ujc.cas.cz/archiv.php?art=4324</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Nová koncepce synchronních korpusů psané češtiny
Original language description
Článek popisuje SYN2015, nejnovější korpus současné psané češtiny o rozsahu 100 millionů slov. Zabývá se také obecnými pojmy reprezentativnosti a vyváženosti jazykového korpusu, zejména vzhledem ke konceptu reprezentativnosti korpusu SYN2015. Na rozdíl od starších synchronních korpusů SYN2000, SYN2005 a SYN2010, jejichž složení vycházelo ze sociologických průzkumů recepce textů, je reprezentativnost SYN2015 založena na principu "texts-as-products" s arbitrárními poměry jednotlivých kategorií revidovaného klasifikačního schématu. Článek uvádí tři hlavní výhody tohoto řešení: 1) složení může být stejné i u budoucích korpusů, což umožní srovnatelnost, přestože se recepce neustále mění; 2) klade důraz na pestrost složení korpusu jako vzorku jazyka; 3) korpus SYN2015 tak může sloužit nejenom jako reprezentativní vzorek, ale také jako rozsáhlá zásobárna textů, z níž je možné vytvářet podmnožiny (subkorpusy) podle různých kritérií.
Czech name
Nová koncepce synchronních korpusů psané češtiny
Czech description
Článek popisuje SYN2015, nejnovější korpus současné psané češtiny o rozsahu 100 millionů slov. Zabývá se také obecnými pojmy reprezentativnosti a vyváženosti jazykového korpusu, zejména vzhledem ke konceptu reprezentativnosti korpusu SYN2015. Na rozdíl od starších synchronních korpusů SYN2000, SYN2005 a SYN2010, jejichž složení vycházelo ze sociologických průzkumů recepce textů, je reprezentativnost SYN2015 založena na principu "texts-as-products" s arbitrárními poměry jednotlivých kategorií revidovaného klasifikačního schématu. Článek uvádí tři hlavní výhody tohoto řešení: 1) složení může být stejné i u budoucích korpusů, což umožní srovnatelnost, přestože se recepce neustále mění; 2) klade důraz na pestrost složení korpusu jako vzorku jazyka; 3) korpus SYN2015 tak může sloužit nejenom jako reprezentativní vzorek, ale také jako rozsáhlá zásobárna textů, z níž je možné vytvářet podmnožiny (subkorpusy) podle různých kritérií.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/LM2015044" target="_blank" >LM2015044: Czech National Corpus</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2016
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Slovo a slovesnost
ISSN
0037-7031
e-ISSN
—
Volume of the periodical
77
Issue of the periodical within the volume
2
Country of publishing house
CZ - CZECH REPUBLIC
Number of pages
19
Pages from-to
83-101
UT code for WoS article
000377308100001
EID of the result in the Scopus database
—