ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F24%3A10489728" target="_blank" >RIV/00216208:11210/24:10489728 - isvavai.cz</a>
Výsledek na webu
<a href="https://wiki.korpus.cz/doku.php/cnk:ortofon" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:ortofon</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem
Popis výsledku v původním jazyce
Cílem korpusu ORTOFON je reprezentace spontánního mluveného jazyka užívaného v neformálních situacích mezi mluvčími, kteří se navzájem znají. Mluvčí pocházejí z celé České republiky a jsou o nich shromažďovány relevantní sociolingvistické informace. Korpus disponuje víceúrovňovým přepisem na ortografické a fonetické rovině. Oproti předchozí verzi byl do korpusu ORTOFON v3 přídán další materiál, byla provedena řada oprav v transkripci a především byl opatřen zcela novou lemmatizací a morfologickým značkováním ve standardu korpusu SYN2020.
Název v anglickém jazyce
ORTOFON v3: Corpus of informal spoken Czech with multi-tier transcription
Popis výsledku anglicky
The aim of the ORTOFON corpus is the representation of spontaneous spoken language used in informal situations among speakers who know each other. In ORTOFON, speakers from all over the Czech Republic are recorded and relevant sociolinguistic data about them is included in the metadata. The corpus features a multi-tier transcription on orthographic and phonetic layer. Compared to the previous version, new material was added to ORTOFON version 3, as well as a number of corrections were made to the transcription. Furthermore, ORTOFON v3 features a brand new lemmatization and morphological tagging following the SYN2020 standard.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
60203 - Linguistics
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2023044" target="_blank" >LM2023044: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
ORTOFON v3
Technické parametry
Soubor jazykových dat dostupný na http://korpus.cz/
Ekonomické parametry
Korpus je volně přístupný a primárně nevytváří žádný zisk.
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova