ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F24%3A10489728" target="_blank" >RIV/00216208:11210/24:10489728 - isvavai.cz</a>
Výsledek na webu
<a href="https://wiki.korpus.cz/doku.php/cnk:ortofon" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:ortofon</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem
Popis výsledku v původním jazyce
Cílem korpusu ORTOFON je reprezentace spontánního mluveného jazyka užívaného v neformálních situacích mezi mluvčími, kteří se navzájem znají. Mluvčí pocházejí z celé České republiky a jsou o nich shromažďovány relevantní sociolingvistické informace. Korpus disponuje víceúrovňovým přepisem na ortografické a fonetické rovině. Oproti předchozí verzi byl do korpusu ORTOFON v3 přídán další materiál, byla provedena řada oprav v transkripci a především byl opatřen zcela novou lemmatizací a morfologickým značkováním ve standardu korpusu SYN2020.
Název v anglickém jazyce
ORTOFON v3: Corpus of informal spoken Czech with multi-tier transcription
Popis výsledku anglicky
The aim of the ORTOFON corpus is the representation of spontaneous spoken language used in informal situations among speakers who know each other. In ORTOFON, speakers from all over the Czech Republic are recorded and relevant sociolinguistic data about them is included in the metadata. The corpus features a multi-tier transcription on orthographic and phonetic layer. Compared to the previous version, new material was added to ORTOFON version 3, as well as a number of corrections were made to the transcription. Furthermore, ORTOFON v3 features a brand new lemmatization and morphological tagging following the SYN2020 standard.

Klasifikace

Druh
R - Software
CEP obor
—
OECD FORD obor
60203 - Linguistics

Návaznosti výsledku

Projekt
<a href="/cs/project/LM2023044" target="_blank" >LM2023044: Český národní korpus</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Interní identifikační kód produktu
ORTOFON v3
Technické parametry
Soubor jazykových dat dostupný na http://korpus.cz/
Ekonomické parametry
Korpus je volně přístupný a primárně nevytváří žádný zisk.
IČO vlastníka výsledku
00216208
Název vlastníka
Univerzita Karlova

Podobné výsledky(10)

Mapping Diatopic and Diachronic Variation in Spoken Czech: the ORTOFON and DIALEKT Corpora ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem ORTOFON v2: Korpus neformální mluvené češtiny s víceúrovňovým přepisem

Co hledáte?

Rychlé hledání

Chytré vyhledávání

ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)