Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F24%3A10489728" target="_blank" >RIV/00216208:11210/24:10489728 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://wiki.korpus.cz/doku.php/cnk:ortofon" target="_blank" >https://wiki.korpus.cz/doku.php/cnk:ortofon</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    ORTOFON v3: Korpus neformální mluvené češtiny s víceúrovňovým přepisem

  • Popis výsledku v původním jazyce

    Cílem korpusu ORTOFON je reprezentace spontánního mluveného jazyka užívaného v neformálních situacích mezi mluvčími, kteří se navzájem znají. Mluvčí pocházejí z celé České republiky a jsou o nich shromažďovány relevantní sociolingvistické informace. Korpus disponuje víceúrovňovým přepisem na ortografické a fonetické rovině. Oproti předchozí verzi byl do korpusu ORTOFON v3 přídán další materiál, byla provedena řada oprav v transkripci a především byl opatřen zcela novou lemmatizací a morfologickým značkováním ve standardu korpusu SYN2020.

  • Název v anglickém jazyce

    ORTOFON v3: Corpus of informal spoken Czech with multi-tier transcription

  • Popis výsledku anglicky

    The aim of the ORTOFON corpus is the representation of spontaneous spoken language used in informal situations among speakers who know each other. In ORTOFON, speakers from all over the Czech Republic are recorded and relevant sociolinguistic data about them is included in the metadata. The corpus features a multi-tier transcription on orthographic and phonetic layer. Compared to the previous version, new material was added to ORTOFON version 3, as well as a number of corrections were made to the transcription. Furthermore, ORTOFON v3 features a brand new lemmatization and morphological tagging following the SYN2020 standard.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/LM2023044" target="_blank" >LM2023044: Český národní korpus</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2024

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    ORTOFON v3

  • Technické parametry

    Soubor jazykových dat dostupný na http://korpus.cz/

  • Ekonomické parametry

    Korpus je volně přístupný a primárně nevytváří žádný zisk.

  • IČO vlastníka výsledku

    00216208

  • Název vlastníka

    Univerzita Karlova