Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Víceslovné jednotky typické pro české akademické texty

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216208%3A11210%2F21%3A10436222" target="_blank" >RIV/00216208:11210/21:10436222 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=eb3H~KjkXL" target="_blank" >https://verso.is.cuni.cz/pub/verso.fpl?fname=obd_publikace_handle&handle=eb3H~KjkXL</a>

  • DOI - Digital Object Identifier

    <a href="http://dx.doi.org/10.14712/23366591.2021.2.4" target="_blank" >10.14712/23366591.2021.2.4</a>

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Víceslovné jednotky typické pro české akademické texty

  • Popis výsledku v původním jazyce

    This paper introduces Akalex, a new online tool created to help vocabulary research in Czech academic texts. The Akalex database includes almost 60 000 n-grams - candidates for typical academic words or multiword units - and can be easily searched and filtered according to several criteria. These n-grams were extracted from the SYN2015 corpus of written contemporary Czech based on their prominent frequency in academic texts and shared occurrence in many different academic disciplines, which distinguish them from general vocabulary on one hand and specialized terminology on the other. Each n-gram in the database is also provided with additional information, such as part-of-speech, distribution in disciplines, frequency etc., making it possible to search for e.g. specific collocations with a specific lexeme (such as adjectives combined with the word výzkum &apos;research&apos; or verbs with a certain preposition). The features of Akalex were put to test in our case study covering 2-grams to 6-grams used in all 24 academic disciplines included in the SYN2015 corpus. Out of almost 900 candidates, 236 were manually chosen by two annotators as typical for academic texts. These were then further analysed and split into groups based on their semantic, functional and formal features. Among the most frequent were lexical bundles, collocations with content words and combinations of two verbs pointing to a frequent use of passives in academic texts etc.

  • Název v anglickém jazyce

    Multi-word units in Czech Academic Texts

  • Popis výsledku anglicky

    This paper introduces Akalex, a new online tool created to help vocabulary research in Czech academic texts. The Akalex database includes almost 60 000 n-grams - candidates for typical academic words or multiword units - and can be easily searched and filtered according to several criteria. These n-grams were extracted from the SYN2015 corpus of written contemporary Czech based on their prominent frequency in academic texts and shared occurrence in many different academic disciplines, which distinguish them from general vocabulary on one hand and specialized terminology on the other. Each n-gram in the database is also provided with additional information, such as part-of-speech, distribution in disciplines, frequency etc., making it possible to search for e.g. specific collocations with a specific lexeme (such as adjectives combined with the word výzkum &apos;research&apos; or verbs with a certain preposition). The features of Akalex were put to test in our case study covering 2-grams to 6-grams used in all 24 academic disciplines included in the SYN2015 corpus. Out of almost 900 candidates, 236 were manually chosen by two annotators as typical for academic texts. These were then further analysed and split into groups based on their semantic, functional and formal features. Among the most frequent were lexical bundles, collocations with content words and combinations of two verbs pointing to a frequent use of passives in academic texts etc.

Klasifikace

  • Druh

    J<sub>SC</sub> - Článek v periodiku v databázi SCOPUS

  • CEP obor

  • OECD FORD obor

    60203 - Linguistics

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/EF16_019%2F0000734" target="_blank" >EF16_019/0000734: Kreativita a adaptabilita jako předpoklad úspěchu Evropy v propojeném světě</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2021

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Název periodika

    Časopis pro moderní filologii [online]

  • ISSN

    2336-6591

  • e-ISSN

  • Svazek periodika

    103

  • Číslo periodika v rámci svazku

    2

  • Stát vydavatele periodika

    CZ - Česká republika

  • Počet stran výsledku

    16

  • Strana od-do

    228-243

  • Kód UT WoS článku

  • EID výsledku v databázi Scopus

    2-s2.0-85111711926