Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F14%3A33150479" target="_blank" >RIV/61989592:15210/14:33150479 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.

  • Popis výsledku v původním jazyce

    Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.

  • Název v anglickém jazyce

    Creating Corpora and Lingustics Data Mining. Methods, models, tools.

  • Popis výsledku anglicky

    The book offers a systematic insight into the issue of language data processing and data mining. The text is focused on the basics of technical data processing (esp. structural and linguistic annotation, XML markup language, the possibility of (semi) automatic segmentation and tagging of texts), and on this basis presents methods and possibilities of algorithmic search patterns using CQL (Corpus Query Language).

Klasifikace

  • Druh

    B - Odborná kniha

  • CEP obor

    AI - Jazykověda

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

  • Návaznosti

    I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

  • Rok uplatnění

    2014

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • ISBN

    978-80-87895-17-7

  • Počet stran knihy

    288

  • Název nakladatele

    Univerzita Palackého v Olomouci, Filozofická fakulta

  • Místo vydání

    Olomouc

  • Kód UT WoS knihy