Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F14%3A33150479" target="_blank" >RIV/61989592:15210/14:33150479 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Popis výsledku v původním jazyce
Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.
Název v anglickém jazyce
Creating Corpora and Lingustics Data Mining. Methods, models, tools.
Popis výsledku anglicky
The book offers a systematic insight into the issue of language data processing and data mining. The text is focused on the basics of technical data processing (esp. structural and linguistic annotation, XML markup language, the possibility of (semi) automatic segmentation and tagging of texts), and on this basis presents methods and possibilities of algorithmic search patterns using CQL (Corpus Query Language).

Klasifikace

Druh
B - Odborná kniha
CEP obor
AI - Jazykověda
OECD FORD obor
—

Návaznosti výsledku

Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Ostatní

Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

ISBN
978-80-87895-17-7
Počet stran knihy
288
Název nakladatele
Univerzita Palackého v Olomouci, Filozofická fakulta
Místo vydání
Olomouc
Kód UT WoS knihy
—

Podobné výsledky(10)

HaBiT system Hindi Dictionaries and the Hindi Lexicographical Corpus.Advances in Machine Learning for the Behavioral Sciences

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)