Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F14%3A33150479" target="_blank" >RIV/61989592:15210/14:33150479 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Popis výsledku v původním jazyce
Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.
Název v anglickém jazyce
Creating Corpora and Lingustics Data Mining. Methods, models, tools.
Popis výsledku anglicky
The book offers a systematic insight into the issue of language data processing and data mining. The text is focused on the basics of technical data processing (esp. structural and linguistic annotation, XML markup language, the possibility of (semi) automatic segmentation and tagging of texts), and on this basis presents methods and possibilities of algorithmic search patterns using CQL (Corpus Query Language).
Klasifikace
Druh
B - Odborná kniha
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
ISBN
978-80-87895-17-7
Počet stran knihy
288
Název nakladatele
Univerzita Palackého v Olomouci, Filozofická fakulta
Místo vydání
Olomouc
Kód UT WoS knihy
—