Creating Corpora and Lingustics Data Mining. Methods, models, tools.
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F14%3A33150479" target="_blank" >RIV/61989592:15210/14:33150479 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Original language description
Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.
Czech name
Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Czech description
Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.
Classification
Type
B - Specialist book
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
—
Continuities
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Others
Publication year
2014
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
ISBN
978-80-87895-17-7
Number of pages
288
Publisher name
Univerzita Palackého v Olomouci, Filozofická fakulta
Place of publication
Olomouc
UT code for WoS book
—