Creating Corpora and Lingustics Data Mining. Methods, models, tools.

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989592%3A15210%2F14%3A33150479" target="_blank" >RIV/61989592:15210/14:33150479 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—

Alternative languages

Result language
čeština
Original language name
Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Original language description
Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.
Czech name
Tvorba korpusů a vytěžování jazykových dat. Metody, modely, nástroje.
Czech description
Kniha nabízí systematický vhled do problematiky technického zpracování jazykových dat, vytěžování dat a prezentuje možnosti a prostředky, jak sestavit vlastní textovou databázi (korpus). Text uvádí čtenáře do elementárních základů technického zpracovánídat (zejm. anotace - strukturní i lingvistická, značkovací jazyk XML, možnosti (polo)automatické segmentace a značkování textů) a na tomto základě prezentuje komplexní možnosti algoritmického zápisu vyhledávacích masek jazyka CQL (Corpus Query Language).Jde tedy o možnosti a principy počítačového zpracování jazykového textu, nikoli o interpretaci lingvistických dat. Cílem tohoto textu je především poskytnout metody a principy tvorby a vytěžování jazykových databází s využitím existujících softwarovýchnástrojů, a to počínaje textovými editory, přes specializované aplikace či práci s počítačovými skripty až ke komplexním korpusovým nástrojům.

Classification

Type
B - Specialist book
CEP classification
AI - Linguistics
OECD FORD branch
—

Result continuities

Project
—
Continuities
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace

Others

Publication year
2014
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Data specific for result type

ISBN
978-80-87895-17-7
Number of pages
288
Publisher name
Univerzita Palackého v Olomouci, Filozofická fakulta
Place of publication
Olomouc
UT code for WoS book
—

Similar results(10)

HaBiT system Hindi Dictionaries and the Hindi Lexicographical Corpus.Advances in Machine Learning for the Behavioral Sciences

What are you looking for?

Quick search

Smart search

Creating Corpora and Lingustics Data Mining. Methods, models, tools.

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Data specific for result type

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Data specific for result type

Data specific for result type

Similar results(10)