Building Big Czech Corpus : Collecting and Converting Czech Corpora
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00024361" target="_blank" >RIV/00216224:14330/08:00024361 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Building Big Czech Corpus : Collecting and Converting Czech Corpora
Original language description
This paper describes a creating of a big Czech corpus from many Czech corpora kept on the NLP Centre server. It describes new tools developed for this purpose, difficulties which may come up and a way how solve them.
Czech name
Budování velkého českého korpusu : shromáždění a konverze českých korpusů
Czech description
Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení.
Classification
Type
D - Article in proceedings
CEP classification
AI - Linguistics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/1ET200610406" target="_blank" >1ET200610406: Internet Language Consulting Service</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2008
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
RASLAN 2008
ISBN
978-80-210-4741-9
ISSN
—
e-ISSN
—
Number of pages
100
Pages from-to
—
Publisher name
Masaryk University, Brno
Place of publication
Masaryk University, Brno
Event location
Karlova Studánka. Czech Republic
Event date
Jan 1, 2008
Type of event by nationality
CST - Celostátní akce
UT code for WoS article
—