Implementace slovních kompresních metod
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F08%3A03147357" target="_blank" >RIV/68407700:21230/08:03147357 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
On Implementation of Word-Based Compression Methods
Popis výsledku v původním jazyce
The paper presents an implementation of dictionary and statistical word-based data compression methods. The data compression is one of the main techniques of reducing time needed to transmit data over the network. The word-based text compression is a novel compression approach which exploits high correlation between words in sentence. The basic idea of the word-based compression methods is to consider words as source units instead of characters. These methods are efficient especially for natural language compression. Our results prove better compression ratio of word-based methods in comparison to character-based methods. We present generalized concept of dense coding in this paper. This concept allows us to adjust the coding schema to data domain andso achieve better compression ratio.
Název v anglickém jazyce
On Implementation of Word-Based Compression Methods
Popis výsledku anglicky
The paper presents an implementation of dictionary and statistical word-based data compression methods. The data compression is one of the main techniques of reducing time needed to transmit data over the network. The word-based text compression is a novel compression approach which exploits high correlation between words in sentence. The basic idea of the word-based compression methods is to consider words as source units instead of characters. These methods are efficient especially for natural language compression. Our results prove better compression ratio of word-based methods in comparison to character-based methods. We present generalized concept of dense coding in this paper. This concept allows us to adjust the coding schema to data domain andso achieve better compression ratio.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA201%2F06%2F1039" target="_blank" >GA201/06/1039: Analýza a zpracování textu</a><br>
Návaznosti
Z - Vyzkumny zamer (s odkazem do CEZ)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
4th Doctoral Workshop on Mathematical and Engineering Methods in Computer Science
ISBN
978-80-7355-082-0
ISSN
—
e-ISSN
—
Počet stran výsledku
8
Strana od-do
—
Název nakladatele
Ing. Zdenek Novotny, CSc.
Místo vydání
Brno
Místo konání akce
Znojmo
Datum konání akce
14. 11. 2008
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—