Searching for optimal alphabet for data compression using simulated annealing
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27240%2F12%3A86085010" target="_blank" >RIV/61989100:27240/12:86085010 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1109/ICSMC.2012.6377768" target="_blank" >http://dx.doi.org/10.1109/ICSMC.2012.6377768</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1109/ICSMC.2012.6377768" target="_blank" >10.1109/ICSMC.2012.6377768</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Searching for optimal alphabet for data compression using simulated annealing
Popis výsledku v původním jazyce
Data compression is very important today and it will be even more important in the future. Textual data use only limited alphabet - total number of used symbols (letters, numbers, diacritics, dots, spaces, etc.). In most languages, letters are joined into syllables and words. All three approaches are useful in text compression, but none of them is the best for any file. This paper describes a variant of algorithm for evolving alphabet from characters, 2-grams and 3-grams, which is optimal for compression of text files. We used Simulated Annealing for this evolution of the alphabet. The efficiency of the new variant will be tested on four compression algorithms. The achieved results are very promising. 2012 IEEE.
Název v anglickém jazyce
Searching for optimal alphabet for data compression using simulated annealing
Popis výsledku anglicky
Data compression is very important today and it will be even more important in the future. Textual data use only limited alphabet - total number of used symbols (letters, numbers, diacritics, dots, spaces, etc.). In most languages, letters are joined into syllables and words. All three approaches are useful in text compression, but none of them is the best for any file. This paper describes a variant of algorithm for evolving alphabet from characters, 2-grams and 3-grams, which is optimal for compression of text files. We used Simulated Annealing for this evolution of the alphabet. The efficiency of the new variant will be tested on four compression algorithms. The achieved results are very promising. 2012 IEEE.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Conference Proceedings - IEEE International Conference on Systems, Man and Cybernetics 2012
ISBN
978-1-4673-1714-6
ISSN
1062-922X
e-ISSN
—
Počet stran výsledku
6
Strana od-do
468-473
Název nakladatele
IEEE
Místo vydání
New York
Místo konání akce
Soul
Datum konání akce
14. 10. 2012
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—