Text Encoding and Recall Speedup for Correlation Matrix Memories
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03133379" target="_blank" >RIV/68407700:21230/07:03133379 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Text Encoding and Recall Speedup for Correlation Matrix Memories
Original language description
This article describes a part of our search engine based on Correlation matrix Memories. We focus on a part of our search engine that takes a single word from an input query and looks for its word representative (word label). Although our letter-word matcher provides exact matching, approximate matching and stemming, we pay here attention on the exact matching only. We proposed two encoding methods of input patterns designed to reduce memory consumption of CMMs. Both methods give some level of error rate in comparison with a standard approach. The first method allows to reduce memory more than 7~times. There is a tradeoff between memory requirement and error rate value. We also tested an n-gram approach for memory consumption and the error rate. We suggest three methods of speeding up a software simulation of the CMM recalling process. Combining all three we achieved a significant speedup of a standard method.
Czech name
Kódování textu a zrychlení vybavování pro binární korelační matice
Czech description
Náš článek popisuje část vyhledávacího stroje, který je založen na binární neuronové síti zvané binární korelační matice. Soustředili jsme se na část vyhledávacího stroje, který asociuje vstupní slovo s jeho identifikátorem. Ačkoliv tato část umožňuje přibližné i přesné vyhledávání, soustředili jsme se na přesné vyhledávání. Navrhli jsme několik metod, které snižují paměťovou náročnost. Navržená metoda umožňuje volit mezi paměťovou náročností a chybovostí. Dále jsme navrhli tři metody pro zrychlení vybavení korelačních matic. Použitím všech tří metod jsme dosáhli podstatného zrychlení procesu vybavování.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Proceedings of the 6th EUROSIM Congress on Modelling and Simulation
ISBN
978-3-901608-32-2
ISSN
—
e-ISSN
—
Number of pages
6
Pages from-to
—
Publisher name
ARGESIM
Place of publication
Vienna
Event location
Ljubljana
Event date
Sep 9, 2007
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—