Aproximate String Matching by Combining Automaton Approach and Binary Neural Networks
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F07%3A03133219" target="_blank" >RIV/68407700:21230/07:03133219 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Aproximate String Matching by Combining Automaton Approach and Binary Neural Networks
Original language description
The article describes an approximate string matching method based on Correlation Matrix Memories (CMMs). As the measure of similarity, we use the Damerau-Levenshtein string edit distance, which is suitable for typing errors. CMMs are type of binary neural networks. They are capable of both exact and approximate matching (based on the Hamming distance). While the substitution operation can be performed by the common recalling method of CMM, the other edit operations (insertion, deletion and transposition) require enhancement of the recalling method. We incorporated a simple automaton for each of these operations into the recalling process. The proposed method preserves the advantage of this type of neural network: its simplicity. To keep both simplicityand the recalling speed, we primarily focus on approximate matching allowing a single error. Besides the edit distance problem we proposed two methods that speeds up the recalling process of CMMs.
Czech name
Približné vyhledávání pomocí kombinace automatového prístupu a binárních neuronových sítí
Czech description
Clánek popisuje približné vyhledávání retezcu pomocí binárních korelacních matic. Jako míru podobnosti mezi retezci jsme použili Damerau-Levenshteinovu editační vzdálenost, která je vhodná pro preklepy. Binární korelacní matice jsou druhem binárních neuronových sítí. Umožnují jak presné tak i približné vyhledávání (založené na Hammingove vzdálenosti). Hammingova vzdálenost odpovídá operaci "substitution". Pro implementaci dalších trí editacních operací ("insertion", "deletion" a "transposition") jsme rozšírili neuronovou sít o jednoduchý automat. Pro zachování jednoduchosti a rychlosti CMM jsme se soustredili na jednotkovou editacní vzálenost. Dále jsme popsali dve metody, které zrychlují proces vybavení CMM.
Classification
Type
D - Article in proceedings
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
—
Continuities
Z - Vyzkumny zamer (s odkazem do CEZ)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Artificial Intelligence and Soft Computing
ISBN
978-0-88986-693-5
ISSN
—
e-ISSN
—
Number of pages
66
Pages from-to
19-24
Publisher name
ACTA Press
Place of publication
Anaheim
Event location
Palma de Malorca
Event date
Aug 29, 2007
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—