SPAM Detection: Naïve Bayesian Classification and RPN Expression-based LGP Approaches Compared
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F70883521%3A28140%2F16%3A43875602" target="_blank" >RIV/70883521:28140/16:43875602 - isvavai.cz</a>
Výsledek na webu
<a href="http://link.springer.com/chapter/10.1007/978-3-319-33622-0_36" target="_blank" >http://link.springer.com/chapter/10.1007/978-3-319-33622-0_36</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-33622-0_36" target="_blank" >10.1007/978-3-319-33622-0_36</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
SPAM Detection: Naïve Bayesian Classification and RPN Expression-based LGP Approaches Compared
Popis výsledku v původním jazyce
An investigation is performed of a machine learning algorithm and the Bayesian classifier in the spam-filtering context. The paper shows the advantage of the use of Reverse Polish Notation (RPN) expressions with feature extraction compared to the traditional Naïve Bayesian classifier used for spam detection assuming the same features. The performance of the two is investigated using a public corpus and a recent private spam collection, concluding that the system based on RPN LGP (Linear Genetic Programming) gave better results compared to two popularly used open source Bayesian spam filters.
Název v anglickém jazyce
SPAM Detection: Naïve Bayesian Classification and RPN Expression-based LGP Approaches Compared
Popis výsledku anglicky
An investigation is performed of a machine learning algorithm and the Bayesian classifier in the spam-filtering context. The paper shows the advantage of the use of Reverse Polish Notation (RPN) expressions with feature extraction compared to the traditional Naïve Bayesian classifier used for spam detection assuming the same features. The performance of the two is investigated using a public corpus and a recent private spam collection, concluding that the system based on RPN LGP (Linear Genetic Programming) gave better results compared to two popularly used open source Bayesian spam filters.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Software Engineering Perspectives and Application in Intelligent Systems: Proceedings of the 5th computer science on-line conference 2016, Vol. 2
ISBN
978-3-319-33620-6
ISSN
2194-5357
e-ISSN
—
Počet stran výsledku
12
Strana od-do
399-411
Název nakladatele
Springer-Verlag Berlin
Místo vydání
Heidelberg
Místo konání akce
on-line
Datum konání akce
27. 4. 2016
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000385788200036