Implementace vysoce paralelních databází pro podobnostní vyhledávání - FuMet - Similarity Metric Based on Lempel-Ziv Complexity and Fuzzy sets
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61989100%3A27740%2F15%3A86096396" target="_blank" >RIV/61989100:27740/15:86096396 - isvavai.cz</a>
Výsledek na webu
<a href="http://dap.vsb.cz/sw/fumet/" target="_blank" >http://dap.vsb.cz/sw/fumet/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Implementace vysoce paralelních databází pro podobnostní vyhledávání - FuMet - Similarity Metric Based on Lempel-Ziv Complexity and Fuzzy sets
Popis výsledku v původním jazyce
Tento softwarový nástroj slouží k masivní paralelní zpracování textových dat. Je určen k měření podobnosti vstupních dat. Další funkcí, kterou software poskytuje vyhledání podobných dat k zadanému vstupu. Dokáže zpracovat různý typy textových dat, jako jsou například školní závěrečné práce, e-maily, různý typy dokumentů, případně jiná data převedeny do textové formy. Uplatnění najdu v mnoha oblastech dolování z dat, detekce plagiátů, detekce nevyžádané a jiných oblastech. Software lze použít na hledánípodobných nebo odlišných textových dokumentů nebo jejich shlukování.
Název v anglickém jazyce
Implementation of highly parallel database for similarity search - FuMet - Similarity Metric Based on the Lempel-Ziv Complexity and Fuzzy sets
Popis výsledku anglicky
This software tool is used for massively parallel processing of text data. It is designed to measure the similarity of the input data. Another feature which provides software to find similar data for the specified entry. Can handle different types of text data, such as a school thesis, e-mails, various types of documents or other data converted into text form. I find application in many fields of data mining, detection of plagiarism detection junk and other areas. The software can be used to search forsimilar or different text documents or clumping.
Klasifikace
Druh
R - Software
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/ED1.1.00%2F02.0070" target="_blank" >ED1.1.00/02.0070: Centrum excelence IT4Innovations</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
040/27-11-2015_sw
Technické parametry
Software je implementován na platformě Microsoft .NET Framework. Může být využit na všech platformách operačních systémů s podporou .Net Framework 4. Dynamická knihovna může připojené k novým nebo exit softwarovým řešení. Dokáže využít maximální potenciál při paralelním zpracování, který poskytuje hostitelský systém. Software dokáže zpracovat i rozsáhlé data. Efektivní výsledky dosahuje na systémech s více jádry, případně procesory. Samotný softwar, který je volně ke stažení, lze nalézt na http://dap.vsb.cz/sw/fumet/ .
Ekonomické parametry
V oblasti zpracování dat se setkáváme s narůstajícím množstvím dat. Tento stále narůstající objem dat je třeba zpracovat v požadovaném čase. S narůstajícím potřebným časem na zpracování dat ztrácejí výsledky na své aktuálnosti. Z toho důvodu potřebujemesoftware, který poskytuje dostatečný výkon ale i přesné výsledky. Tento software využívá dostupné paralelní možnosti systému, čímž umožňuje zkrátit potřebnou dobu na zpracování dat.
IČO vlastníka výsledku
61989100
Název vlastníka
VŠB - Technická univerzita Ostrava