Prototyp algoritmů robustní datové analýzy: HW, metodiky, datové filtry a webovské datové rozhraní
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F24718602%3A_____%2F21%3AN0000006" target="_blank" >RIV/24718602:_____/21:N0000006 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.caia.cz" target="_blank" >http://www.caia.cz</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Prototyp algoritmů robustní datové analýzy: HW, metodiky, datové filtry a webovské datové rozhraní
Popis výsledku v původním jazyce
Výsledkem jsou prototypy algoritmů robustní datové analýzy založené na matematické gnostice (MG), společně s HW, metodikami popsanými v popisu programu (Guide) k metodě pokročilé informační analýze (AIA), datovými filtry a webovským datovým rozhraním, které nahraují roztříštěnost platforem. Podporovány jsou nejběžnější prohlížeče pro Windows/OS X/Linux (Unix) zapracované do SW v jazyku R a D. Prototypy procedur jsou v jazyce S-plus (Statistica) a procedury v open-source programu Octave. Knihovny mají určitou podobnost se systémem knihoven R, proto byly postupy přeneseny z prototypu pro reálného prostředí aplikace. Přenos byl nutný hlavně proto, že Statistica není komerčně k dispozici multiplatformně a bylo nutné postupy přenést do knihoven jazyka R a D, v jiném systému multiplatformy, což reprezentují systémy AIAE. Prototypy procedur S+ jsou popsány v zmíněném Guide, z nich pak byly zpracovány procedury v R, které byly implementovány do databázového systému Labkey. Přenos knihoven do R a Labkey, které jsou nativně multiplatformní, nahradily zamýšlené web rozhraní. Stejně tak implementace R v rozhraní AIA Exploreru Jako HW bylo využito systému DELL PowerEdge R710 Server 2 x SIX Core X5660 48GB RAM 8TB. Na něm byly instalovány komponenty serveru Labkey Debian 11 (Linux). Dále pak Apache Tomcat 9 server a nakonec Labkey server verze 21 (poslední aktualizace prosinec 2021). Do systému byly implementovány knihovny R, které byly přeneseny z prostředí S-plus, a kde to bylo vhodné, přenesené do jazyka D. Pro přenos byla zpracována obsáhlá syntaktická dokumentace. Testování knihoven bylo provedeno pomocí prototypových testů a teoretického srovnání původce knihoven MG. Knihovny R a D jsou tedy prototypovými knihovnami AIA, uvedené v popisu programu.
Název v anglickém jazyce
Prototype of robust data analysis algorithms: HW, methodologies, data filters and web data interface
Popis výsledku anglicky
The result is robust data analysis algorithm prototypes based on Mathematical Gnostic (MG), together with HW, methodologies described in the Guide to the Advanced Information Analysis (AIA) method, data filters, and a web-based data interface that record the fragmentation of platforms. The most common browsers for Windows/OS X/Linux (Unix) incorporated into the SW in the R and D language are supported. Prototypes of the procedures are in the S-plus language (Statistica) and procedures in the open-source program Octave. The libraries have some similarity to the R library system, so the procedures were carried over from the prototype for the real application environment. The transfer was necessary mainly because Statistica is not commercially available cross-platform, and it was necessary to transfer the procedures to the R and D language libraries, in another cross-platform system, represented by the AIAE systems. Prototypes of S+ procedures are described in the aforementioned Guide, and procedures in R were processed from them, which were implemented in the Labkey database system. Porting the libraries to R and Labkey, which are natively cross-platform, replaced the intended web interface. As well as the implementation of R in the AIA Explorer interface, the DELL PowerEdge R710 Server 2 x SIX Core X5660 48GB RAM 8TB system was used as HW. Labkey Debian 11 (Linux) server components were installed on it. Then Apache Tomcat 9 server and finally Labkey server version 21 (last update December 2021). R libraries were implemented into the system, which were transferred from the S-plus environment, and where appropriate, transferred to the D language. Extensive syntax documentation was prepared for the transfer. Library testing was done using prototype tests and a theoretical comparison of the originator of the MG libraries. The R and D libraries are therefore the AIA prototype libraries, listed in the program description.
Klasifikace
Druh
G<sub>prot</sub> - Prototyp
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/EG17_107%2F0012336" target="_blank" >EG17_107/0012336: Vývoj metod pokročilé informační analýzy pro životní prostředí a klinickou praxi</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
CAIA v2021/01
Číselná identifikace
—
Technické parametry
Prototyp se skládá z protytypu AIA Exploreru, Labkey serveru s knihovnami a popisu systému v tzv. Guidu. Guide je velmi důležitým materiálem k robustní datové analýze, neb reprezentuje prototyp různých aplikací, který také přikládáme k výsledkům. Výsledky pokrývají různé oblasti, které jsou základem pro různé koncové skupiny uživatelů. Prototyp AIA Exploreru je rozhraní, které zajišťuje přístup k exploratorní analýze, k vizualizaci dat a následný přenos dat do datového skladu Labkey. Maximálního efektu je dosaženo při 100% propojení Exploreru a Labkey serveru. Prototypové knihovny byly zapracovány do systému Labkey, v druhém kroku jsou základem pro přenos do systému AIA Explorer. Shrnutí dalšího postupu pro uplatnění výstupů v praxi: V nejbližší době se předpokládá překlad (Guide) do dalších jazyků dle potřeby koncových uživatelů. Instalace prototypu serveru slouží pro klonování dalších instancí serveru, např. tam, kde jevhodné uplatnit např. multiprocesorové zpracování.Případové studie slouží jako nedílná součást vzdělávacích materiálů pro různé koncové skupiny. program je jeden a zvlášť kompilován pro prostředí Windows, OSX a Linux. AIA Explorer nabízí snadnou práci s daty v analogii pivotních pohledů. Jeho síla je v průzkumové analýze, přičemž si uživatel musí zvolit nejvhodnější sadu analytických nástrojů. Velkou výhodou je poměrně obsáhlá knihovna statistických nástrojů, které si uživatel může zvolit s nástroji nestatistickými (robustními) v Labkey. Velkou pochvalu zaslouží podpora importu snad všech možných zdrojů dat - od napůl již archaických typu DBF, DB, přes databázové MySQL, přes tabulkové CSV či XLS(X). Multiuživatelské prostředí není v tomto systému řešeno, což je samozřejmé, protože je propojeno s Labkey, který uživatelsky nastaveno je. V nejbližší době se předpokládá překlad (Guide) do dalších jazyků dle potřeby koncových uživatelů. První verze bude v češtině. Instalace prototypu serveru bude sloužit pro klonování dalších instancí serveru, např. tam, kde bude vhodné uplatnit např. multiprocesorové zpracování. Aplikace, kde některé z nich jsou uvedeny jako příloha Guide, budou dále zpracovávány jako případové studie. Budou tak sloužit jako nedílná součást vzdělávacích materiálů pro různé koncové skupiny.
Ekonomické parametry
Ekonomický přínos závisí zejména na rozvoji případových studií, v současné dispozci je k dispozici řada studií jak z environmentální, tak klinické praxe..S novými studiemi se bude nabalovat zájem koncových klientů. Když se metodiky stanou nepsaným standardem v robustním způsobu vyhodnocování naměřených dat, budou muset fungovat zcela bezchybně. Významným průlomem je zájem organizace NIST. Přenos knihoven 2 prostředí jazyka S+ je významným motivem, zejména díky ceně balíků na uživatele (cca přes 3500 USD/uživateIe/rok) a zejména uzavřenosti prostředí mezi platformami (uvedený balík je k dispozici pod platformou Windows), Licencování produktů je kombinované, licenční podmínky jsou stanoveny. V současnosti je primárním využitím realizace služby pokročilých datových analýz společností E&H services. Po dopracování do nezbytných funkcí dalších výstupů s příslušným otestováním programové stability bude systém uveden na trh i jako SW produkt.
Kategorie aplik. výsledku dle nákladů
—
IČO vlastníka výsledku
24718602
Název vlastníka
E&H services a.s.
Stát vlastníka
CZ - Česká republika
Druh možnosti využití
V - Výsledek je využíván vlastníkem
Požadavek na licenční poplatek
Z - Poskytovatel licence na výsledek nepožaduje v některých případech licenční poplatek
Adresa www stránky s výsledkem
www.caia.cz