Software – balík pro marginální a multivariantní datovou analýzu
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F24718602%3A_____%2F21%3AN0000004" target="_blank" >RIV/24718602:_____/21:N0000004 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.caia.cz" target="_blank" >http://www.caia.cz</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Software – balík pro marginální a multivariantní datovou analýzu
Popis výsledku v původním jazyce
Výsledkem jsou algoritmy robustní datové analýzy, založené na matematické gnostice (MG) zapracované do SW pro pokročilou informační analýzu. Jde o vícevrstvé řešení které zahrnuje import dat, exploratorní analýzu, převod a uložení dat a výstupů v datovém skladu. Výstupy jsou realizovány v HTML formátu. Pro exploratorní analýzu jde o systém AIA Explorer, procedury jsou uloženy v jazyce R a D; data jsou administrována v systému Labkey, který je napojen na databázi PostgreSQL. Popis a základní postupy robustní analýzy je zakotven v Guide, popisující vybrané úkoly robustní analýzy.
Název v anglickém jazyce
Software – a package for marginal and multivariate data analysis
Popis výsledku anglicky
The result is robust data analysis algorithms based on mathematical gnostic (MG) incorporated into SW for advanced information analysis. It is a multi-layered solution that includes data import, exploratory analysis, conversion and storage of data and outputs in a data warehouse. Outputs are implemented in HTML format. For exploratory analysis, it is the AIA Explorer system, the procedures are stored in the R and D language; data is administered in the Labkey system, which is connected to the PostgreSQL database. The description and basic procedures of robust analysis are embedded in the Guide, describing selected tasks of robust analysis.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/EG17_107%2F0012336" target="_blank" >EG17_107/0012336: Vývoj metod pokročilé informační analýzy pro životní prostředí a klinickou praxi</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Software AIA v2022
Technické parametry
Software představují algoritmy robustní datové analýzy, založené na matematické gnostice (MG) zapracované do SW pro pokročilou informační analýzu. Jde o vícevrstvé řešení, které zahrnuje import dat, exploratorní analýzu, převod a uložení dat a výstupů v datovém skladu. Výstupy jsou realizovány v HTML formátu. Pro exploratorní analýzu jde o systém AIA Explorer, procedury jsou uloženy v jazyce R a D; data jsou administrována v systému Labkey, který je napojen na databázi PostgreSQL. Popis a základní postupy robustní analýzy je zakotven v obsáhlém Guide, popisující vybrané úkoly robustní analýzy. Postup řešení spočíval nejdříve v přenosu teoreticky popsaných procedur z původních zdrojů, které jsou teoreticky popsány v různých zdrojích. Přenos byl realizován nejdříve do knihoven jazyka S+, díky podobnosti do R, který používá různé optimalizované procedury pro urychlení výpočtů, případně rozdělení výpočtů mezi několik počítačů. Procedury byly dále přepracovány do vyššího jazyka D, který umožnil nezávislost na interpretu jazyka R. Uživatelské prostředí bylo rozšířeno o rozhraní SW systému AIA Explorer, který umožňuje předběžnou analýzu pomocí křížových pohledů a průzkumovou analýzu. Další řešení vyžadovalo realizaci rozhraní s integrací procedur v R a D. Vedle toho probíhaly práce na datovém skladu. Při návrzích datového skladu byla přijata platforma pro datový sklad na multiplatformě Labkey. Ve vývoji celkového řešení, složené ze 2 podsystémy (rozhraní a datový sklad), které umí pracovat samostatně; bylo pracováno paralelně, aby bylo vůbec možné řešení provést. Základem obou podsystémů jsou však robustní platformy, mající silnou vývojovou základnu a zajištěnou dlouhodobou udržitelnost projektu (min. na 10 let). SW řešení AIA Explorer je postaveno na prostředí Electron. Electron je framework pro vytváření desktopových aplikací pomocí JavaScriptu, HTML a CSS. Díky tomu, že do své binární verze zabudoval Chromium a Node.js, umožňuje Electron udržovat jednu kódovou základnu JavaScriptu a vytvářet multiplatformní aplikace, které fungují v systémech Windows, MacOS a Linux. Díky tomu je systém platformě nezávislý. Navíc, Electron a inherentní Chromium umožňuje snadnou přenositelnost na web rozhraní, které je jednou z cílových řešení. Obdobně je postaveno řešení Labkey Server. Jde o softwarovou platformu s otevřeným zdrojovým kódem, která má výzkumným organizacím pomoci integrovat, analyzovat a sdílet komplexní biomedicínská data. LabKey Server, který lze přizpůsobit různým výzkumným protokolům, analytickým nástrojům a požadavkům na sdílení dat. Tento systém spojuje flexibilitu vlastního řešení se škálovatelností na podnikové úrovni pro podporu vědeckých pracovních postupů. Labkey nabízí vlastní instalaci na serveru, které jsme zvolili v prvním kroku. První verze programů je připravena v anglickém jazyce.
Ekonomické parametry
E&H services se dlouhodobě problematikou robustních datových analýz zaobírá. Doposud však nemohl nabídnout praktické aplikace pomocí vlastního SW systému. Toto omezení tímto projektem končí. Nyní může provádět 1) vlastní datové analýzy malých souborů dat s vysokou neurčitostí (velkým rozptylem), což je první úkol; 2) poskytovat SW jako licencované řešení pro vlastní informační systémy. Zde předpokládáme pomoc se systémovou integrací na informační systémy třetích stran (NIS, LIMS). Nakonec může provádět také školení 3a) datových analytiků, kteří budou s datovými analýzami pomáhat – a budou s čelním nasazení s lékaři a těmi, kteří primárně s daty pracují. Dále školení 3b) koncových uživatelů, kteří nemusí mít znalosti datových analytiků, včetně detailních znalostí jako datoví analytici o technice použití datových metod, ale budou mít o to větší znalosti z oborové interpretace závěrů datových analýz.
IČO vlastníka výsledku
24718602
Název vlastníka
E&H services a.s.