Modul pro syntaktickou a sémantickou analýzu dotazovacích jazyků používaných v Big Data
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F25650203%3A_____%2F18%3AN0000004" target="_blank" >RIV/25650203:_____/18:N0000004 - isvavai.cz</a>
Výsledek na webu
<a href="http://www.getmanta.com" target="_blank" >http://www.getmanta.com</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Modul pro syntaktickou a sémantickou analýzu dotazovacích jazyků používaných v Big Data
Popis výsledku v původním jazyce
Modul automatizuje syntaktickou a sémantickou analýzu vybraných dotazovacích jazyků používaných v Big Data za použití databázového slovníku, extrakci metadat včetně metadat potřebných pro analýzu datových toků. Na základě rešerší byly pro pilotní implementaci vybrány tyto tři jazyky: Apache HiveQL – jeden z dialektů SQL používaný pro dotazování nad daty uloženými na distribuovaném souborovém systému v platformě Hadoop; Amazon Redshift – distribuovaná relační databáze využívající podmnožinu jazyka PostgreSQL používaná pro zpracování velkých dat v cloudových úložištích AWS; Apache Sqoop – nástroj pro dávkový přesun velkých dat mezi Hadoopem a databázemi. Tento software byl průběžně testován v rozsahu nutném pro dosažení vysoké kvality produktu a jeho snadnou komercionalizaci. Pro jednotlivé části byly vypracovány programátorské dokumentace.
Název v anglickém jazyce
Module for syntactic and semantic analysis of query languages used in Big Data
Popis výsledku anglicky
The module automatizes the syntactic and semantic analysis of selected query languages used in Big Data with usage of database dictionary and the extraction of metadata including metadata necessary for data flow analysis. Based on the previous research, these three languages were selected for the pilot implementation: Apache HiveQL – one of the SQL dialect used for querying data stored at distributed file system in Hadoop platform; Amazon Redshift - a distributed relational database using a subset of PostgreSQL language used for processing big data in AWS cloud storage; Apache Sqoop - a tool for big data movement between Hadoop and relational databases. This software was tested to the extent necessary for achieving high product quality and its easy commercialization. For each part, a programmer documentation was created.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/TH02010287" target="_blank" >TH02010287: Nástroje pro governance dynamických aspektů Big Data prostředí</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Manta Flow
Technické parametry
Výsledek posloužil jako prototypová implementace, která byla a postupně je produktizována a integrována do platformy Manta, která je následně nabízena klientům po celém světě. Za rok 2019 a první měsíce roku 2020 bylo uzavřeno více než 25 nových smluv o licenčním využití výsledku. S ohledem na obchodní tajemství nelze uvést jména klientů ani uzavřené smlouvy.
Ekonomické parametry
Platforma Manta rozšířená o nové funkce vytvořené na základě prototypové implementace byla poskytnuta novým zákazníkům s tržbami na licenčních poplatcích v řádu desítek milionů českých korun.
IČO vlastníka výsledku
25650203
Název vlastníka
Manta Tools, s.r.o.