Jaký je význam kvality dat v oblasti velkých dat?
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F16%3A00305635" target="_blank" >RIV/68407700:21230/16:00305635 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21730/16:00305635
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Jaký je význam kvality dat v oblasti velkých dat?
Popis výsledku v původním jazyce
Vzhledem k novodobému trendu v medicíně, označovanému jako P4-medicine (Personalizovaná, Prediktivní, Preventivní a Participativní), se zdravotnické systémy musejí potýkat s čím dál větším množstvím velkých a složitých sad heterogenních dat s vysokou dimenzí. Musejí se také vypořádat s rostoucími objemy nestrukturovaných a často kontinuálních informací. V této souvislosti se také objevuje otázka, jak vhodně definovat koncept kvality dat. I u dobře strukturovaných dat není zcela jednoduché tento koncept přesně charakterizovat, protože je multidimenzionální. Velká data přidávají další dva rozměry složitosti: specifičnost daná zdrojem dat a vysoký stupeň nestrukturovanosti, často bez možnosti reference vůči nějakému zlatému standardu. Na případové studii ukážeme, jak je důležité porozumět kontextu dat a jejich zdroje, vzájemným vztahům mezi daty z více zdrojů a výsledkům ve vztahu k subjektu (zdroji dat).
Název v anglickém jazyce
What is the significance of data quality in the area of big data?
Popis výsledku anglicky
With respect to the recent trend in medicine, referred to as P4-medicine (Personalized, Predictive, Preventive and Participative), health care systems must cope with larger volume of complex sets of heterogeneous and multidimensional data. In addition, they have to cope with increasing volumes of unstructured and frequently continuous information. In this context there appears a question how to define suitably the concept of data quality. It is not an easy task to characterize the concept at well structured data because it is multidimensional. Big data add two more dimensions of complexity, namely specific features given by data source and high degree of unstructuredness, frequently without any reference to a golden standard. We will present a case study from the area of diabetology and show how important understanding data context and data source are, how to explain mutual relations among data from multiple sources and results in relation to a subject (data source).
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
JD - Využití počítačů, robotika a její aplikace
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/NV15-25710A" target="_blank" >NV15-25710A: Identifikace individuální dynamiky glykemických exkurzí u pacientů s diabetem pro zlepšení rozhodovacích postupů ovlivňujících dávkování inzulínu</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2016
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
MEDSOFT 2016
ISBN
978-80-906004-8-5
ISSN
1803-8115
e-ISSN
—
Počet stran výsledku
10
Strana od-do
78-87
Název nakladatele
Creative Connections
Místo vydání
Praha
Místo konání akce
Roztoky u Prahy
Datum konání akce
12. 4. 2016
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—