Efficient Exploration of Linked Data Cloud
Project goals
As the size of semantic data available as Linked Open Data (LOD) increases, the demand for methods for automated exploration of data sets grows as well. A data consumer needs to search for data sets meeting his interest and look into them using suitable visualization techniques to check whether the data sets are useful or not. In the recent years, particular advances have been made in the field, e.g., automated ontology matching techniques or LOD visualization platforms. However, an integrated approach to LOD exploration is still missing. On the scale of the whole web, the current approaches allow a user to discover data sets using keywords or manually through large data catalogs. Existing visualization techniques presume that a data set is of an expected type and structure. The aim of this project is to develop time and space efficient techniques for discovery of previously unknown LOD data sets on the base of a consumer’s interest and their automated visualization. A formal model and algorithms will be developed and experimentally evaluated.
Keywords
Linked DataRDFSPARQLSemantic Webontologiesdata set explorationdata set visualization
Public support
Provider
Czech Science Foundation
Programme
Standard projects
Call for proposals
Standardní projekty 20 (SGA0201600001)
Main participants
České vysoké učení technické v Praze / Fakulta elektrotechnická
Univerzita Karlova / Matematicko-fyzikální fakultaContest type
VS - Public tender
Contract ID
16-09713S
Alternative language
Project name in Czech
Efektivní explorace prostoru propojených dat
Annotation in Czech
S tím jak roste množství dat dostupných v podobě otevřených propojených dat (angl.. Linked Open Data, LOD), roste i poptávka po metodách automatizované explorace datových sad. Typický konzument dat potřebuje vyhledat datové sady, které odpovídají jeho zájmu, a nahlížet do nich, aby zkontroloval, zda mu nalezená datová sada vyhovuje či nikoliv. V nedávné době bylo dosaženo několika pokroků v oblasti, např. metody automatického mapování ontologií nebo různé platformy pro vizualizaci LOD. Integrovaný přístup k exploraci datových sad však dosud chybí. Na úrovni celého webu umožňují současné přístupy pouze vyhledávání pomocí klíčových slov nebo ručně prostřednictvím velkých datových katalogů. Existující vizualizační techniky očekávají datové sady konkrétních typů a s konkrétní strukturou. Cílem tohoto projektu je vyvinout časově a prostorově efektivní techniky pro objevování předem neznámých datových sad na základě potřeb konzumenta a jejich automatizovanou vizualizaci. Bude vyvinut formální model a algoritmy a ty budou experimentálně ověřeny.
Scientific branches
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project has delivered new results in Linked Open Data exploration, data discovery, and visualization in particular. The results have been published at international conferences and high ranked journals. Scientific impact seems to be less important, however, a direct practical application of the results is clear.
Solution timeline
Realization period - beginning
Jan 1, 2016
Realization period - end
Dec 31, 2018
Project status
U - Finished project
Latest support payment
May 25, 2018
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP19-GA0-GA-U/01:1
Data delivery date
Jun 12, 2019
Finance
Total approved costs
6,666 thou. CZK
Public financial support
5,583 thou. CZK
Other public sources
1,083 thou. CZK
Non public and foreign sources
0 thou. CZK
Recognised costs
6 666 CZK thou.
Public support
5 583 CZK thou.
0%
Provider
Czech Science Foundation
CEP
IN - Informatics
Solution period
01. 01. 2016 - 31. 12. 2018