DL4DH – development of tools for effective utilization and mining of data from digital libraries to reinforce digital humanities research
Project goals
Almost every single central or large library stores a big amount of data in a digital form. The data are usually described by the high-quality metadata, which enables to browse these collections, to create various virtual exhibitions etc. They are stored in digital libraries or different repositories, whose design and basic functionalities are primarily intended just for the content viewing. To increase the level of their usability for the special research group of the data scientists is needed to enrich the metadata content and to develop the appropriate interfaces to extract the data to make the heuristic part of the research more effective than today. The aim of the proposed project is to design a set of the new functionalities and independent tools that enables the extensive data mining procedures in digital libraries to cover the digital humanities researchers needs. The second project goal is to use this content in the applied research. The project is connected with the European research infrastructure called DARIAH and with the outputs of the research project INDIHU, focused on the development of tools for digital humanities.
DL4DH – vývoj nástrojů pro efektivnější využití a vytěžování dat z digitálních knihoven k posílení výzkumu digital humanities
Knihovny disponují obrovským množstvím dat v digitální podobě, které jsou zároveň zpravidla popsány kvalitními metadaty umožňujícími jejich vyhledávání a další využití. Tato data jsou uložena v digitálních knihovnách a repozitářích, jejichž design a funkce jsou určeny především pro prohlížení obsahu. Humanitně zaměření vědečtí pracovníci potřebují data obohacená tak, aby vyhledávání v digitálních zdrojích zefektivnilo možnosti jejich využití a vytvořit odpovídající prostředky pro jejich vytěžení, díky čemuž se usnadní důležitá část badatelské práce. Cílem předkládaného projektu je vývoj nových funkcí a nástrojů, které umožní extenzivní využití a vytěžování dat z digitálních knihoven pro potřeby digitálního humanitního výzkumu, a současně příprava aplikovaných vědeckých výstupů využívající tyto nové možnosti. Projekt volně navazuje na evropskou výzkumnou infrastrukturou DARIAH a s výstupy českého výzkumného projektu INDIHU, zaměřeného na vývoj nástrojů pro digital humanities.
The project aimed to develop new tools for data mining in digital libraries for humanities research. The R DL4DH feeder and R TEI converter enhance research capabilities for digitized materials in digital libraries using the Kramerius system. "The Religionist Map of Literary Meanings: Bible Citations in First Republic Print" demonstrates network analysis of data from digital libraries and provides guidance for DH researchers on utilizing DL4DH tools for their own research. The methodology for preparing data from digital libraries for digital humanities serves as an extended user manual for the developed tools, showcasing potential research applications. All planned outcomes were successfully achieved, fulfilling the project's objectives.
