DL4DH – development of tools for effective utilization and mining of data from digital libraries to reinforce digital humanities research
Project goals
Almost every single central or large library stores a big amount of data in a digital form. The data are usually described by the high-quality metadata, which enables to browse these collections, to create various virtual exhibitions etc. They are stored in digital libraries or different repositories, whose design and basic functionalities are primarily intended just for the content viewing. To increase the level of their usability for the special research group of the data scientists is needed to enrich the metadata content and to develop the appropriate interfaces to extract the data to make the heuristic part of the research more effective than today. The aim of the proposed project is to design a set of the new functionalities and independent tools that enables the extensive data mining procedures in digital libraries to cover the digital humanities researchers needs. The second project goal is to use this content in the applied research. The project is connected with the European research infrastructure called DARIAH and with the outputs of the research project INDIHU, focused on the development of tools for digital humanities.
Keywords
digital humanitiestool developmentdata miningdigital librariesdata managementTEI
Public support
Provider
Ministry of Culture
Programme
Programme for the Support of Applied Research and Exp. Development of National and Cultural Identity dor the Years 2016-2022 (in short, "NAKI II")
Call for proposals
SMK02020DG003
Main participants
Knihovna AV ČR, v. v. i.
Contest type
VS - Public tender
Contract ID
002/2020/OVV
Alternative language
Project name in Czech
DL4DH – vývoj nástrojů pro efektivnější využití a vytěžování dat z digitálních knihoven k posílení výzkumu digital humanities
Annotation in Czech
Knihovny disponují obrovským množstvím dat v digitální podobě, které jsou zároveň zpravidla popsány kvalitními metadaty umožňujícími jejich vyhledávání a další využití. Tato data jsou uložena v digitálních knihovnách a repozitářích, jejichž design a funkce jsou určeny především pro prohlížení obsahu. Humanitně zaměření vědečtí pracovníci potřebují data obohacená tak, aby vyhledávání v digitálních zdrojích zefektivnilo možnosti jejich využití a vytvořit odpovídající prostředky pro jejich vytěžení, díky čemuž se usnadní důležitá část badatelské práce. Cílem předkládaného projektu je vývoj nových funkcí a nástrojů, které umožní extenzivní využití a vytěžování dat z digitálních knihoven pro potřeby digitálního humanitního výzkumu, a současně příprava aplikovaných vědeckých výstupů využívající tyto nové možnosti. Projekt volně navazuje na evropskou výzkumnou infrastrukturou DARIAH a s výstupy českého výzkumného projektu INDIHU, zaměřeného na vývoj nástrojů pro digital humanities.
Scientific branches
R&D category
AP - Applied research
OECD FORD - main branch
50804 - Library science
OECD FORD - secondary branch
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - another secondary branch
60500 - Other Humanities and the Arts
AF - Documentation, librarianship, work with information
BC - Theory and management systems
BD - Information theory
IN - Informatics
Completed project evaluation
Provider evaluation
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Project results evaluation
The project aimed to develop new tools for data mining in digital libraries for humanities research. The R DL4DH feeder and R TEI converter enhance research capabilities for digitized materials in digital libraries using the Kramerius system. "The Religionist Map of Literary Meanings: Bible Citations in First Republic Print" demonstrates network analysis of data from digital libraries and provides guidance for DH researchers on utilizing DL4DH tools for their own research. The methodology for preparing data from digital libraries for digital humanities serves as an extended user manual for the developed tools, showcasing potential research applications. All planned outcomes were successfully achieved, fulfilling the project's objectives.
Solution timeline
Realization period - beginning
Mar 1, 2020
Realization period - end
Dec 31, 2022
Project status
U - Finished project
Latest support payment
Feb 1, 2022
Data delivery to CEP
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data delivery code
CEP23-MK0-DG-U
Data delivery date
Jun 6, 2023
Finance
Total approved costs
13,177 thou. CZK
Public financial support
13,177 thou. CZK
Other public sources
0 thou. CZK
Non public and foreign sources
0 thou. CZK
Basic information
Recognised costs
13 177 CZK thou.
Public support
13 177 CZK thou.
100%
Provider
Ministry of Culture
OECD FORD
Library science
Solution period
01. 03. 2020 - 31. 12. 2022