semANT – Sémantický průzkumník textového kulturního dědictví
Veřejná podpora
Poskytovatel
Ministerstvo kultury
Program
Program NAKI III - program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030
Veřejná soutěž
SMK02023DH001
Hlavní účastníci
Vysoké učení technické v Brně / Fakulta informačních technologií
Druh soutěže
VS - Veřejná soutěž
Číslo smlouvy
060/2023/OVV
Alternativní jazyk
Název projektu anglicky
semANT - Semantic Document Exploration
Anotace anglicky
Czech libraries and archives contain a huge number of digitized documents. The possibilities of their online presentation and search have been improving significantly in recent years. A large part of modern printed documents is already processed by OCR and therefore fully searchable. Also, there are tools for automatic transcription of old prints and handwritten documents. Their complete transcription is now only a matter of time. However, the full-text search used in library systems is the simplest possible. It can work with different forms of a word, but not with the meaning. Thus, finding documents on a particular topic is very laborious. In contrast, current web search engines work with the words' meanings, making it possible to find texts that are relevant to the topic searched, though not containing the exact search term. The main goal of this project is therefore to improve the searchability of the full-text representation of digitized documents at the level of text meaning and to improve the possibilities of natural navigation between related documents. We will provide users with a semantically enhanced full-text search, the possibility to search by text segments (e.g., paragraphs) and to specify the topic of interest at the same time. The system will work with automatically identified topics but will allow users to define their own topics based on examples. The identification of topics will also be used to visualize the frequency of their occurrences and mutual interactions. Thus, it will be possible to track the evolution of topics over time, their continuity and transformation, or their connection to known named entities such as places and persons. The results of the project will be used both by the general public for routine work with library systems and by the scientific community for enhanced text analysis. Also, we hope that parts of the project will find application in software for contemporary media and social networks analysis.
Vědní obory
Kategorie VaV
VV - Experimentální vývoj
OECD FORD - hlavní obor
60500 - Other Humanities and the Arts
OECD FORD - vedlejší obor
20202 - Communication engineering and systems
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
JW - Navigace, spojení, detekce a protiopatření
Termíny řešení
Zahájení řešení
1. 3. 2023
Ukončení řešení
31. 12. 2027
Poslední stav řešení
B - Běžící víceletý projekt
Poslední uvolnění podpory
16. 3. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-MK0-DH-R
Datum dodání záznamu
19. 2. 2024
Finance
Celkové uznané náklady
27 462 tis. Kč
Výše podpory ze státního rozpočtu
27 462 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč