Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

semANT – Sémantický průzkumník textového kulturního dědictví

Veřejná podpora

  • Poskytovatel

    Ministerstvo kultury

  • Program

    Program NAKI III - program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030

  • Veřejná soutěž

    SMK02023DH001

  • Hlavní účastníci

    Vysoké učení technické v Brně / Fakulta informačních technologií

  • Druh soutěže

    VS - Veřejná soutěž

  • Číslo smlouvy

    060/2023/OVV

Alternativní jazyk

  • Název projektu anglicky

    semANT - Semantic Document Exploration

  • Anotace anglicky

    Czech libraries and archives contain a huge number of digitized documents. The possibilities of their online presentation and search have been improving significantly in recent years. A large part of modern printed documents is already processed by OCR and therefore fully searchable. Also, there are tools for automatic transcription of old prints and handwritten documents. Their complete transcription is now only a matter of time. However, the full-text search used in library systems is the simplest possible. It can work with different forms of a word, but not with the meaning. Thus, finding documents on a particular topic is very laborious. In contrast, current web search engines work with the words' meanings, making it possible to find texts that are relevant to the topic searched, though not containing the exact search term. The main goal of this project is therefore to improve the searchability of the full-text representation of digitized documents at the level of text meaning and to improve the possibilities of natural navigation between related documents. We will provide users with a semantically enhanced full-text search, the possibility to search by text segments (e.g., paragraphs) and to specify the topic of interest at the same time. The system will work with automatically identified topics but will allow users to define their own topics based on examples. The identification of topics will also be used to visualize the frequency of their occurrences and mutual interactions. Thus, it will be possible to track the evolution of topics over time, their continuity and transformation, or their connection to known named entities such as places and persons. The results of the project will be used both by the general public for routine work with library systems and by the scientific community for enhanced text analysis. Also, we hope that parts of the project will find application in software for contemporary media and social networks analysis.

Vědní obory

  • Kategorie VaV

    VV - Experimentální vývoj

  • OECD FORD - hlavní obor

    60500 - Other Humanities and the Arts

  • OECD FORD - vedlejší obor

    20202 - Communication engineering and systems

  • OECD FORD - další vedlejší obor

  • CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)

    JW - Navigace, spojení, detekce a protiopatření

Termíny řešení

  • Zahájení řešení

    1. 3. 2023

  • Ukončení řešení

    31. 12. 2027

  • Poslední stav řešení

    B - Běžící víceletý projekt

  • Poslední uvolnění podpory

    16. 3. 2023

Dodání dat do CEP

  • Důvěrnost údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Systémové označení dodávky dat

    CEP24-MK0-DH-R

  • Datum dodání záznamu

    19. 2. 2024

Finance

  • Celkové uznané náklady

    27 462 tis. Kč

  • Výše podpory ze státního rozpočtu

    27 462 tis. Kč

  • Ostatní veřejné zdroje financování

    0 tis. Kč

  • Neveřejné tuz. a zahr. zdroje finan.

    0 tis. Kč