Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F26376326%3A_____%2F23%3AN0000001" target="_blank" >RIV/26376326:_____/23:N0000001 - isvavai.cz</a>

  • Nalezeny alternativní kódy

    RIV/49777513:23520/23:43968923

  • Výsledek na webu

    <a href="http://www.kaitos.eu" target="_blank" >http://www.kaitos.eu</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    KAITOS

  • Popis výsledku v původním jazyce

    KAITOS je inovativní řešení pro digitalizaci kulturního dědictví, které pokrývá všechny základní kroky digitalizačního procesu. Klíčovým rysem software je využití neuronových sítí pro vytěžení informací z dokumentů. Umělá inteligence a strojové učení se využívá v oblasti předzpracování skenů dokumentů, detekce stran ve skenu, jejich rotace a ořezu, klasifikace typů dokumentů, analýz rozložení obsahu dokumentu, vytěžení textového obsahu dokumentu, indexace obsahu a zpracování jazyka pro efektivnější vyhledávání. SW KAITOS je možné použít při rutinním zpracování projektů digitalizace kulturního dědictví a tvorby digitalizačních balíčků dle aktuálních knihovních standardů. Součástí řešení jsou tyto moduly: • modul pro preprocessing – předzpracování skenu dokumentu (rozdělení na strany, rotace, ořez), • modul pro klasifikaci – klasifikace typu strany na základě jejího obsahu a kontextové informace, • modul OLR – klasifikace rozložení a typu jednotlivých částí obsahu stránek, • modul OCR – klasifikace a vytěžení textu, • modul pro indexaci – detekce a rozpoznání logických entit v dokumentu na základě porozumění obsahu (například vydání, kapitola, článek), • modul pro kontrolu a editaci vytěžených dat, • modul pro generování výstupního digitalizačního balíčku dle standardů Národní knihovny ČR.

  • Název v anglickém jazyce

    KAITOS

  • Popis výsledku anglicky

    KAITOS is an innovative solution for the digitization of cultural heritage that covers all the basic steps of the digitization process. A key feature of the software is the use of neural networks to extract information from documents. Artificial intelligence and machine learning are used in the area of ​​preprocessing of document scans, detection of pages in the scan, their rotation and cropping, classification of document types, analysis of document content distribution, extraction of textual content of the document, content indexing and language processing for more efficient searching. SW KAITOS can be used for routine processing of cultural heritage digitization projects and the creation of digitization packages according to current library standards. The solution includes the following modules: • module for preprocessing – preprocessing of a document scan (partitioning into pages, rotation, cropping), • module for classification – classification of the page type based on its content and contextual information, • OLR module – classification of layout and type of individual parts of page content, • OCR module – text classification and extraction, • module for indexing – detection and recognition of logical entities in the document based on understanding the content (for example, issue, chapter, article), • module for checking and editing extracted data, • module for generating the output digitization package according to the standards of the National Library of the Czech Republic.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    20206 - Computer hardware and architecture

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/EG19_262%2F0019716" target="_blank" >EG19_262/0019716: Výzkum neuronových sítí a aplikace jeho výsledků pro vývoj software řešení k digitalizaci kulturního dědictví</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2023

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    13

  • Technické parametry

    Klientská část KAITOS představuje vzorové řešení uživatelského rozhraní pro práci se systémem KAITOS. Umožňuje uživatelskou práci se všemi daty, která je systém KAITOS schopný poskytnout a obsahuje všechny funkce pro kompletní a úplnou digitalizaci kulturního dědictví dle aktuálních standardů. Jedná se o desktopovou aplikaci pro MS Windows, která ke svému provozu potřebuje pouze běžné PC a lokálně nebo centrálně instalovanou databázi. Klíčovou funkcí aplikace je vizualizace dat, která serverová část řešení vytěžuje z vložených skenů a umožnění jejich rychlé kontroly, případně opravy. Aplikace v rámci zefektivnění kontroly indikuje pro většinu ze získávaných dat míru jejich spolehlivosti, kterou vede uživatele k tomu, aby kontroloval primárně nejistá data a neztrácel čas kontrolou dat, která jsou detekována s vysokou mírou přesnosti a spolehlivosti. Podstatnou funkcí klientské aplikace je generování výstupního digitalizačního balíčku, který následně slouží pro publikaci digitalizovaných dat veřejnosti. Obsah a struktura tohoto balíčku se řídí metodikami a standardy Národní knihovny ČR. Použité technologie: • uživatelské prostředí klientské aplikace - .NET C#, WPF framework, Entity framework • databáze pro lokální ukládání dat – MySQL • komunikační protokol se serverovou částí - gRPC Webová služba KAITOS (KWS) poskytuje API Gateway pro klientskou aplikaci. Systém KWS je založen na architektuře microservices, tj. je modularizovaný, kdy každý modul je tvořen Docker imagem a v rámci celého systému je tak provozován jako samostatný kontejner. Většina kontejnerů je implementována v programovacím jazyce Python, využívá jeho nástroje a knihovny pro AI/ML, a dále se využívají následující technologie: • Rabbit Message Queue pro komunikaci mezi kontejnery, • MongoDB pro ukládání datových struktur, • cloudové úložiště pro ukládání objemných binárních dat, • Kubernetes pro orchestraci kontejnerů. Řešení je k dispozici jako komerční SW poskytovaný buď ve formě služby provozované v cloudu nebo jako SW instalovaný v infrastruktuře uživatele. Podmínky užívání jsou definovány individuálně na základě požadavků a specifik konkrétního zákazníka.

  • Ekonomické parametry

    Ekonomické přínosy projektu se v souladu s projektovým záměrem projeví ve více oblastech. V první řadě pro poskytovatele služeb digitalizace, kteří s využitím SW KAITOS budou schopni zpracovat ve stejném čase větší objem digitalizačních projektů. V druhé řadě pro uživatele SW z řad paměťových institucí, zejména knihoven, které díky automatizaci některých kroků digitalizace zvýší produktivitu vlastních digitalizačních linek při zachování stejného počtu zaměstnanců, ale také zajistí stabilní kvalitu metadatového popisu digitalizovaných dokumentů. V neposlední řadě užití SW KAITOS umožní všem uživatelům popisovat v digitalizovaných dokumentech entity, které by ručním zpracováním nebylo reálné získat z důvodu neúměrně vysokých nákladů. Konkrétní finanční přínosy není možné vyhodnotit mimo jiné proto, že velká část přínosů je v oblasti kvalitativního zlepšení výstupů digitalizace.

  • IČO vlastníka výsledku

    26376326

  • Název vlastníka

    EXON s.r.o.