The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F26376326%3A_____%2F23%3AN0000001" target="_blank" >RIV/26376326:_____/23:N0000001 - isvavai.cz</a>
Alternative codes found
RIV/49777513:23520/23:43968923
Result on the web
<a href="http://www.kaitos.eu" target="_blank" >http://www.kaitos.eu</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
KAITOS
Original language description
KAITOS je inovativní řešení pro digitalizaci kulturního dědictví, které pokrývá všechny základní kroky digitalizačního procesu. Klíčovým rysem software je využití neuronových sítí pro vytěžení informací z dokumentů. Umělá inteligence a strojové učení se využívá v oblasti předzpracování skenů dokumentů, detekce stran ve skenu, jejich rotace a ořezu, klasifikace typů dokumentů, analýz rozložení obsahu dokumentu, vytěžení textového obsahu dokumentu, indexace obsahu a zpracování jazyka pro efektivnější vyhledávání. SW KAITOS je možné použít při rutinním zpracování projektů digitalizace kulturního dědictví a tvorby digitalizačních balíčků dle aktuálních knihovních standardů. Součástí řešení jsou tyto moduly: • modul pro preprocessing – předzpracování skenu dokumentu (rozdělení na strany, rotace, ořez), • modul pro klasifikaci – klasifikace typu strany na základě jejího obsahu a kontextové informace, • modul OLR – klasifikace rozložení a typu jednotlivých částí obsahu stránek, • modul OCR – klasifikace a vytěžení textu, • modul pro indexaci – detekce a rozpoznání logických entit v dokumentu na základě porozumění obsahu (například vydání, kapitola, článek), • modul pro kontrolu a editaci vytěžených dat, • modul pro generování výstupního digitalizačního balíčku dle standardů Národní knihovny ČR.
Czech name
KAITOS
Czech description
—
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20206 - Computer hardware and architecture
Result continuities
Project
<a href="/en/project/EG19_262%2F0019716" target="_blank" >EG19_262/0019716: Research of neural networks and application of its results for software development solutions for digitization of cultural heritage</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2023
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
13
Technical parameters
Klientská část KAITOS představuje vzorové řešení uživatelského rozhraní pro práci se systémem KAITOS. Umožňuje uživatelskou práci se všemi daty, která je systém KAITOS schopný poskytnout a obsahuje všechny funkce pro kompletní a úplnou digitalizaci kulturního dědictví dle aktuálních standardů. Jedná se o desktopovou aplikaci pro MS Windows, která ke svému provozu potřebuje pouze běžné PC a lokálně nebo centrálně instalovanou databázi. Klíčovou funkcí aplikace je vizualizace dat, která serverová část řešení vytěžuje z vložených skenů a umožnění jejich rychlé kontroly, případně opravy. Aplikace v rámci zefektivnění kontroly indikuje pro většinu ze získávaných dat míru jejich spolehlivosti, kterou vede uživatele k tomu, aby kontroloval primárně nejistá data a neztrácel čas kontrolou dat, která jsou detekována s vysokou mírou přesnosti a spolehlivosti. Podstatnou funkcí klientské aplikace je generování výstupního digitalizačního balíčku, který následně slouží pro publikaci digitalizovaných dat veřejnosti. Obsah a struktura tohoto balíčku se řídí metodikami a standardy Národní knihovny ČR. Použité technologie: • uživatelské prostředí klientské aplikace - .NET C#, WPF framework, Entity framework • databáze pro lokální ukládání dat – MySQL • komunikační protokol se serverovou částí - gRPC Webová služba KAITOS (KWS) poskytuje API Gateway pro klientskou aplikaci. Systém KWS je založen na architektuře microservices, tj. je modularizovaný, kdy každý modul je tvořen Docker imagem a v rámci celého systému je tak provozován jako samostatný kontejner. Většina kontejnerů je implementována v programovacím jazyce Python, využívá jeho nástroje a knihovny pro AI/ML, a dále se využívají následující technologie: • Rabbit Message Queue pro komunikaci mezi kontejnery, • MongoDB pro ukládání datových struktur, • cloudové úložiště pro ukládání objemných binárních dat, • Kubernetes pro orchestraci kontejnerů. Řešení je k dispozici jako komerční SW poskytovaný buď ve formě služby provozované v cloudu nebo jako SW instalovaný v infrastruktuře uživatele. Podmínky užívání jsou definovány individuálně na základě požadavků a specifik konkrétního zákazníka.
Economical parameters
Ekonomické přínosy projektu se v souladu s projektovým záměrem projeví ve více oblastech. V první řadě pro poskytovatele služeb digitalizace, kteří s využitím SW KAITOS budou schopni zpracovat ve stejném čase větší objem digitalizačních projektů. V druhé řadě pro uživatele SW z řad paměťových institucí, zejména knihoven, které díky automatizaci některých kroků digitalizace zvýší produktivitu vlastních digitalizačních linek při zachování stejného počtu zaměstnanců, ale také zajistí stabilní kvalitu metadatového popisu digitalizovaných dokumentů. V neposlední řadě užití SW KAITOS umožní všem uživatelům popisovat v digitalizovaných dokumentech entity, které by ručním zpracováním nebylo reálné získat z důvodu neúměrně vysokých nákladů. Konkrétní finanční přínosy není možné vyhodnotit mimo jiné proto, že velká část přínosů je v oblasti kvalitativního zlepšení výstupů digitalizace.
Owner IČO
26376326
Owner name
EXON s.r.o.