SW for consolidation and data mining from project and production documentation
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21220%2F24%3A00382848" target="_blank" >RIV/68407700:21220/24:00382848 - isvavai.cz</a>
Result on the web
<a href="http://mech.fs.cvut.cz/" target="_blank" >http://mech.fs.cvut.cz/</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
SW pro konsolidaci a dolování dat z projektové a výrobní dokumentace
Original language description
Vyvinutý software slouží k automatizovanému zpracování technické dokumentace ve formátu PDF a dat z interního systému SAP. Cílem je konsolidace a dolování informací o produktech a jejich vlastnostech, a to prostřednictvím extrakce, překladu, vektorizace a ontologického modelování dat. Výsledkem je framework umožňující vytváření embeddingů produktů, jejich vizualizaci a analýzu. Součástí řešení je webová aplikace pro interaktivní práci s daty. Software je modulární, škálovatelný a určený pro lokální nasazení s důrazem na anonymizaci dokumentů a snadnou integraci nových datových zdrojů.
Czech name
SW pro konsolidaci a dolování dat z projektové a výrobní dokumentace
Czech description
Vyvinutý software slouží k automatizovanému zpracování technické dokumentace ve formátu PDF a dat z interního systému SAP. Cílem je konsolidace a dolování informací o produktech a jejich vlastnostech, a to prostřednictvím extrakce, překladu, vektorizace a ontologického modelování dat. Výsledkem je framework umožňující vytváření embeddingů produktů, jejich vizualizaci a analýzu. Součástí řešení je webová aplikace pro interaktivní práci s daty. Software je modulární, škálovatelný a určený pro lokální nasazení s důrazem na anonymizaci dokumentů a snadnou integraci nových datových zdrojů.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
20301 - Mechanical engineering
Result continuities
Project
<a href="/en/project/TN02000010" target="_blank" >TN02000010: National Competence Centre of Mechatronics and Smart Technologies for Mechanical Engineering</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2024
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
NCC MESTEC II -12-V1
Technical parameters
OS: Windows, Linux, macOS Min. požadavky na HW: 8 GB RAM, dual-core CPU Celková velikost instalace včetně souvisejících SW: 3,5 GB Související instalace a kompilace: Python 3.12.0 (doporučeno použít distribuci Anaconda), knihovny uvedené v technické dokumentaci Vyvinuté moduly: data_extractor.py, data_vectorizer.py, ontology_vectorizer.py, data_blender.py, app_NCKII.py Celková velikost zdrojového kódu: 1 785 KB Množství zpracovávaných dat pro minimální HW konfiguraci: 1,5 GB Podmínky využití výsledku: definovány ve Smlouvě o využití výsledků projektu NCK (Robert Bosch, ČVUT)
Economical parameters
Celková cena řešení: 10 430 000.- Kč bez DPH
Owner IČO
68407700
Owner name
České vysoké učení technické v Praze FS, Ústav mechaniky