Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F24%3A43972692" target="_blank" >RIV/49777513:23520/24:43972692 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Popis výsledku v původním jazyce
Tato technická zpráva slouží jako podklad pro přípravu zabezpečení technické části veřejné zakázky IS NDA II – nástroje hlubokého učení. Popisuje metodologie zpracování textu pomocí metod počítačového vidění, tzv. Optical Character Recognition (OCR) a velkých jazykových modelů, tzv. Large Language Models (LLM). V textu je hlavní důraz kladen na popis evaluace výstupů těchto metod, jmenovitě v úlohách přepisu a shrnutí souvislých textů. V první části jsou vysvětleny základní pojmy ze světa digitálního zpracování textu. Na toto téma je navázáno kapitolou popisující evaluační metriky. Dále je shrnuta hardwarová specifikace potřebná na provoz moderních algoritmů zpracování obrazu a textů. V závěru je popsán postup vyhodnocení dodaných řešení.
Název v anglickém jazyce
Processing of foundations for securing the technical part of the IS NDA II public contract - deep learning tools
Popis výsledku anglicky
This technical report serves as a basis for preparation of the technical part of the public contract IS NDA II – deep learning tools. It describes methodologies for text processing using computer vision methods, specifically Optical Character Recognition (OCR), and large language models, known as Large Language Models (LLM). The main emphasis in the text is on the description of the evaluation of the outputs of these methods, namely in the tasks of transcription and summarization of continuous texts. The first part explains basic concepts from the world of digital text processing. This topic is followed by a chapter describing evaluation metrics. Furthermore, the hardware specifications necessary for running modern image and text processing algorithms are summarized. Finally, the procedure for evaluating the delivered solutions is described.
Klasifikace
Druh
V<sub>souhrn</sub> - Souhrnná výzkumná zpráva
CEP obor
—
OECD FORD obor
20205 - Automation and control systems
Návaznosti výsledku
Projekt
—
Návaznosti
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Údaje specifické pro druh výsledku
Počet stran výsledku
17
Místo vydání
—
Název nakladatele resp. objednatele
Národní Archiv
Verze
—