Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F24%3A43972692" target="_blank" >RIV/49777513:23520/24:43972692 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
čeština
Název v původním jazyce
Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Popis výsledku v původním jazyce
Tato technická zpráva slouží jako podklad pro přípravu zabezpečení technické části veřejné zakázky IS NDA II – nástroje hlubokého učení. Popisuje metodologie zpracování textu pomocí metod počítačového vidění, tzv. Optical Character Recognition (OCR) a velkých jazykových modelů, tzv. Large Language Models (LLM). V textu je hlavní důraz kladen na popis evaluace výstupů těchto metod, jmenovitě v úlohách přepisu a shrnutí souvislých textů. V první části jsou vysvětleny základní pojmy ze světa digitálního zpracování textu. Na toto téma je navázáno kapitolou popisující evaluační metriky. Dále je shrnuta hardwarová specifikace potřebná na provoz moderních algoritmů zpracování obrazu a textů. V závěru je popsán postup vyhodnocení dodaných řešení.
Název v anglickém jazyce
Processing of foundations for securing the technical part of the IS NDA II public contract - deep learning tools
Popis výsledku anglicky
This technical report serves as a basis for preparation of the technical part of the public contract IS NDA II – deep learning tools. It describes methodologies for text processing using computer vision methods, specifically Optical Character Recognition (OCR), and large language models, known as Large Language Models (LLM). The main emphasis in the text is on the description of the evaluation of the outputs of these methods, namely in the tasks of transcription and summarization of continuous texts. The first part explains basic concepts from the world of digital text processing. This topic is followed by a chapter describing evaluation metrics. Furthermore, the hardware specifications necessary for running modern image and text processing algorithms are summarized. Finally, the procedure for evaluating the delivered solutions is described.

Klasifikace

Druh
V<sub>souhrn</sub> - Souhrnná výzkumná zpráva
CEP obor
—
OECD FORD obor
20205 - Automation and control systems

Návaznosti výsledku

Projekt
—
Návaznosti
N - Vyzkumna aktivita podporovana z neverejnych zdroju

Ostatní

Rok uplatnění
2024
Kód důvěrnosti údajů
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.

Údaje specifické pro druh výsledku

Počet stran výsledku
17
Místo vydání
—
Název nakladatele resp. objednatele
Národní Archiv
Verze
—

Podobné výsledky(10)

Textjuicer - Software for Generating Summaries General framework for mining, processing and storing large amounts of electronic texts for language modeling purposes Jazykové zdroje pro inteligentní zpracování dialogů o elektrických sítích

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)