Processing of foundations for securing the technical part of the IS NDA II public contract - deep learning tools
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F24%3A43972692" target="_blank" >RIV/49777513:23520/24:43972692 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Original language description
Tato technická zpráva slouží jako podklad pro přípravu zabezpečení technické části veřejné zakázky IS NDA II – nástroje hlubokého učení. Popisuje metodologie zpracování textu pomocí metod počítačového vidění, tzv. Optical Character Recognition (OCR) a velkých jazykových modelů, tzv. Large Language Models (LLM). V textu je hlavní důraz kladen na popis evaluace výstupů těchto metod, jmenovitě v úlohách přepisu a shrnutí souvislých textů. V první části jsou vysvětleny základní pojmy ze světa digitálního zpracování textu. Na toto téma je navázáno kapitolou popisující evaluační metriky. Dále je shrnuta hardwarová specifikace potřebná na provoz moderních algoritmů zpracování obrazu a textů. V závěru je popsán postup vyhodnocení dodaných řešení.
Czech name
Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Czech description
Tato technická zpráva slouží jako podklad pro přípravu zabezpečení technické části veřejné zakázky IS NDA II – nástroje hlubokého učení. Popisuje metodologie zpracování textu pomocí metod počítačového vidění, tzv. Optical Character Recognition (OCR) a velkých jazykových modelů, tzv. Large Language Models (LLM). V textu je hlavní důraz kladen na popis evaluace výstupů těchto metod, jmenovitě v úlohách přepisu a shrnutí souvislých textů. V první části jsou vysvětleny základní pojmy ze světa digitálního zpracování textu. Na toto téma je navázáno kapitolou popisující evaluační metriky. Dále je shrnuta hardwarová specifikace potřebná na provoz moderních algoritmů zpracování obrazu a textů. V závěru je popsán postup vyhodnocení dodaných řešení.
Classification
Type
V<sub>souhrn</sub> - Summary research report
CEP classification
—
OECD FORD branch
20205 - Automation and control systems
Result continuities
Project
—
Continuities
N - Vyzkumna aktivita podporovana z neverejnych zdroju
Others
Publication year
2024
Confidentiality
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.
Data specific for result type
Number of pages
17
Place of publication
—
Publisher/client name
Národní Archiv
Version
—