Processing of foundations for securing the technical part of the IS NDA II public contract - deep learning tools

The result's identifiers

Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F24%3A43972692" target="_blank" >RIV/49777513:23520/24:43972692 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—

Alternative languages

Result language
čeština
Original language name
Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Original language description
Tato technická zpráva slouží jako podklad pro přípravu zabezpečení technické části veřejné zakázky IS NDA II – nástroje hlubokého učení. Popisuje metodologie zpracování textu pomocí metod počítačového vidění, tzv. Optical Character Recognition (OCR) a velkých jazykových modelů, tzv. Large Language Models (LLM). V textu je hlavní důraz kladen na popis evaluace výstupů těchto metod, jmenovitě v úlohách přepisu a shrnutí souvislých textů. V první části jsou vysvětleny základní pojmy ze světa digitálního zpracování textu. Na toto téma je navázáno kapitolou popisující evaluační metriky. Dále je shrnuta hardwarová specifikace potřebná na provoz moderních algoritmů zpracování obrazu a textů. V závěru je popsán postup vyhodnocení dodaných řešení.
Czech name
Zpracování podkladů pro zabezpečení technické části veřejné zakázky IS NDA II - nástroje hlubokého učení
Czech description
Tato technická zpráva slouží jako podklad pro přípravu zabezpečení technické části veřejné zakázky IS NDA II – nástroje hlubokého učení. Popisuje metodologie zpracování textu pomocí metod počítačového vidění, tzv. Optical Character Recognition (OCR) a velkých jazykových modelů, tzv. Large Language Models (LLM). V textu je hlavní důraz kladen na popis evaluace výstupů těchto metod, jmenovitě v úlohách přepisu a shrnutí souvislých textů. V první části jsou vysvětleny základní pojmy ze světa digitálního zpracování textu. Na toto téma je navázáno kapitolou popisující evaluační metriky. Dále je shrnuta hardwarová specifikace potřebná na provoz moderních algoritmů zpracování obrazu a textů. V závěru je popsán postup vyhodnocení dodaných řešení.

Classification

Type
V<sub>souhrn</sub> - Summary research report
CEP classification
—
OECD FORD branch
20205 - Automation and control systems

Result continuities

Project
—
Continuities
N - Vyzkumna aktivita podporovana z neverejnych zdroju

Others

Publication year
2024
Confidentiality
C - Předmět řešení projektu podléhá obchodnímu tajemství (§ 504 Občanského zákoníku), ale název projektu, cíle projektu a u ukončeného nebo zastaveného projektu zhodnocení výsledku řešení projektu (údaje P03, P04, P15, P19, P29, PN8) dodané do CEP, jsou upraveny tak, aby byly zveřejnitelné.

Data specific for result type

Number of pages
17
Place of publication
—
Publisher/client name
Národní Archiv
Version
—

Similar results(10)

Textjuicer - Software for Generating Summaries General framework for mining, processing and storing large amounts of electronic texts for language modeling purposes Large Language Models for Summarizing Czech Historical Documents and Beyond

What are you looking for?

Quick search

Smart search

Processing of foundations for securing the technical part of the IS NDA II public contract - deep learning tools

The result's identifiers

Alternative languages

Classification

Result continuities

Others

Data specific for result type

Similar results(10)

What are you looking for?

Quick search

Smart search

Result description

The result's identifiers

The result's identifiers

Alternative languages

Alternative languages

Classification

Classification

Result continuities

Result continuities

Others

Others

Data specific for result type

Data specific for result type

Similar results(10)