Metodika pro automatizované inteligentní vytěžování nestrukturovaných dat v environmentální doméně
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F48026468%3A_____%2F14%3A%230000037" target="_blank" >RIV/48026468:_____/14:#0000037 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Metodika pro automatizované inteligentní vytěžování nestrukturovaných dat v environmentální doméně
Popis výsledku v původním jazyce
Metodika stanoví obecně použitelný způsob automatizovaného vytěžování nestrukturovaných dat z dokumentů, které tvoří jeden databázový celek. Modelovým příkladem je dokumentace procesu EIA, která disponuje obrovským množstvím nestrukturovaných dat velkéhovýznamu, která doposud nebyla automaticky vytěžována. Uživateli metodiky je nabídnut postup od analýzy a přípravy cílové dokumentace, přes využití jedinečné kombinace metod zpracování a následného vytěžování dat pomocí přiloženého nástroje až po návrhyfinálního využití vytěžených dat. Metodika popisuje zcela nový postup zpracování dokumentace pomocí metod počítačového zpracování textů v přirozeném jazyce, tzv. metod počítačové lingvistiky a reprezentace výsledků takového zpracování pomocí technologiíLinked Data. Využití technologií Linked Data je ve veřejné správě ČR zcela unikátní, stejně tak jejich aplikace pro reprezentaci dat extrahovaných z textové dokumentace.
Název v anglickém jazyce
Methodology for automated intelligent mining of unstructured data in the environmental domain
Popis výsledku anglicky
The methodology determines generally applicable method of extracting unstructured data from documents forming one database unit. A sample might be a documentation of EIA process which commands a vast amount of unstructured data of huge significance whichhas not been yet extracted automatically. The methodology offers a whole process of analyzing and preparing the target documentation, use of unique methods of processing and extracting data with a help of appended tool, and suggestions of final use of extracted data. The methodology describes a brand new procedure of processing documentation with methods of computerized texts in a natural language, as it is called methods of computer linguistics, and representation of results of such processing via Linked Data technology. In Czech public administration, the use of Linked Data technology is entirely unique as well as its application for representation of data extracted from text documentation.
Klasifikace
Druh
N<sub>metC</sub> - Metodiky certifikované oprávněným orgánem
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/TA02010182" target="_blank" >TA02010182: Inteligentní knihovna - INTLIB</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Metodika pro vytěžování
Číslo předpisu
88453/ENV/14
Technické parametry
Uzavření smlouvy o poskytnutí licence a uplatnění certifikované metodiky s ČR - Ministerstvem životního prostředí ČR, IČ: 00164801, datum uzavření smlouvy 19. 12. 2014. Kontaktní osoba na straně poskytovatele metodiky: Ing. Tereza Jägerová, Kroftova 1, 150 00 Praha 5, tel. 255 701 302.
Ekonomické parametry
Ekonomické přínosy nejsou v době certifikace jednoznačně vyčíslitelné. Přínosy jsou: - efektivnější zpracování rozsáhlých databází nestrukturovaných dat, - nižší náklady na vytěžení dat v porovnání s ručním vytěžováním, - snížení časové náročnosti resp.potřeby lidských zdrojů na průběžné vytěžování, - následné zpracování dat.
Označení certifikačního orgánu
Česká republika - Ministerstvo životního prostředí ČR
Datum certifikace
—
Způsoby využití výsledku
B - Výsledek je využíván orgány státní nebo veřejné správy