Methodology for automated intelligent mining of unstructured data in the environmental domain
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F48026468%3A_____%2F14%3A%230000037" target="_blank" >RIV/48026468:_____/14:#0000037 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Metodika pro automatizované inteligentní vytěžování nestrukturovaných dat v environmentální doméně
Original language description
Metodika stanoví obecně použitelný způsob automatizovaného vytěžování nestrukturovaných dat z dokumentů, které tvoří jeden databázový celek. Modelovým příkladem je dokumentace procesu EIA, která disponuje obrovským množstvím nestrukturovaných dat velkéhovýznamu, která doposud nebyla automaticky vytěžována. Uživateli metodiky je nabídnut postup od analýzy a přípravy cílové dokumentace, přes využití jedinečné kombinace metod zpracování a následného vytěžování dat pomocí přiloženého nástroje až po návrhyfinálního využití vytěžených dat. Metodika popisuje zcela nový postup zpracování dokumentace pomocí metod počítačového zpracování textů v přirozeném jazyce, tzv. metod počítačové lingvistiky a reprezentace výsledků takového zpracování pomocí technologiíLinked Data. Využití technologií Linked Data je ve veřejné správě ČR zcela unikátní, stejně tak jejich aplikace pro reprezentaci dat extrahovaných z textové dokumentace.
Czech name
Metodika pro automatizované inteligentní vytěžování nestrukturovaných dat v environmentální doméně
Czech description
Metodika stanoví obecně použitelný způsob automatizovaného vytěžování nestrukturovaných dat z dokumentů, které tvoří jeden databázový celek. Modelovým příkladem je dokumentace procesu EIA, která disponuje obrovským množstvím nestrukturovaných dat velkéhovýznamu, která doposud nebyla automaticky vytěžována. Uživateli metodiky je nabídnut postup od analýzy a přípravy cílové dokumentace, přes využití jedinečné kombinace metod zpracování a následného vytěžování dat pomocí přiloženého nástroje až po návrhyfinálního využití vytěžených dat. Metodika popisuje zcela nový postup zpracování dokumentace pomocí metod počítačového zpracování textů v přirozeném jazyce, tzv. metod počítačové lingvistiky a reprezentace výsledků takového zpracování pomocí technologiíLinked Data. Využití technologií Linked Data je ve veřejné správě ČR zcela unikátní, stejně tak jejich aplikace pro reprezentaci dat extrahovaných z textové dokumentace.
Classification
Type
N<sub>metC</sub> - Methodology certified by the authorised body
CEP classification
IN - Informatics
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/TA02010182" target="_blank" >TA02010182: Intelligent Library - INTLIB</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2014
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
Metodika pro vytěžování
Regulation ID
88453/ENV/14
Technical parameters
Uzavření smlouvy o poskytnutí licence a uplatnění certifikované metodiky s ČR - Ministerstvem životního prostředí ČR, IČ: 00164801, datum uzavření smlouvy 19. 12. 2014. Kontaktní osoba na straně poskytovatele metodiky: Ing. Tereza Jägerová, Kroftova 1, 150 00 Praha 5, tel. 255 701 302.
Economical parameters
Ekonomické přínosy nejsou v době certifikace jednoznačně vyčíslitelné. Přínosy jsou: - efektivnější zpracování rozsáhlých databází nestrukturovaných dat, - nižší náklady na vytěžení dat v porovnání s ručním vytěžováním, - snížení časové náročnosti resp.potřeby lidských zdrojů na průběžné vytěžování, - následné zpracování dat.
Certification body designation
Česká republika - Ministerstvo životního prostředí ČR
Date of certification
—
Method of use
B - Výsledek je využíván orgány státní nebo veřejné správy