Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

Metodika pro automatizované inteligentní vytěžování nestrukturovaných dat v environmentální doméně

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F48026468%3A_____%2F14%3A%230000037" target="_blank" >RIV/48026468:_____/14:#0000037 - isvavai.cz</a>

  • Výsledek na webu

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    Metodika pro automatizované inteligentní vytěžování nestrukturovaných dat v environmentální doméně

  • Popis výsledku v původním jazyce

    Metodika stanoví obecně použitelný způsob automatizovaného vytěžování nestrukturovaných dat z dokumentů, které tvoří jeden databázový celek. Modelovým příkladem je dokumentace procesu EIA, která disponuje obrovským množstvím nestrukturovaných dat velkéhovýznamu, která doposud nebyla automaticky vytěžována. Uživateli metodiky je nabídnut postup od analýzy a přípravy cílové dokumentace, přes využití jedinečné kombinace metod zpracování a následného vytěžování dat pomocí přiloženého nástroje až po návrhyfinálního využití vytěžených dat. Metodika popisuje zcela nový postup zpracování dokumentace pomocí metod počítačového zpracování textů v přirozeném jazyce, tzv. metod počítačové lingvistiky a reprezentace výsledků takového zpracování pomocí technologiíLinked Data. Využití technologií Linked Data je ve veřejné správě ČR zcela unikátní, stejně tak jejich aplikace pro reprezentaci dat extrahovaných z textové dokumentace.

  • Název v anglickém jazyce

    Methodology for automated intelligent mining of unstructured data in the environmental domain

  • Popis výsledku anglicky

    The methodology determines generally applicable method of extracting unstructured data from documents forming one database unit. A sample might be a documentation of EIA process which commands a vast amount of unstructured data of huge significance whichhas not been yet extracted automatically. The methodology offers a whole process of analyzing and preparing the target documentation, use of unique methods of processing and extracting data with a help of appended tool, and suggestions of final use of extracted data. The methodology describes a brand new procedure of processing documentation with methods of computerized texts in a natural language, as it is called methods of computer linguistics, and representation of results of such processing via Linked Data technology. In Czech public administration, the use of Linked Data technology is entirely unique as well as its application for representation of data extracted from text documentation.

Klasifikace

  • Druh

    N<sub>metC</sub> - Metodiky certifikované oprávněným orgánem

  • CEP obor

    IN - Informatika

  • OECD FORD obor

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/TA02010182" target="_blank" >TA02010182: Inteligentní knihovna - INTLIB</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2014

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    Metodika pro vytěžování

  • Číslo předpisu

    88453/ENV/14

  • Technické parametry

    Uzavření smlouvy o poskytnutí licence a uplatnění certifikované metodiky s ČR - Ministerstvem životního prostředí ČR, IČ: 00164801, datum uzavření smlouvy 19. 12. 2014. Kontaktní osoba na straně poskytovatele metodiky: Ing. Tereza Jägerová, Kroftova 1, 150 00 Praha 5, tel. 255 701 302.

  • Ekonomické parametry

    Ekonomické přínosy nejsou v době certifikace jednoznačně vyčíslitelné. Přínosy jsou: - efektivnější zpracování rozsáhlých databází nestrukturovaných dat, - nižší náklady na vytěžení dat v porovnání s ručním vytěžováním, - snížení časové náročnosti resp.potřeby lidských zdrojů na průběžné vytěžování, - následné zpracování dat.

  • Označení certifikačního orgánu

    Česká republika - Ministerstvo životního prostředí ČR

  • Datum certifikace

  • Způsoby využití výsledku

    B - Výsledek je využíván orgány státní nebo veřejné správy