All

What are you looking for?

All
Projects
Results
Organizations

Quick search

  • Projects supported by TA ČR
  • Excellent projects
  • Projects with the highest public support
  • Current projects

Smart search

  • That is how I find a specific +word
  • That is how I leave the -word out of the results
  • “That is how I can find the whole phrase”

Text Data Analysis – Entity Extraction

Public support

  • Provider

    Ministry of Interior

  • Programme

  • Call for proposals

  • Main participants

    ACREA CR, spol. s r.o.

  • Contest type

    VZ - Public procurement

  • Contract ID

    MV-177367-8/OBVV-2021

Alternative language

  • Project name in Czech

    Analýza textových dat – extrakce entit

  • Annotation in Czech

    Cílem je vývoj algoritmů, metod a technik, které umožní automatickou extrakci pojmenovaných entit, užívaných při činnosti Policie ČR, a nalezení jejich vzájemných vazeb. Entity jsou definovány v rámci existujícího centrálního datového modelu, jedná se zejména o tyto entity: fyzická osoba, právnická osoba, vozidlo, adresa, bankovní účet, telefonní číslo, droga, chemická látka, zbraň a další. Cílem je vyvinout nástroj ve formě nezávislého SW modulu, který na základě slovníků, pravidel i vhodně zvolených algoritmů, dokáže s definovanou mírou pravděpodobnosti extrahovat uvedené entity včetně jejich vazeb z volných nestrukturovaných textů. Jedná se o lingvistickou doménu policejních textů v českém, anglickém, německém, francouzském, španělském a ruském jazyce.

Scientific branches

  • R&D category

    VV - Exeperimental development

  • OECD FORD - main branch

    10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)

  • OECD FORD - secondary branch

    10103 - Statistics and probability

  • OECD FORD - another secondary branch

  • CEP - equivalent branches <br>(according to the <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">converter</a>)

    AF - Documentation, librarianship, work with information<br>BB - Applied statistics, operational research<br>BC - Theory and management systems<br>BD - Information theory<br>IN - Informatics

Completed project evaluation

  • Provider evaluation

    U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)

  • Project results evaluation

    The objectives set out in the project proposal have been met. The main results of the project have been achieved. All results are directly linked to the objectives of the project and were created during the project solution.

Solution timeline

  • Realization period - beginning

    Jan 1, 2023

  • Realization period - end

    Dec 31, 2023

  • Project status

    U - Finished project

  • Latest support payment

    Feb 28, 2023

Data delivery to CEP

  • Confidentiality

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

  • Data delivery code

    CEP24-MV0-VC-U

  • Data delivery date

    May 14, 2024

Finance

  • Total approved costs

    4,939 thou. CZK

  • Public financial support

    4,939 thou. CZK

  • Other public sources

    0 thou. CZK

  • Non public and foreign sources

    0 thou. CZK