Analýza textových dat – extrakce entit
Veřejná podpora
Poskytovatel
Ministerstvo vnitra
Program
Program bezpečnostního výzkumu pro potřeby státu 2022-2027 (SecPro)
Veřejná soutěž
—
Hlavní účastníci
ACREA CR, spol. s r.o.
Druh soutěže
VZ - Veřejná zakázka
Číslo smlouvy
MV-177367-8/OBVV-2021
Alternativní jazyk
Název projektu anglicky
Text Data Analysis – Entity Extraction
Anotace anglicky
The aim is to develop algorithms, methods and techniques that will allow automatic extraction of named entities used in the activities of the Police of the Czech Republic and finding their mutual links. Entities are defined within an existing central data model, these are mainly the following entities: natural person, legal entity, vehicle, address, bank account, telephone number, drug, chemical, weapon and others. The aim is to develop a tool in the form of an independent SW module that, based on dictionaries, rules and appropriately selected algorithms, can extract these entities including their links from free unstructured texts with a defined degree of probability. It is the linguistic domain of police texts in Czech, English, German, French, Spanish and Russian.
Vědní obory
Kategorie VaV
VV - Experimentální vývoj
OECD FORD - hlavní obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
OECD FORD - vedlejší obor
10103 - Statistics and probability
OECD FORD - další vedlejší obor
—
CEP - odpovídající obory <br>(dle <a href="http://www.vyzkum.cz/storage/att/E6EF7938F0E854BAE520AC119FB22E8D/Prevodnik_oboru_Frascati.pdf">převodníku</a>)
AF - Dokumentace, knihovnictví, práce s informacemi<br>BB - Aplikovaná statistika, operační výzkum<br>BC - Teorie a systémy řízení<br>BD - Teorie informace<br>IN - Informatika
Hodnocení dokončeného projektu
Hodnocení poskytovatelem
U - Uspěl podle zadání (s publikovanými či patentovanými výsledky atd.)
Zhodnocení výsledků projektu
Cíle, stanovené v návrhu projektu, byly splněny. Hlavní výsledky projektu byly dosaženy. Všechny výsledky mají přímou vazbu k cílům projektu a vznikly během řešení projektu.
Termíny řešení
Zahájení řešení
1. 1. 2023
Ukončení řešení
31. 12. 2023
Poslední stav řešení
U - Ukončený projekt
Poslední uvolnění podpory
28. 2. 2023
Dodání dat do CEP
Důvěrnost údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Systémové označení dodávky dat
CEP24-MV0-VC-U
Datum dodání záznamu
14. 5. 2024
Finance
Celkové uznané náklady
4 939 tis. Kč
Výše podpory ze státního rozpočtu
4 939 tis. Kč
Ostatní veřejné zdroje financování
0 tis. Kč
Neveřejné tuz. a zahr. zdroje finan.
0 tis. Kč