Metodika ztotožňování entit
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F63076616%3A_____%2F21%3AN0000003" target="_blank" >RIV/63076616:_____/21:N0000003 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Metodika ztotožňování entit
Popis výsledku v původním jazyce
Certifikovaná metodika Metodika ztotožňování entit, která popisuje datové zdroje, ztotožňované entity a jejich popisné atributy, ztotožňovací algoritmy a proces instalace, implementace, logování a výstupy. Metodika tak slouží jako vhodný nástroj pro pochopení vytvořených algoritmů a další rozvoj.
Název v anglickém jazyce
Methodology for entities identification
Popis výsledku anglicky
Certified methodology. The methodology of identifying entities, which describes data sources, identified entities and their descriptive attributes, identification algorithms, and the process of installation, implementation, logging, and outputs. Therefore, the methodology serves as a suitable tool for understanding the created algorithms and further development.
Klasifikace
Druh
N<sub>metC</sub> - Metodiky certifikované oprávněným orgánem
CEP obor
—
OECD FORD obor
10103 - Statistics and probability
Návaznosti výsledku
Projekt
<a href="/cs/project/VH20202021054" target="_blank" >VH20202021054: Algoritmy pro ztotožňování entit užívaných PČR</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Ztotožňování entit 25/2021
Číslo předpisu
25/2021
Technické parametry
Metodika popisuje postupy ztotožňování entit, ze kterými pracuje Policie České republiky, a softwarovou implementaci tohoto ztotožňování. Ztotožňovací postupy byly vyvinuty a otestovány pro firmy, lokality, osoby, telefony a vozidla, pro další typy entit je možně postupovat analogicky. V metodice je popsán postup rozhodování o shodě či neshodě dvojice entit. Každá entita je popsána sadou atributů, z nichž žádný není striktně vyžadován. Zpravidla se jedná o textové atributy jako například jméno, adresa nebo značka. Atributy jsou před rozhodováním standardizovány. Při rozhodování se buď aplikují jednoduchá expertní pravidla, nebo rozhodnutí provede klasifikační skórovací model. Metodika navrhuje postupy ztotožňování párů entit určené pro situace, kdy entity jsou charakterizované textovými atributy vkládanými uživateli různých informačních systémů. Atributy mohou obsahovat vynechané hodnoty. U platných hodnot se přepokládá, že stejná hodnota atributu může být vyjádřena jiným textem a v textech se mohou vyskytovat chyby způsobené uživateli. Významná novost přístupu spočívá ve využívaní návazných atributů, jako jsou například vlastnosti vozidel vlastněných ztotožňovanými osobami.
Ekonomické parametry
Metodika umožní pravděpodobnostní ztotožnění entit evidovaných při výkonu policejních činností (fyzická osoba, právnická osoba, vozidlo, adresa, bankovní účet, telefonní číslo, droga, chemická látka, zbraň apod.). Toto povede ke zkvalitnění, zrychlení a zefektivnění policejních činností. Cílem je vyvinout metodiku a nástroj, který na základě naučených pravidel, slovníků a metod data miningu dokáže s určitou pravděpodobností spojit příslušné entity k sobě (v rámci jednoho či napříč více informačními systémy, kterými disponuje v současnosti Policie ČR), ačkoliv spolu na první pohled nijak nesouvisí. Tím se jednak odstraní duplicity- v uložených datech a dále i naleznou nové informace, které povedou ke kvalitnějšímu plnění úkolů, které na Policii ČR klade legislativa.
Označení certifikačního orgánu
Ministerstvo vnitra České republiky
Datum certifikace
—
Způsoby využití výsledku
B - Výsledek je využíván orgány státní nebo veřejné správy