CMP-Rádce-klasifikátor textů
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61988987%3A17200%2F21%3AA2202CR4" target="_blank" >RIV/61988987:17200/21:A2202CR4 - isvavai.cz</a>
Výsledek na webu
<a href="https://github.com/tacrcmp/cmp-radce" target="_blank" >https://github.com/tacrcmp/cmp-radce</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
CMP-Rádce-klasifikátor textů
Popis výsledku v původním jazyce
Funkční běžící informační systém /IS) vytvořený pro potřeby aplikačního garanta TAČR–VISNEP a hlavního příjemce výsledku SW Sdružení pro rehabilitaci osob po cévních mozkových příhodách z. s. komplexně podporující neformální pečující o blízké po CMP v kontextu jejich nízkoprahové informační podpory. Softwarem je vyvinutý klasifikátor textů, který analyzuje dokumenty dostupné v rámci serveru CMP Rádce (CMP-R) a klasifikuje je podle kategorií tamtéž, pro potřeby navigace nad obsahem serveru i obsažené dokumentace. Jeho výstupy se transformují do databáze a vytváří/aktualizují slovní mrak (tag-cloud). Tento původní software je začleněn do serveru, na kterém běží IS CMP-R a je k dispozici zájemcům pro další využití a rozvoj. Klasifikátor je založen na původních algoritmech spojujících zpracování textů v přirozeném jazyce s umělou inteligenci, kategorizuje dokumenty dostupné na serveru CMP-R a naviguje nad jejich obsahem pomocí tag-cloud. Jeho hlavním cílem je identifikovat klíčová slova každého dokumentu a sestavit z nich model jednotlivých kategorií obsahující základní morfologické prvky nejvýstižnějších klíčových slov seřazených dle důležitosti. Z těchto slov pak generuje tag-cloud sloužící k navigaci nad obsahem CMP-R. Nové dokumenty pak klasifikuje na základě podobnosti s tímto modelem. Klasifikátor je také schopen se průběžně 'doučovat' z nově přidávaných dokumentů formou přepočtu modelu tříd a je tak rovněž schopen si poradit s rozdílnou větnou skladbou uživatelů CMP-R, jejich překlepy a 'stylem psaní'. Samotný algoritmus je také díky svému principu schopen si v budoucnu poradit i s jinými jazyky, než je čeština, což otevírá cestu dalším jazykovým mutacím.
Název v anglickém jazyce
Stroke-Counselor-Classifier of Texts
Popis výsledku anglicky
Functional running information system created for the needs of the application guarantor of TAČR-VISNEP and the main recipient of the SW result, ie the Association for Rehabilitation of People after Stroke comprehensively supporting informal carers of loved ones after stroke (S) in the context of their low-threshold information support. The software develops a text classifier that analyzes the documents available within the S Advisor server (CMP-R) and classifies them according to the categories there, for the needs of navigation over the server content and the contained documentation. Its outputs are transformed into a database and create / update a word cloud (tag-cloud). This original software is integrated into a server running the CMP-R information system and is available available to interested parties for further use and development. The classifier is based on the original algorithms combining natural language word processing with artificial intelligence, categorizes documents available on the CMP-R server and navigates their content using tag-cloudg. Its main goal is to identify the keywords of each document and compile a model of individual categories containing the basic morphological elements of the most concise keywords sorted by importance. From these words, it then generates a tag-cloud used to navigate the content of the CMP-R. It then classifies new documents on the basis of similarity to this model. The classifier is also able to continuously 'tutor' from the newly added documents in the form of recalculation of the class model and is thus also able to deal with the different sentence structure of CMP-R users, their typos and 'writing style'. Thanks to its principle, the algorithm itself is also able to handle languages other than Czech in the future, which opens the way for other language mutations.
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10200 - Computer and information sciences
Návaznosti výsledku
Projekt
<a href="/cs/project/TL02000050" target="_blank" >TL02000050: Výzkum a vývoj podpůrných sítí a informačních systémů pro neformální pečující o osoby po cévních mozkových příhodách</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2021
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
OU / VŠB-TUO TAČR-VISNEP TL02000050
Technické parametry
Požadavky na systém: Linux Debian server, webový server (Nginx, Apache) s podporou PHP minimálně ve verzi 7.3. CMS Wordpress + plugins jako jQCloud? Poštovní server Postfix, Docker ve kterém běží: vlastní web CMP Rádce, Nextcloud projektu, databázový server MariaDB. Klasifikátor vyžaduje Java JRE ve verzi min. 8, raději však 11 (testováno na OpenJDK 11 64bit) a MySQL (testováno na verzi 8). Smlouva o využití výsledků mezi Ostravskou univerzitou (řešitel) a Vysokou školou báňskou - Technickou univerzitou Ostrava (spoluřešitel) č. TL02000050 (SML/2001/0007/21) ze dne 21. 12. 2021.
Ekonomické parametry
nekomerční využití
IČO vlastníka výsledku
61988987
Název vlastníka
Ostravská univerzita (50%), Vysoká škola báňská - Technická univerzita Ostrava (50%)