Vše

Co hledáte?

Vše
Projekty
Výsledky výzkumu
Subjekty

Rychlé hledání

  • Projekty podpořené TA ČR
  • Významné projekty
  • Projekty s nejvyšší státní podporou
  • Aktuálně běžící projekty

Chytré vyhledávání

  • Takto najdu konkrétní +slovo
  • Takto z výsledků -slovo zcela vynechám
  • “Takto můžu najít celou frázi”

CMP-Rádce-klasifikátor textů

Identifikátory výsledku

  • Kód výsledku v IS VaVaI

    <a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F61988987%3A17200%2F21%3AA2202CR4" target="_blank" >RIV/61988987:17200/21:A2202CR4 - isvavai.cz</a>

  • Výsledek na webu

    <a href="https://github.com/tacrcmp/cmp-radce" target="_blank" >https://github.com/tacrcmp/cmp-radce</a>

  • DOI - Digital Object Identifier

Alternativní jazyky

  • Jazyk výsledku

    čeština

  • Název v původním jazyce

    CMP-Rádce-klasifikátor textů

  • Popis výsledku v původním jazyce

    Funkční běžící informační systém /IS) vytvořený pro potřeby aplikačního garanta TAČR–VISNEP a hlavního příjemce výsledku SW Sdružení pro rehabilitaci osob po cévních mozkových příhodách z. s. komplexně podporující neformální pečující o blízké po CMP v kontextu jejich nízkoprahové informační podpory. Softwarem je vyvinutý klasifikátor textů, který analyzuje dokumenty dostupné v rámci serveru CMP Rádce (CMP-R) a klasifikuje je podle kategorií tamtéž, pro potřeby navigace nad obsahem serveru i obsažené dokumentace. Jeho výstupy se transformují do databáze a vytváří/aktualizují slovní mrak (tag-cloud). Tento původní software je začleněn do serveru, na kterém běží IS CMP-R a je k dispozici zájemcům pro další využití a rozvoj. Klasifikátor je založen na původních algoritmech spojujících zpracování textů v přirozeném jazyce s umělou inteligenci, kategorizuje dokumenty dostupné na serveru CMP-R a naviguje nad jejich obsahem pomocí tag-cloud. Jeho hlavním cílem je identifikovat klíčová slova každého dokumentu a sestavit z nich model jednotlivých kategorií obsahující základní morfologické prvky nejvýstižnějších klíčových slov seřazených dle důležitosti. Z těchto slov pak generuje tag-cloud sloužící k navigaci nad obsahem CMP-R. Nové dokumenty pak klasifikuje na základě podobnosti s tímto modelem. Klasifikátor je také schopen se průběžně 'doučovat' z nově přidávaných dokumentů formou přepočtu modelu tříd a je tak rovněž schopen si poradit s rozdílnou větnou skladbou uživatelů CMP-R, jejich překlepy a 'stylem psaní'. Samotný algoritmus je také díky svému principu schopen si v budoucnu poradit i s jinými jazyky, než je čeština, což otevírá cestu dalším jazykovým mutacím.

  • Název v anglickém jazyce

    Stroke-Counselor-Classifier of Texts

  • Popis výsledku anglicky

    Functional running information system created for the needs of the application guarantor of TAČR-VISNEP and the main recipient of the SW result, ie the Association for Rehabilitation of People after Stroke comprehensively supporting informal carers of loved ones after stroke (S) in the context of their low-threshold information support. The software develops a text classifier that analyzes the documents available within the S Advisor server (CMP-R) and classifies them according to the categories there, for the needs of navigation over the server content and the contained documentation. Its outputs are transformed into a database and create / update a word cloud (tag-cloud). This original software is integrated into a server running the CMP-R information system and is available available to interested parties for further use and development. The classifier is based on the original algorithms combining natural language word processing with artificial intelligence, categorizes documents available on the CMP-R server and navigates their content using tag-cloudg. Its main goal is to identify the keywords of each document and compile a model of individual categories containing the basic morphological elements of the most concise keywords sorted by importance. From these words, it then generates a tag-cloud used to navigate the content of the CMP-R. It then classifies new documents on the basis of similarity to this model. The classifier is also able to continuously 'tutor' from the newly added documents in the form of recalculation of the class model and is thus also able to deal with the different sentence structure of CMP-R users, their typos and 'writing style'. Thanks to its principle, the algorithm itself is also able to handle languages other than Czech in the future, which opens the way for other language mutations.

Klasifikace

  • Druh

    R - Software

  • CEP obor

  • OECD FORD obor

    10200 - Computer and information sciences

Návaznosti výsledku

  • Projekt

    <a href="/cs/project/TL02000050" target="_blank" >TL02000050: Výzkum a vývoj podpůrných sítí a informačních systémů pro neformální pečující o osoby po cévních mozkových příhodách</a><br>

  • Návaznosti

    P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

  • Rok uplatnění

    2021

  • Kód důvěrnosti údajů

    S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

  • Interní identifikační kód produktu

    OU / VŠB-TUO TAČR-VISNEP TL02000050

  • Technické parametry

    Požadavky na systém: Linux Debian server, webový server (Nginx, Apache) s podporou PHP minimálně ve verzi 7.3. CMS Wordpress + plugins jako jQCloud? Poštovní server Postfix, Docker ve kterém běží: vlastní web CMP Rádce, Nextcloud projektu, databázový server MariaDB. Klasifikátor vyžaduje Java JRE ve verzi min. 8, raději však 11 (testováno na OpenJDK 11 64bit) a MySQL (testováno na verzi 8). Smlouva o využití výsledků mezi Ostravskou univerzitou (řešitel) a Vysokou školou báňskou - Technickou univerzitou Ostrava (spoluřešitel) č. TL02000050 (SML/2001/0007/21) ze dne 21. 12. 2021.

  • Ekonomické parametry

    nekomerční využití

  • IČO vlastníka výsledku

    61988987

  • Název vlastníka

    Ostravská univerzita (50%), Vysoká škola báňská - Technická univerzita Ostrava (50%)