Software module for automatic topic modelling
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21240%2F24%3A00381854" target="_blank" >RIV/68407700:21240/24:00381854 - isvavai.cz</a>
Result on the web
<a href="https://gitlab.fit.cvut.cz/tacr_ucl/data-labelling-app" target="_blank" >https://gitlab.fit.cvut.cz/tacr_ucl/data-labelling-app</a>
DOI - Digital Object Identifier
—
Alternative languages
Result language
čeština
Original language name
Softwarový modul pro automatickou detekci tematických klastrů
Original language description
Aplikace dovoluje anotování dat více uživateli, kteří mohou básním z Korpusu českého verše přiřazovat témata ze seznamu vytvořeném pracovníky UČL. V aplikaci jsou též dostupné automaticky generované reporty umožňující prohlížení nesupervizovaného rozdělení do témat pomocí modelu Top2Vec. Ten je aplikován pomocí skriptů v jazyce Python.
Czech name
Softwarový modul pro automatickou detekci tematických klastrů
Czech description
Aplikace dovoluje anotování dat více uživateli, kteří mohou básním z Korpusu českého verše přiřazovat témata ze seznamu vytvořeném pracovníky UČL. V aplikaci jsou též dostupné automaticky generované reporty umožňující prohlížení nesupervizovaného rozdělení do témat pomocí modelu Top2Vec. Ten je aplikován pomocí skriptů v jazyce Python.
Classification
Type
R - Software
CEP classification
—
OECD FORD branch
60206 - Specific literatures
Result continuities
Project
<a href="/en/project/TL05000288" target="_blank" >TL05000288: Analysis of thematicclusters from the field of current cultural and social categories and their application to literary works of Czech 19th and 20th century</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2024
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Internal product ID
TACR-UCL-V2
Technical parameters
Jedná se o výsledek typu R - Software (Softwarový modul pro automatickou detekci tematických klastrů) s identifikačním číslem TL05000288-V2 projektu TAČR (TL05000288), řešitel projektu Ústav pro českou literaturu AV ČR, v. v. i. (IČO 68378068) je spoluvlastníkem (50 %).
Economical parameters
Projekt je dostupný pro vybrané pracovníky FITu a UČL, zpracovávaný dataset Korpus českého verše je kompletně zveřejněn.
Owner IČO
68407700
Owner name
České vysoké učení technické v Praze / Fakulta informačních technologií