Software Framework for Scalable Topic Modelling

Identifikátory výsledku

Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F10%3A00051934" target="_blank" >RIV/00216224:14330/10:00051934 - isvavai.cz</a>
Výsledek na webu
<a href="http://nlp.fi.muni.cz/projekty/eudml/gensim/" target="_blank" >http://nlp.fi.muni.cz/projekty/eudml/gensim/</a>
DOI - Digital Object Identifier
—

Alternativní jazyky

Jazyk výsledku
angličtina
Název v původním jazyce
Software Framework for Scalable Topic Modelling
Popis výsledku v původním jazyce
Semantic-based text processing is a must in today's large-scale digital libraries and in web-scale search as Google does. Gensim implements semantic similarity computation of documents irrespectively of the size of text corpora -- it is unique because itworks "on-line", e.g. new documents can be fed to it without recomputation of the whole similarity matrix, which opens new horizons of its usage. Gensim is award-winning robust scalable software framework for topic modelling and similarity in text documents. It is used in the production of DML-CZ, EuDML, LarKC projects and has been also used for teaching at several universities. Awarded by Scopus awards - Česká naděje: http://suweco.cz:8080/awards/oceneny.aspx?idrok=2011 . Theoretical basis for software implementation has been published in several peer reviewed publications as: [1] Řehůřek, R.; Sojka, P. Software Framework for Topic Modelling with Large Corpora. In Proc. of LREC 2010 workshop New Challenges for NLP Frameworks.
Název v anglickém jazyce
Software Framework for Scalable Topic Modelling
Popis výsledku anglicky
Semantic-based text processing is a must in today's large-scale digital libraries and in web-scale search as Google does. Gensim implements semantic similarity computation of documents irrespectively of the size of text corpora -- it is unique because itworks "on-line", e.g. new documents can be fed to it without recomputation of the whole similarity matrix, which opens new horizons of its usage. Gensim is award-winning robust scalable software framework for topic modelling and similarity in text documents. It is used in the production of DML-CZ, EuDML, LarKC projects and has been also used for teaching at several universities. Awarded by Scopus awards - Česká naděje: http://suweco.cz:8080/awards/oceneny.aspx?idrok=2011 . Theoretical basis for software implementation has been published in several peer reviewed publications as: [1] Řehůřek, R.; Sojka, P. Software Framework for Topic Modelling with Large Corpora. In Proc. of LREC 2010 workshop New Challenges for NLP Frameworks.

Klasifikace

Druh
R - Software
CEP obor
IN - Informatika
OECD FORD obor
—

Návaznosti výsledku

Projekt
<a href="/cs/project/LA09016" target="_blank" >LA09016: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM)</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)

Ostatní

Rok uplatnění
2010
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů

Údaje specifické pro druh výsledku

Interní identifikační kód produktu
gensim
Technické parametry
Petr Sojka, FI MU Brno, Botanická 68a, 60200 Brno, CZ, tel. +420549496966
Ekonomické parametry
Open-source licence (bez poplatků); výrazně urychluje lokalizaci podobných publikací v digitálních knihovnách na základě _sémantické_ podobnosti a tím šetří člověkoroky práce. Použito již v cca desítce projektů jako DML-CZ, NUMDAM, LarKC, EuDML,...
IČO vlastníka výsledku
00216224
Název vlastníka
Masarykova univerzita

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Software Framework for Scalable Topic Modelling

Identifikátory výsledku

Alternativní jazyky

Klasifikace

Návaznosti výsledku

Ostatní

Údaje specifické pro druh výsledku

Podobné výsledky(10)

Co hledáte?

Rychlé hledání

Chytré vyhledávání

Popis výsledku

Identifikátory výsledku

Identifikátory výsledku

Alternativní jazyky

Alternativní jazyky

Klasifikace

Klasifikace

Návaznosti výsledku

Návaznosti výsledku

Ostatní

Ostatní

Údaje specifické pro druh výsledku

Údaje specifické pro druh výsledku

Podobné výsledky(10)