Textjuicer - Software for Generating Summaries
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216305%3A26230%2F24%3APR40079" target="_blank" >RIV/00216305:26230/24:PR40079 - isvavai.cz</a>
Výsledek na webu
<a href="https://github.com/DCGM/semant-summarization" target="_blank" >https://github.com/DCGM/semant-summarization</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Textjuicer - Software for Generating Summaries
Popis výsledku v původním jazyce
Implementation of the Textjuicer tool, which enables text summarization using specially trained large language models, freely available general language models, and models accessible via commercial APIs. As part of this tool, we have also trained two large language models for generating summaries of search results. Git: https://github.com/DCGM/semant-summarization Technical documentation: https://github.com/DCGM/semant-summarization/blob/main/doc/semANT%202024%20-%20T echnick%C3%A1%20Dokumentace%20k%20Software%20TextJuicer.pdf
Název v anglickém jazyce
Textjuicer - Software for Generating Summaries
Popis výsledku anglicky
Implementation of the Textjuicer tool, which enables text summarization using specially trained large language models, freely available general language models, and models accessible via commercial APIs. As part of this tool, we have also trained two large language models for generating summaries of search results. Git: https://github.com/DCGM/semant-summarization Technical documentation: https://github.com/DCGM/semant-summarization/blob/main/doc/semANT%202024%20-%20T echnick%C3%A1%20Dokumentace%20k%20Software%20TextJuicer.pdf
Klasifikace
Druh
R - Software
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/DH23P03OVV060" target="_blank" >DH23P03OVV060: semANT – Sémantický průzkumník textového kulturního dědictví</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2024
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Interní identifikační kód produktu
Textjuicer
Technické parametry
Software je volně volně dostupný na základě bezplatné open-source licence. Software poskytuje jednotné rozhraní pro různé formy sumarizace textů a různé formy inference jazykových models (od OpenAI api, volné obecné modely i rychlé modely specificky trénované pro sumarizaci). Součástí je python balíček, server poskytující REST API, připravené nasazení pomocí docker a natrénované jazykové modely různých velikostí.
Ekonomické parametry
N/N - výsledek je uvolněn pod volnou licencí BSD 3-Clause License, která umožňuje libovolé použití a úpravy bez poplatků. Natrénované modely jsou uvolněny také pod permisivní licencí. Software může být přímo používán dalšími subjekty na základě volné licence. Komerční uplatnění předpokládáme v rámci poskytování doplňkových služeb, podpory, integrace, úprav aplikace na míru a konzultací.
IČO vlastníka výsledku
00216305
Název vlastníka
Vysoké učení technické v Brně