Modulární neuronové sítě: metody zvyšující robustnost sémantického popisu scény
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F68407700%3A21230%2F19%3A00332133" target="_blank" >RIV/68407700:21230/19:00332133 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21730/19:00332133
Výsledek na webu
<a href="http://cogsci.fmph.uniba.sk/kuz2019/files/zbornik.KUZ2019.pdf" target="_blank" >http://cogsci.fmph.uniba.sk/kuz2019/files/zbornik.KUZ2019.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
čeština
Název v původním jazyce
Modulární neuronové sítě: metody zvyšující robustnost sémantického popisu scény
Popis výsledku v původním jazyce
Nejnovějšı' modely založené na modulárnı'ch neuronových sı'tı'ch dosahujı' lidské přesnosti v úloze Visual Question Answering (zodpovı'dánı' otázek k obrázkům). Ačkoliv zvládajı' zodpovı'dat v přirozeném jazyce i velmi komplexnı' otázky, mezi odpověd’mi chybı' základnı' logická konzistence (tedy 1+1=2). Právě proto použı'váme ucelenost popisu sémantické scény jako metriku pro dalšı' zlepšenı' současných architektur. V článku se soustředı'me na závislost přesnosti odpovědı' na úhlu pohledu na scénu. Ukazujeme, že současné modely nezvládajı' generalizovat napřı'č různými úhly a navrhujeme vlastnı' upravený dataset, který tuto přesnost zvyšuje.
Název v anglickém jazyce
Modular Neural Networks: Methods Improving Robustness in Semantic Description of a Scene
Popis výsledku anglicky
The newest models based on modular neural networks reach human-level accuracy in the task of Visual Question Answering (i.e. answering questions about images). Although they are able to answer even very complex questions in natural language, there is no logical consistency among the answers (i.e. 1+1=2). Therefore we are using the coherence of a semantic scene description as metrics for further improvement of the current architectures. In this article, we are focused on the relationship between the answer accuracy and different angles of view on the scene. We show that the current models fail to generalize across different angles and we suggest our own adjusted dataset, which improves such accuracy.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2019
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Kognícia a umelý život 2019
ISBN
978-80-223-4720-4
ISSN
—
e-ISSN
—
Počet stran výsledku
2
Strana od-do
114-115
Název nakladatele
Univerzita Komenského v Bratislave
Místo vydání
—
Místo konání akce
Hotel Barónka, Bratislava
Datum konání akce
29. 5. 2019
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—