Using Artificial Neural Networks to Determine Ontologies Most Relevant to Scientific Texts
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F67985807%3A_____%2F22%3A00565961" target="_blank" >RIV/67985807:_____/22:00565961 - isvavai.cz</a>
Nalezeny alternativní kódy
RIV/68407700:21240/22:00359902
Výsledek na webu
<a href="https://ceur-ws.org/Vol-3226/paper5.pdf" target="_blank" >https://ceur-ws.org/Vol-3226/paper5.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Using Artificial Neural Networks to Determine Ontologies Most Relevant to Scientific Texts
Popis výsledku v původním jazyce
This paper provides an insight into the possibility of how to find ontologies most relevant to scientific texts using artificial neural networks. The basic idea of the presented approach is to select a representative paragraph from a source text file, embed it to a vector space by a pre-trained fine-tuned transformer, and classify the embedded vector according to its relevance to a target ontology. We have considered different classifiers to categorize the output from the transformer, in particular random forest, support vector machine, multilayer perceptron, k-nearest neighbors, and Gaussian process classifiers. Their suitability has been evaluated in a use case with ontologies and scientific texts concerning catalysis research. From results we can say the worst results have random forest. The best results in this task brought support vector machine classifier
Název v anglickém jazyce
Using Artificial Neural Networks to Determine Ontologies Most Relevant to Scientific Texts
Popis výsledku anglicky
This paper provides an insight into the possibility of how to find ontologies most relevant to scientific texts using artificial neural networks. The basic idea of the presented approach is to select a representative paragraph from a source text file, embed it to a vector space by a pre-trained fine-tuned transformer, and classify the embedded vector according to its relevance to a target ontology. We have considered different classifiers to categorize the output from the transformer, in particular random forest, support vector machine, multilayer perceptron, k-nearest neighbors, and Gaussian process classifiers. Their suitability has been evaluated in a use case with ontologies and scientific texts concerning catalysis research. From results we can say the worst results have random forest. The best results in this task brought support vector machine classifier
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
I - Institucionalni podpora na dlouhodoby koncepcni rozvoj vyzkumne organizace
Ostatní
Rok uplatnění
2022
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Proceedings of the 22st Conference Information Technologies – Applications and Theory (ITAT 2022)
ISBN
—
ISSN
1613-0073
e-ISSN
—
Počet stran výsledku
11
Strana od-do
44-54
Název nakladatele
Technical University & CreateSpace Independent Publishing
Místo vydání
Aachen
Místo konání akce
Zuberec
Datum konání akce
23. 9. 2022
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—