Using word embeddings for analysing texts from the educational domain
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F62156489%3A43110%2F18%3A43913697" target="_blank" >RIV/62156489:43110/18:43913697 - isvavai.cz</a>
Výsledek na webu
<a href="http://pefnet.mendelu.cz/wcd/w-rek-pefnet/pefnet17_fin.pdf" target="_blank" >http://pefnet.mendelu.cz/wcd/w-rek-pefnet/pefnet17_fin.pdf</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Using word embeddings for analysing texts from the educational domain
Popis výsledku v původním jazyce
The application of machine learning to natural language data is very attractive for a data scientist. Modern algorithms and text representations allow the discovery of information about the semantic content of texts with more possibilities than before. The article deals with algorithms for word embeddings - namely word2vec and fastText. The goal was to analyse Facebook posts from the pages of universities in the Czech Republic. After creating and querying the natural language models, we were able to discover what is the most interesting information and the relations for the names of universities, job opportunities, specialisations, events, freshmen, or out of school activities.
Název v anglickém jazyce
Using word embeddings for analysing texts from the educational domain
Popis výsledku anglicky
The application of machine learning to natural language data is very attractive for a data scientist. Modern algorithms and text representations allow the discovery of information about the semantic content of texts with more possibilities than before. The article deals with algorithms for word embeddings - namely word2vec and fastText. The goal was to analyse Facebook posts from the pages of universities in the Czech Republic. After creating and querying the natural language models, we were able to discover what is the most interesting information and the relations for the names of universities, job opportunities, specialisations, events, freshmen, or out of school activities.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
—
Návaznosti
S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
PEFnet 2017: Proceedings
ISBN
978-80-7509-555-8
ISSN
—
e-ISSN
neuvedeno
Počet stran výsledku
8
Strana od-do
129-136
Název nakladatele
Mendelova univerzita v Brně
Místo vydání
Brno
Místo konání akce
Brno
Datum konání akce
30. 11. 2017
Typ akce podle státní příslušnosti
EUR - Evropská akce
Kód UT WoS článku
—