Building A Thesaurus Using LDA-Frames
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F12%3A00062319" target="_blank" >RIV/00216224:14330/12:00062319 - isvavai.cz</a>
Výsledek na webu
<a href="http://raslan2012.nlp-consulting.net/" target="_blank" >http://raslan2012.nlp-consulting.net/</a>
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Building A Thesaurus Using LDA-Frames
Popis výsledku v původním jazyce
In this paper we present a new method for measuring semantic relatedness of lexical units, which can be used to generate a thesaurus automatically. The method is based on a comparison of probability distributions of semantic frames generated using the LDA-frames algorithm. The idea is evaluated by measuring the overlap of WordNet synsets and generated semantic clusters. The results show that the method outperforms another automatic approach used in the Sketch Engine project.
Název v anglickém jazyce
Building A Thesaurus Using LDA-Frames
Popis výsledku anglicky
In this paper we present a new method for measuring semantic relatedness of lexical units, which can be used to generate a thesaurus automatically. The method is based on a comparison of probability distributions of semantic frames generated using the LDA-frames algorithm. The idea is evaluated by measuring the overlap of WordNet synsets and generated semantic clusters. The results show that the method outperforms another automatic approach used in the Sketch Engine project.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LM2010013" target="_blank" >LM2010013: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2012
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
6th Workshop on Recent Advances in Slavonic Natural Language Processing
ISBN
9788026303138
ISSN
—
e-ISSN
—
Počet stran výsledku
7
Strana od-do
97-103
Název nakladatele
Tribun EU
Místo vydání
Brno
Místo konání akce
Karlova Studánka, Czech Republic
Datum konání akce
7. 12. 2012
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—