Semantic Space Transformations for Cross-Lingual Document Classification
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F18%3A43952471" target="_blank" >RIV/49777513:23520/18:43952471 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-030-01418-6_60" target="_blank" >http://dx.doi.org/10.1007/978-3-030-01418-6_60</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-030-01418-6_60" target="_blank" >10.1007/978-3-030-01418-6_60</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Semantic Space Transformations for Cross-Lingual Document Classification
Popis výsledku v původním jazyce
This paper deals with cross-lingual document classification. Cross-linguality is achieved by training monolingual semantic spaces and then using a transform method to project word vectors into a unified space. The main goal of this paper consists in the evaluation of three promising transform methods utilized for this task. Convolutional neural network (CNN) classifier is used and its performance is compared with a standard maximum entropy classifier. The proposed methods are evaluated on four languages, namely English, German, Spanish and Italian from the Reuters corpus. It is shown that the results of all transformation methods are close to each other, however the orthogonal transformation gives generally slightly better results when CNN with trained embeddings is used. The experimental results also show that convolutional network achieves better results than maximum entropy classifier.
Název v anglickém jazyce
Semantic Space Transformations for Cross-Lingual Document Classification
Popis výsledku anglicky
This paper deals with cross-lingual document classification. Cross-linguality is achieved by training monolingual semantic spaces and then using a transform method to project word vectors into a unified space. The main goal of this paper consists in the evaluation of three promising transform methods utilized for this task. Convolutional neural network (CNN) classifier is used and its performance is compared with a standard maximum entropy classifier. The proposed methods are evaluated on four languages, namely English, German, Spanish and Italian from the Reuters corpus. It is shown that the results of all transformation methods are close to each other, however the orthogonal transformation gives generally slightly better results when CNN with trained embeddings is used. The experimental results also show that convolutional network achieves better results than maximum entropy classifier.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10201 - Computer sciences, information science, bioinformathics (hardware development to be 2.2, social aspect to be 5.8)
Návaznosti výsledku
Projekt
<a href="/cs/project/LO1506" target="_blank" >LO1506: Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2018
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Artificial Neural Networks and Machine Learning – ICANN 2018
ISBN
978-3-030-01417-9
ISSN
0302-9743
e-ISSN
1611-3349
Počet stran výsledku
9
Strana od-do
608-616
Název nakladatele
Springer
Místo vydání
Cham
Místo konání akce
Rhodos, Řecko
Datum konání akce
4. 10. 2018
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—