Czech Dataset for Semantic Similarity and Relatedness
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F17%3A43949764" target="_blank" >RIV/49777513:23520/17:43949764 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.26615/978-954-452-049-6_053" target="_blank" >http://dx.doi.org/10.26615/978-954-452-049-6_053</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.26615/978-954-452-049-6_053" target="_blank" >10.26615/978-954-452-049-6_053</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Czech Dataset for Semantic Similarity and Relatedness
Popis výsledku v původním jazyce
This paper introduces a Czech dataset for semantic similarity and semantic relatedness. The dataset contains word pairs with hand annotated scores that indicate the semantic similarity and semantic relatedness of the words. The dataset contains 953 word pairs compiled from 9 different sources. It contains words and their contexts taken from real text corpora including extra examples when the words are ambiguous. The dataset is annotated by 5 independent annotators. The average Spearman correlation coefficient of the annotation agreement is r = 0.81. We provide reference evaluation experiments with several methods for computing semantic similarity and relatedness.
Název v anglickém jazyce
Czech Dataset for Semantic Similarity and Relatedness
Popis výsledku anglicky
This paper introduces a Czech dataset for semantic similarity and semantic relatedness. The dataset contains word pairs with hand annotated scores that indicate the semantic similarity and semantic relatedness of the words. The dataset contains 953 word pairs compiled from 9 different sources. It contains words and their contexts taken from real text corpora including extra examples when the words are ambiguous. The dataset is annotated by 5 independent annotators. The average Spearman correlation coefficient of the annotation agreement is r = 0.81. We provide reference evaluation experiments with several methods for computing semantic similarity and relatedness.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
20204 - Robotics and automatic control
Návaznosti výsledku
Projekt
<a href="/cs/project/LO1506" target="_blank" >LO1506: Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnost</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2017
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Recent Advances in Natural Language Processing Meet Deep Learning
ISBN
978-954-452-048-9
ISSN
1313-8502
e-ISSN
neuvedeno
Počet stran výsledku
6
Strana od-do
401-406
Název nakladatele
INCOMA Ltd.
Místo vydání
Shoumen, Bulgaria
Místo konání akce
Varna
Datum konání akce
2. 9. 2017
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
—