A Lexicographer-Friendly Association Score
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F08%3A00049430" target="_blank" >RIV/00216224:14330/08:00049430 - isvavai.cz</a>
Výsledek na webu
—
DOI - Digital Object Identifier
—
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
A Lexicographer-Friendly Association Score
Popis výsledku v původním jazyce
Finding collocation candidates is one of the most important and widely used feature of corpus linguistics tools. There are many statistical association measures used to identify good collocations. Most of these measures define a formula of a associationscore which indicates amount of statistical association between two words. The score is computed for all possible word pairs and the word pairs with the highest score are presented as collocation candidates. The same scores are used in many other algorithms in corpus linguistics. The score values are usually meaningless and corpus specific, they cannot be used to compare words (or word pairs) of different corpora. But endusers want an interpretation of such scores and want a score?s stability. This paper present a modification of a well known association score which has a reasonable interpretation and other good features.
Název v anglickém jazyce
A Lexicographer-Friendly Association Score
Popis výsledku anglicky
Finding collocation candidates is one of the most important and widely used feature of corpus linguistics tools. There are many statistical association measures used to identify good collocations. Most of these measures define a formula of a associationscore which indicates amount of statistical association between two words. The score is computed for all possible word pairs and the word pairs with the highest score are presented as collocation candidates. The same scores are used in many other algorithms in corpus linguistics. The score values are usually meaningless and corpus specific, they cannot be used to compare words (or word pairs) of different corpora. But endusers want an interpretation of such scores and want a score?s stability. This paper present a modification of a well known association score which has a reasonable interpretation and other good features.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
AI - Jazykověda
OECD FORD obor
—
Návaznosti výsledku
Projekt
Výsledek vznikl pri realizaci vícero projektů. Více informací v záložce Projekty.
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2008
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
RASLAN 2008
ISBN
978-80-210-4741-9
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
6-9
Název nakladatele
Masarykova Univerzita
Místo vydání
Brno
Místo konání akce
Brno
Datum konání akce
1. 1. 2008
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—