Improving LSA-based summarization with anaphora resolution
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F05%3A00000679" target="_blank" >RIV/49777513:23520/05:00000679 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Improving LSA-based summarization with anaphora resolution
Original language description
We propose an approach to summarization exploiting both lexical information and the output of an automatic anaphoric resolver, and using Singular Value Decomposition (SVD) to identify the main terms. We demonstrate that adding anaphoric information results in significant performace improvements over a previously developed system in which only lexical terms are used as the input to SVD. However, we also show that how anaphoric information is used is cruial: whereas using this information to add new termsdoes result in improved performance, simple substitution makes the performance worse.
Czech name
Zdokonalení sumarizace založené na LSA rezolucí anafor
Czech description
Navrhujeme přístup k sumarizaci textů, který využívá lexikální informace, výstup automatické rezoluce anafor a používá singulární dekompozici (SVD) pro identifikaci hlavních termů. Demonstrujeme, že přidání informace o anaforách vede k významnému vylepšení původního systému, kde pouze lexikální termy jsou použity jako vstup do SVD. Dále ukazujeme, že rozhodující je jak použijeme anaforické informace. Zatímco přidání nových termů vede ke zlepšení výkonnosti, jednoduchá substituce vede ke zhoršení.
Classification
Type
D - Article in proceedings
CEP classification
JC - Computer hardware and software
OECD FORD branch
—
Result continuities
Project
—
Continuities
S - Specificky vyzkum na vysokych skolach
Others
Publication year
2005
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Article name in the collection
Human language technology conference and conference on empirical methods in natural language processing
ISBN
1-932432-55-8
ISSN
—
e-ISSN
—
Number of pages
8
Pages from-to
1-8
Publisher name
Omnipress Inc.
Place of publication
Madison
Event location
Vancouver, British Columbia, Canada
Event date
Jan 1, 2005
Type of event by nationality
WRD - Celosvětová akce
UT code for WoS article
—