Two uses of anaphora resolution in summarization
The result's identifiers
Result code in IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F49777513%3A23520%2F07%3A00000182" target="_blank" >RIV/49777513:23520/07:00000182 - isvavai.cz</a>
Result on the web
—
DOI - Digital Object Identifier
—
Alternative languages
Result language
angličtina
Original language name
Two uses of anaphora resolution in summarization
Original language description
We propose a new method for using anaphoric information in Latent Semantic Analysis /LSA/, and discuss its application to develop an LSA-bvased summarizer which achieves a significantly better performance than a system not using anaphoric information, and a better performance by the ROUGE measure than all but one of the single-document summarizers participating in DUC-2002. Anaphoric information is automatically extracted using a new release of our own anaphora resolution system, GUITA, which incorporates proper noun resolution. our summarizer also includes a new approach for automatically identifying the dimensionality reduction of a document on the basis of the desired summarization percentage. Anaphoric information is also used to check the cohorence of the summary produced by our summarizer, by a refrence checker module which identifies anaphoric resolution errors caused by sentence extraction.
Czech name
Dvojí použití rezoluce anafor v sumarizaci
Czech description
Navrhujeme novou metodu použití anaforických informací v latentní sémantické analýze /LSA/. Dále popisujeme metodu sumarizace založenou na LSA. Kvalita výsledných suhrnů, dle ROUGE porovnání, je významně lepší pokud zahrneme anaforické informace, než pripoužití čistě lexikální LSA metody. Anaforické informace jsou extrahovány novou verzí systému GuiTAR, který již zahrnuje rezoluci vlastních jmen. Anaforické informace jsou také použity pro kontrolu koherence souhrnů. Kontrolní modul identifikuje chybnéanafory vzniklé extrakcí vět.
Classification
Type
J<sub>x</sub> - Unclassified - Peer-reviewed scientific article (Jimp, Jsc and Jost)
CEP classification
JC - Computer hardware and software
OECD FORD branch
—
Result continuities
Project
<a href="/en/project/2C06009" target="_blank" >2C06009: Complex knowledge base tools for natural language communication with the semantic web</a><br>
Continuities
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Others
Publication year
2007
Confidentiality
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Data specific for result type
Name of the periodical
Information Processing and Management
ISSN
0306-4573
e-ISSN
—
Volume of the periodical
—
Issue of the periodical within the volume
—
Country of publishing house
NL - THE KINGDOM OF THE NETHERLANDS
Number of pages
18
Pages from-to
1663
UT code for WoS article
—
EID of the result in the Scopus database
—