An Architecture for Scientific Document Retrieval Using Textual and Math Entailment Modules
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F14%3A00077458" target="_blank" >RIV/00216224:14330/14:00077458 - isvavai.cz</a>
Výsledek na webu
<a href="https://doi.dx.org/10.13140/2.1.4036.2561" target="_blank" >https://doi.dx.org/10.13140/2.1.4036.2561</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.13140/2.1.4036.2561" target="_blank" >10.13140/2.1.4036.2561</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
An Architecture for Scientific Document Retrieval Using Textual and Math Entailment Modules
Popis výsledku v původním jazyce
We present an architecture for scientific document retrieval. An existing system for textual and math-ware retrieval Math Indexer and Searcher MIaS is designed for extensions by modules for textual and math-aware entailment. The goal is to increase quality of retrieval (precision and recall) by handling natural languge variations of expressing semantically the same in texts and/or formulae. Entailment modules are designed to use several, ordered layers of processing on lexical, syntactic and semantic levels using natural language processing tools adapted for handling tree structures like mathematical formulae. If these tools are not able to decide on the entailment, generic knowledge databases are used deploying distributional semantics methods and tools. It is shown that sole use of distributional semantics for semantic textual entailment decisions on sentence level is surprisingly good. Finally, further research plans to deploy results in the digital mathematical libraries are outlin
Název v anglickém jazyce
An Architecture for Scientific Document Retrieval Using Textual and Math Entailment Modules
Popis výsledku anglicky
We present an architecture for scientific document retrieval. An existing system for textual and math-ware retrieval Math Indexer and Searcher MIaS is designed for extensions by modules for textual and math-aware entailment. The goal is to increase quality of retrieval (precision and recall) by handling natural languge variations of expressing semantically the same in texts and/or formulae. Entailment modules are designed to use several, ordered layers of processing on lexical, syntactic and semantic levels using natural language processing tools adapted for handling tree structures like mathematical formulae. If these tools are not able to decide on the entailment, generic knowledge databases are used deploying distributional semantics methods and tools. It is shown that sole use of distributional semantics for semantic textual entailment decisions on sentence level is surprisingly good. Finally, further research plans to deploy results in the digital mathematical libraries are outlin
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/LG13010" target="_blank" >LG13010: Zastoupení ČR v European Research Consortium for Informatics and Mathematics</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2014
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Eighth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2014
ISBN
—
ISSN
2336-4289
e-ISSN
—
Počet stran výsledku
11
Strana od-do
107-117
Název nakladatele
Tribun EU
Místo vydání
Brno
Místo konání akce
Karlova Studánka
Datum konání akce
1. 1. 2014
Typ akce podle státní příslušnosti
CST - Celostátní akce
Kód UT WoS článku
—