Word Categorization of Corporate Annual Reports for Bankruptcy Prediction by Machine Learning Methods
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216275%3A25410%2F15%3A39899766" target="_blank" >RIV/00216275:25410/15:39899766 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1007/978-3-319-24033-6_14" target="_blank" >http://dx.doi.org/10.1007/978-3-319-24033-6_14</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1007/978-3-319-24033-6_14" target="_blank" >10.1007/978-3-319-24033-6_14</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Word Categorization of Corporate Annual Reports for Bankruptcy Prediction by Machine Learning Methods
Popis výsledku v původním jazyce
The language of company related documents is recognized as being an important indicator of future financial performance. This study aims to extract various word categories from corporate annual reports and examine their effect on bankruptcy prediction. We show that the language used by bankrupt companies is characterized by stronger tenacity, accomplishment, familiarity, present concern, exclusion and denial. Bankrupt companies also use more modal, positive, uncertain and negative language. We used neural networks, support vector machines, decision trees and ensembles of decision trees to predict corporate bankruptcy. The prediction models utilized both financial indicators and word categorizations as input variables. We show that both general dictionary and financial dictionary categories can significantly improve the accuracy of the prediction models.
Název v anglickém jazyce
Word Categorization of Corporate Annual Reports for Bankruptcy Prediction by Machine Learning Methods
Popis výsledku anglicky
The language of company related documents is recognized as being an important indicator of future financial performance. This study aims to extract various word categories from corporate annual reports and examine their effect on bankruptcy prediction. We show that the language used by bankrupt companies is characterized by stronger tenacity, accomplishment, familiarity, present concern, exclusion and denial. Bankrupt companies also use more modal, positive, uncertain and negative language. We used neural networks, support vector machines, decision trees and ensembles of decision trees to predict corporate bankruptcy. The prediction models utilized both financial indicators and word categorizations as input variables. We show that both general dictionary and financial dictionary categories can significantly improve the accuracy of the prediction models.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
IN - Informatika
OECD FORD obor
—
Návaznosti výsledku
Projekt
<a href="/cs/project/GA13-10331S" target="_blank" >GA13-10331S: Úloha textové informace v modelech predikce finanční tísně podniků - přístupy specifické podle států a průmyslových odvětví</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)
Ostatní
Rok uplatnění
2015
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
Text, Speech, and Dialogue: 18th International Conference, TSD 2015 Proceedings
ISBN
978-3-319-24032-9
ISSN
0302-9743
e-ISSN
—
Počet stran výsledku
9
Strana od-do
122-130
Název nakladatele
Springer
Místo vydání
Berlin
Místo konání akce
Plzeň
Datum konání akce
14. 9. 2015
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
000365947800014