Source Code Metrics for Software Defects Prediction
Identifikátory výsledku
Kód výsledku v IS VaVaI
<a href="https://www.isvavai.cz/riv?ss=detail&h=RIV%2F00216224%3A14330%2F23%3A00130144" target="_blank" >RIV/00216224:14330/23:00130144 - isvavai.cz</a>
Výsledek na webu
<a href="http://dx.doi.org/10.1145/3555776.3577809" target="_blank" >http://dx.doi.org/10.1145/3555776.3577809</a>
DOI - Digital Object Identifier
<a href="http://dx.doi.org/10.1145/3555776.3577809" target="_blank" >10.1145/3555776.3577809</a>
Alternativní jazyky
Jazyk výsledku
angličtina
Název v původním jazyce
Source Code Metrics for Software Defects Prediction
Popis výsledku v původním jazyce
In current research, there are contrasting results about the applicability of software source code metrics as features for defect prediction models. The goal of the paper is to evaluate the adoption of software metrics in models for software defect prediction, identifying the impact of individual source code metrics. With an empirical study on 275 release versions of 39 Java projects mined from GitHub, we compute 12 software metrics and collect software defect information. We train and compare three defect classification models. The results across all projects indicate that Decision Tree (DT) and Random Forest (RF) classifiers show the best results. Among the highest-performing individual metrics are NOC, NPA, DIT, and LCOM5. While other metrics, such as CBO, do not bring significant improvements to the models.
Název v anglickém jazyce
Source Code Metrics for Software Defects Prediction
Popis výsledku anglicky
In current research, there are contrasting results about the applicability of software source code metrics as features for defect prediction models. The goal of the paper is to evaluate the adoption of software metrics in models for software defect prediction, identifying the impact of individual source code metrics. With an empirical study on 275 release versions of 39 Java projects mined from GitHub, we compute 12 software metrics and collect software defect information. We train and compare three defect classification models. The results across all projects indicate that Decision Tree (DT) and Random Forest (RF) classifiers show the best results. Among the highest-performing individual metrics are NOC, NPA, DIT, and LCOM5. While other metrics, such as CBO, do not bring significant improvements to the models.
Klasifikace
Druh
D - Stať ve sborníku
CEP obor
—
OECD FORD obor
10200 - Computer and information sciences
Návaznosti výsledku
Projekt
<a href="/cs/project/EF16_019%2F0000822" target="_blank" >EF16_019/0000822: Centrum excelence pro kyberkriminalitu, kyberbezpečnost a ochranu kritických informačních infrastruktur</a><br>
Návaznosti
P - Projekt vyzkumu a vyvoje financovany z verejnych zdroju (s odkazem do CEP)<br>S - Specificky vyzkum na vysokych skolach
Ostatní
Rok uplatnění
2023
Kód důvěrnosti údajů
S - Úplné a pravdivé údaje o projektu nepodléhají ochraně podle zvláštních právních předpisů
Údaje specifické pro druh výsledku
Název statě ve sborníku
The 38th ACM/SIGAPP Symposium on Applied Computing (SAC '23)
ISBN
9781450395175
ISSN
—
e-ISSN
—
Počet stran výsledku
4
Strana od-do
1469-1472
Název nakladatele
Association for Computing Machinery (ACM)
Místo vydání
Not specified
Místo konání akce
Tallinn, Estonia
Datum konání akce
27. 3. 2023
Typ akce podle státní příslušnosti
WRD - Celosvětová akce
Kód UT WoS článku
001124308100207