Optimalisasi Model Klasifikasi Diabetes Menggunakan Ensemble Learning Adaboost, Gradient Boosting, dan XGBoost
Keywords:
ensemble learning, AdaBoost, Gradient Boosting, XGBoostAbstract
Diabetes mellitus adalah penyakit kronis yang memengaruhi jutaan orang secara global dan membutuhkan metode diagnosis dini untuk mencegah komplikasi. Penelitian ini bertujuan untuk mengoptimalkan prediksi diabetes dengan membandingkan tiga metode ensemble learning: AdaBoost, Gradient Boosting, dan XGBoost. Dataset yang digunakan adalah Diabetes Health Indicators, yang menggabungkan indikator kesehatan seperti tekanan darah, kolesterol, dan kebiasaan gaya hidup. Tahapan penelitian meliputi pemrosesan data, pengembangan model, serta eval_uasi performa menggunakan metrik akurasi, presisi, recall, F1-score, dan AUC (Area Under the Curve). Hasil menunjukkan bahwa Gradient Boosting unggul dalam akurasi dan AUC, menandakan kemampuan yang lebih baik dalam mendeteksi diabetes secara konsisten dibandingkan dengan dua metode lainnya. AdaBoost memperlihatkan keseimbangan yang baik antara presisi dan recall, menjadikannya cocok untuk skenario yang memerlukan pengendalian kesalahan positif dan negatif secara proporsional. Sementara itu, XGBoost menawarkan efisiensi pemrosesan yang optimal dengan performa yang kompetitif. Gradient Boosting direkomendasikan untuk aplikasi klinis yang membutuhkan akurasi tinggi, sedangkan AdaBoost dapat menjadi alternatif ketika keseimbangan prediksi menjadi prioritas. Penelitian ini berkontribusi dalam pengembangan alat prediksi diabetes yang lebih akurat, efektif, dan dapat diterapkan di sektor kesehatan untuk mendukung upaya deteksi dini.References
K. Ogurtsova et al., “IDF diabetes Atlas: Global estimates of undiagnosed diabetes in adults for 2021,” Diabetes Res. Clin. Pract., vol. 183, 2022
U. e. Laila, K. Mahboob, A. W. Khan, F. Khan, dan W. Taekeun, “An Ensemble Approach to Predict Early-Stage Diabetes Risk Using Machine Learning: An Empirical Study,” Sensors, vol. 22, no. 14, hal. 1-15, 2022
M. H. D. M. Ribeiro dan L. dos Santos Coelho, “Ensemble approach based on bagging, boosting and stacking for short-term prediction in agribusiness time series,” Appl. Soft Comput. J., vol. 86, hal. 105837, 2020
S. Wu dan S. Meng, “A Modern Communication Path for Traditional Chinese Cultural Design Concepts Based on AdaBoost Model,” Appl. Math. Nonlinear Sci., vol. 9, no. 1, hal. 90781403, 2024
P. Chen dan C. Pan, “Diabetes classification model based on boosting algorithms,” BMC Bioinformatics, vol. 19, no. 1, hal. 1-9, 2018
P. K. Anand, D. R. Shin, dan M. L. Memon, “Adaptive boosting based personalized glucose monitoring system (PGMS) for non-invasive blood glucose prediction with improved accuracy,” Diagnostics, vol. 10, no. 5, hal. 1-22, 2020
S. Deepa dan B. Booba, “Predict Diabetes Healthcare Analytics Using Hybrid Gradient Boosting Machine Learning Model,” vol. 30, no. 5, hal. 2928-2945, 2024
S. P. Nainggolan dan A. Sinaga, “Comparative Analysis of Accuracy of Random Forest and Gradient Boosting Classifier Algorithm for Diabetes Classification,” Sebatik, vol. 27, no. 1, hal. 97-102, 2023
Kartina Diah Kusuma Wardani dan Memen Akbar, “Diabetes Risk Prediction using Feature Importance Extreme Gradient Boosting (XGBoost),” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 7, no. 4, hal. 824-831, 2023
S. Gundogdu, “Efficient prediction of early-stage diabetes using XGBoost classifier with random forest feature selection technique,” Multimed. Tools Appl., vol. 82, no. 22, hal. 34163-34181, 2023
F. Mazhar, W. Akbar, M. Sajid, N. Aslam, M. Imran, dan H. Ahmad, “Boosting Early Diabetes Detection: An Ensemble Learning Approach with XGBoost and LightGBM,” J. Comput. & Biomed. Informatics, vol. 6, no. 02, hal. 127-138, 2024.
A. Maulana et al., “Machine Learning Approach for Diabetes Detection Using Fine-Tuned XGBoost Algorithm,” Infolitika J. Data Sci., vol. 1, no. 1, hal. 1-7, 2023