Studi Komparatif Algoritma Klasifikasi Data Mining pada Prediksi Prestasi Siswa Berbasis Data Sosiodemografis
Keywords:
Data Mining, Klasifikasi, Prestasi Siswa, Random Forest, Data SosiodemografisAbstract
Perkembangan teknologi informasi mendorong pemanfaatan data akademik secara optimal melalui pendekatan data-driven decision making di bidang pendidikan. Penelitian ini bertujuan untuk melakukan studi komparatif algoritma klasifikasi data mining dalam memprediksi prestasi akademik siswa berbasis data sosiodemografis, latar belakang keluarga, kebiasaan belajar, dan keterlibatan sekolah. Dataset yang digunakan bersumber dari Kaggle Student_Performance dan telah melalui tahap pra-pemrosesan meliputi pembersihan data, transformasi variabel, normalisasi, serta seleksi atribut. Metode klasifikasi yang diterapkan meliputi Decision Tree, K-Nearest Neighbor (KNN), dan Random Forest dengan skema evaluasi 10-fold cross validation menggunakan aplikasi Orange Data Mining. Hasil penelitian menunjukkan bahwa algoritma Random Forest menghasilkan performa terbaik dengan nilai akurasi 76%, AUC 89,3%, serta keseimbangan yang baik antara precision dan recall dibandingkan algoritma lainnya. Analisis feature importance mengindikasikan bahwa variabel study_hours merupakan faktor paling dominan dalam memengaruhi prestasi akademik, diikuti oleh attendance_percentage, study_method, dan parent_education. Temuan ini menegaskan keunggulan pendekatan ensemble dalam menangani kompleksitas data pendidikan serta pentingnya kebiasaan belajar dalam meningkatkan prestasi akademik siswaReferences
N. Jena, “An Analysis of the Impact of Digital Transformation on Decision-Making in Higher Education Paradigms.,” J. Int. Soc. Res., vol. 17, no. 117, p. p1, 2024, [Online]. Available: https://www.sosyalarastirmalar.com/articles/an-analysis-of-the-impact-of-digital-transformation-on-decisionmaking-in-higher-education-paradigms-1102111.html
E. J. Pozo-Burgos, M. R. Burbano-Pulles, J. I. Vidal-Chica, and G. E. Revelo-Salgado, “Sociocultural and demographic factors that influence academic performance: The pre-university case of the Universidad Politécnica Estatal del Carchi,” J. Technol. Sci. Educ., vol. 12, no. 1, pp. 147-156, 2022, [Online]. Available: https://www.jotse.org/index.php/jotse/article/view/1359/590
A. O. Adeleye, E. Akinyemi Adenuga, O. J. Idowu, and K. A. Soyombo, “Socio-Demographic Status as a Predictor of Academic Performance among Human Kinetics and Health Education Students,” J. Soc. Behav. Community Heal., vol. 6, no. 2, pp. 901-908, 2022, doi: 10.18502/jsbch.v6i2.11140.
G. Carrión-Barco et al., “Challenging Stereotypes: Exploring the Influence of Sociodemographic Factors and Study Habits on College Students’ Academic Achievement,” J. Educ. Soc. Res., vol. 14, no. 4, pp. 160-169, 2024, doi: 10.36941/jesr-2024-0093.
M. A. Aljaffer et al., “The impact of study habits and personal factors on the academic achievement performances of medical students,” BMC Med. Educ., vol. 24, no. 1, 2024, doi: 10.1186/s12909-024-05889-y.
M. Ladrón de Guevara Rodríguez, L. A. Lopez-Agudo, C. Prieto-Latorre, and O. D. Marcenaro-Gutierrez, Internet use and academic performance: An interval approach, vol. 27, no. 8. Springer US, 2022. doi: 10.1007/s10639-022-11095-4.
R. Resi and D. Hermon, “Pemanfaatan Internet Sebagai Sumber Belajar Siswa Pada Pelajaran Geografi di SMAN 1 Gunung Tuleh Pasaman Barat,” J. Pendidik. Tambusai, vol. 8, no. 1, pp. 2348-2357, 2024, doi: 10.31004/jptam.v8i1.12755.
Fatmawati, M. Hamid, and M. Yusuf Mappeasse, “Pengaruh Penggunaan Internet Sebagai Sumber Belajar dan Kemandirian Belajar Siswa SMKN 3 Makassar,” J. MEKOM (Media Komun. Pendidik. Kejuruan), pp. 62-68, 2025, doi: 10.26858/mkpk.v11i2.6393.
S. Sulkifli, K. Kaharuddin, and F. Firdaus, “Pemanfaatan Internet Sebagai Media Pembelajaran Tambahan Siswa SMA Yaspib Bontolempangan,” Equilib. J. Pendidik., vol. 7, no. 2, pp. 242-248, 2019, doi: 10.26618/equilibrium.v7i2.2682.
Melati Sinaga et al., “Pengaruh Jam Belajar Dan Akses Internet Terhadap Indeks Prestasi Mahasiswa Kelas C Ekonomi Pembangunan Tahun 2021,” Nian Tana Sikk. J. ilmiah Mahasiswa, vol. 2, no. 1, pp. 107-116, 2023, doi: 10.59603/niantanasikka.v2i1.259.
A. Winantu and C. Khatimah, “Perbandingan Metode Klasifikasi Naive Bayes Dan K-Nearest Neighbor Dalam Memprediksi Prestasi Siswa,” INTEK J. Inform. dan Teknol. Inf., vol. 6, no. 1, pp. 58-64, 2023, doi: 10.37729/intek.v6i1.3006.
N. A. B. M. Zahruddin, N. D. Kamarudin, R. M. Jusoh, N. A. A. Fataf, and R. Hidayat, “Case Study: Using Data Mining to Predict Student Performance Based on Demographic Attributes,” Int. J. Informatics Vis., vol. 7, no. 4, pp. 2460-2468, 2023, doi: 10.30630/joiv.7.4.2454.
M. S. Hammoodi and A. Al-Azawei, “Using Socio-Demographic Information in Predicting Students’ Degree Completion based on a Dynamic Model,” Int. J. Intell. Eng. Syst., vol. 15, no. 2, pp. 107-115, 2022, doi: 10.22266/ijies2022.0430.11.
N. Renaningtias, G. Vinalti, T. E. Putri, E. P. Purwandari, and Y. S. Ritonga, “Studi Komparasi Algoritma Decision Tree C4.5 dan K-Nearest Neighbor pada Klasifikasi Masa Studi dan Tingkat Stres Mahasiswa,” Jutisi J. Ilm. Tek. Inform. dan Sist. Inf., vol. 13, no. 3, pp. 1776-1785, 2024, doi: 10.35889/jutisi.v13i3.2272.
C. Verma, Z. Illés, and D. Kumar, “(SDGFI) Student’s Demographic and Geographic Feature Identification Using Machine Learning Techniques for Real-Time Automated Web Applications,” Mathematics, vol. 10, no. 17, 2022, doi: 10.3390/math10173093.
I. Pengetahuan et al., “Machine Translated by Google Analisis komparatif pengklasifikasi pohon keputusan dan hutan acak untuk klasifikasi data terstruktur dalam pembelajaran mesin Machine Translated by Google,” vol. 5, no. 2, pp. 13-24, 2025.
U. Nijunnihayah, S. S. Hilabi, F. Nurapriani, and E. Novalia, “Implementasi Algoritma K-Nearest Neighbor untuk Prediksi Penjualan Alat Kesehatan pada Media Alkes: Implementation of the K-Nearest Neighbor Algorithm to Predict Sales of Medical Devices in Medical Devices,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 2, pp. 695-701, 2024.
S. Wibisono, P. Studi, T. Informatika, U. Stikubank, B. Cancer, and R. Forest, “Analisis Komparatif Metode Ensemble Learning pada Prediksi Kanker Payudara,” vol. 10, pp. 111-117, 2025.
A. Rahman, “Klasifikasi Performa Akademik Siswa Menggunakan Metode Decision Tree dan Naive Bayes,” J. SAINTEKOM, vol. 13, no. 1, pp. 22-31, 2023, doi: 10.33020/saintekom.v13i1.349.
R. A. Azizah, F. Bachtiar, and S. Adinugroho, “Klasifikasi Kinerja Akademik Siswa Menggunakan Neighbor Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain,” J. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 3, pp. 605-614, 2022, doi: 10.25126/jtiik.2022935751.
M. S. U. SP and H. W. Nugroho, “Kajian Algoritma C4.5 dan K-NN Untuk Memprediksi Penduduk Miskin,” Semin. Nas. Has. Penelit. dan Pengabdi. Masy. 2023, pp. 231-241, 2023.
A. Muhaimin, M. Amin Hariyadi, and M. I. Imamudin, “Klasifikasi Prestasi Akademik Siswa Berdasarkan Nilai Rapor dan Kedisiplinan dengan Metode K-Nearest Neighbor,” J. Ilmu Komput. dan Sist. Inf., vol. 7, no. 1, pp. 193-202, 2024, doi: 10.55338/jikomsi.v7i1.2865.








