DETEKSI DINI GEJALA AWAL PENYAKIT DIABETES MENGGUNAKAN ALGORITMA RANDOM FOREST
Abstract
Diabetes merupakan penyakit kronis yang disebabkan karena pancreas tidak dapat memproduksi insulin sesuai dengan kebutuhan tubuh atau kondisi ketika tubuh tidak dapat menggunakan insulin secara efektif. Pada tahun 2021 Indonesia memperoleh urutan ke-5 didunia dengan populasi penderita penyakit diabetes terbanyak dan terdapat lebih dari 1 orang diantara 10 orang dewasa yang menderita diabetes. Semakin meningkatnya penderita diabetes di Indonesia bahkan di dunia yang sebenarnya sudah positif diderita tetapi tidak menimbulkan komplikasi lebih lanjut hingga kematian. Hal ini disebabkan karena belum adanya model klasifikasi deteksi dini gejala awal diabetes. Maka pada penelitian ini perlu dilakukannya pembuatan model klasifikasi deteksi dini gejala awal penyakit diabetes dengan metode penelitian Cross Industry Standard Process for Data Mining (CRISP-DM) yaitu dengan melaksanakan riset jurnal. Penelitian ini menggunakan algoritma Random Forest. Data yang akan digunakan bersifat public yang didapatkan melalui website www.kaggle.com dengan total 520 record dataset yang terdiri dari 17 attribut, terdapat 320 dataset dengan positif diabetes dan 200 dataset dengan negative diabetes. Klasifikasi dilakukan dengan dengan komposisi data training dan data testing 90:10 menggunakan teknik stratified random sampling dengan number of trees 5, maximal depth 5, dan dilakukannya apply pruning. Diperoleh akurasi 90.38%, precision 100%, recall 84.38% dan niai AUC 1.00. Sehingga dapat disimpulkan bahwa model klasifikasi dengan algoritma Random Forest dapat bekerja sangat baik terhadap data deteksi dini gejala awal penyakit diabetes.
Downloads
References
N. Sneha and T. Gangil, “Analysis of diabetes mellitus for early prediction using optimal features selection,” J. Big Data, vol. 6, no. 1, Dec. 2019, doi: 10.1186/s40537-019-0175-6.
H. Sun et al., “IDF Diabetes Atlas: Global, regional and country-level diabetes prevalence estimates for 2021 and projections for 2045,” Diabetes Res. Clin. Pract., vol. 183, p. 109119, 2022, doi: 10.1016/j.diabres.2021.109119.
K. Ogurtsova et al., “IDF diabetes Atlas: Global estimates of undiagnosed diabetes in adults for 2021,” Diabetes Res. Clin. Pract., vol. 183, 2022, doi: 10.1016/j.diabres.2021.109118.
R. Andanika Siallagan, “PREDIKSI PENYAKIT DIABETES MELLITUS MENGGUNAKAN ALGORITMA C4.5,” J. RESPONSIF, vol. 3, no. 1, pp. 44–52, 2021, [Online]. Available: http://ejurnal.ars.ac.id/index.php/jti
E. Karyadiputra and A. Setiawan, “Penerapan data mining untuk prediksi awal kemungkinan terindikasi diabetes,” pp. 221–232, 2022.
N. M. Putry, “Komparasi Algoritma Knn Dan Naïve Bayes Untuk Klasifikasi Diagnosis Penyakit Diabetes Mellitus,” EVOLUSI J. Sains dan Manaj., vol. 10, no. 1, 2022, doi: 10.31294/evolusi.v10i1.12514.
S. Huber, H. Wiemer, D. Schneider, and S. Ihlenfeldt, “DMME: Data mining methodology for engineering applications - A holistic extension to the CRISP-DM model,” Procedia CIRP, vol. 79, pp. 403–408, 2019, doi: 10.1016/j.procir.2019.02.106.
L. Husna, S. Syahputra, and B. S. Ginting, “Penerapan data mining menggunakan metode K-Means cluster untuk pengelopokkan data perizinan Madrasah Diniyah Taklimiyah Awwaliyah (MDTA) studi kasus Kementerian Agama Stabat,” J. Inform. Kaputama, vol. 6, no. 3, 2022.
C. A. Ramezan, T. A. Warner, and A. E. Maxwell, “Evaluation of sampling and cross-validation tuning strategies for regional-scale machine learning classification,” Remote Sens., vol. 11, no. 2, 2019, doi: 10.3390/rs11020185.
J. S. Komputer, K. Buatan, and A. Ridwan, “Penerapan Algoritma Naïve Bayes Untuk Klasifikasi Penyakit Diabetes Mellitus,” 2020.
Copyright (c) 2023 Ajeng Citra Mawarni, Rusdah Rusdah, Law Li Hin, Dian Anubhakti
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.