Perbandingan Metode Ensemble Untuk Meningkatkan Akurasi Algoritm Machine Learning Dalam Memprediksi Penyakit Breast Cancer (Kanker Payudara)
DOI:
https://doi.org/10.53513/jis.v23i1.9563Keywords:
Computer ScienceAbstract
Machine Learning merupakan suatu teknologi pembelajaran mesin yang dapat digunakan untuk memudahkan pekerjaan berbagai bidang, salah satunya yaitu pada bidang kesehatan.  Machine Learning dalam bidang kesehatan dapat digunakan dalam memprediksi atau mendiagnosa suatu penyakit yang dihasilkan berdasarkan dataset. Kanker payudara (breast cancer) merupakan salah satu penyakit yang mematikan khususnya banyak diderita oleh wanita, oleh karena itu perlu adanya diagnosa dini terkait penyakit kanker payudara agar penanganan dapat dilakukan dengan tepat serta mencegah adanya penyebaran kanker pada tubuh. Penelitian sebelumnya telah membahas tentang diagnosa penyakit kanker payudara namun tingkat akurasi masih rendah sehingga perlu adanya teknik peningkatan akurasi untuk dapat memberikan informasi yang akurat. Tujuan dalam penelitian ini yaitu membandingkan metode Ensemble menggunakan algoritma Machine Learning yaitu Decision Tree, Naïve Bayes, dan K-Nearest Neighbor (KNN), untuk meningkatkan akurasi dalam memprediksi penyakit Kanker Payudara. Metode ensemble yang digunakan dalam penelitian ini yaitu Adaboost dan Bagging. Hasil penelitian menunjukan bahwa terdapat peningkatan pada algoritma klasifikasi menggunakan metode ensemble. Metode paling unggul yaitu Algoritma Decision Tree dan Metode ensamble yang menghasilkan akurasi sebesar yaitu 82.76%. Pada nilai AUC tertinggi diperoleh dari algoritma KNN yang dikombinasikan dengan metode Bagging yaitu sebesar 0.950 dengan kategori sangat baik.References
N. R. Muntiari and K. H. Hanif, “Klasifikasi Penyakit Kanker Payudara Menggunakan Perbandingan Algoritma Machine Learning,†J. Ilmu Komput. dan Teknol., vol. 3, no. 1, pp. 1–6, 2022, doi: 10.35960/ikomti.v3i1.766.
Kemenkes RI, “Hasil Riset Kesehatan Dasar Tahun 2018,†Kementrian Kesehat. RI, vol. 53, no. 9, pp. 1689–1699, 2018.
N. Al-Azzam and I. Shatnawi, “Comparing supervised and semi-supervised Machine Learning Models on Diagnosing Breast Cancer,†Ann. Med. Surg., vol. 62, no. November 2020, pp. 53–64, 2021, doi: 10.1016/j.amsu.2020.12.043.
V. P. C. Magboo and M. S. Magboo, “Machine learning classifiers on breast cancer recurrences,†Procedia Comput. Sci., vol. 192, pp. 2742–2752, 2021, doi: 10.1016/j.procs.2021.09.044.
Y. Feng et al., “Predicting breast cancer-specific survival in metaplastic breast cancer patients using machine learning algorithms,†J. Pathol. Inform., vol. 14, no. August, p. 100329, 2023, doi: 10.1016/j.jpi.2023.100329.
V. Nemade, V. Fegade, V. Nemade, and V. Fegade, “Machine Learning Techniques for Breast Cancer Prediction,†Procedia Comput. Sci., vol. 218, no. 2022, pp. 1314–1320, 2023, doi: 10.1016/j.procs.2023.01.110.
N. Meilani and O. Nurdiawan, “Data Mining untuk Klasifikasi Penderita Kanker Payudara Menggunakan Algoritma K-Nearest Neighbor,†vol. 2, no. 1, pp. 177–187, 2023.
A. M. A. Rahim, I. Y. R. Pratiwi, and M. A. Fikri, “Klasifikasi Penyakit Jantung Menggunakan Metode Synthetic Minority Over- Sampling Technique Dan Random Forest Clasifier,†vol. 12, no. 1, pp. 2995–3011, 2023.
D. Cahyanti, A. Rahmayani, and S. Ainy, “Analisis performa metode Knn pada Dataset pasien pengidap Kanker Payudara,†vol. 1, no. 2, pp. 39–43, 2020.
R. Y. Nugroho Agung, “Analisis Optimasi Algoritma Klasifikasi Naive Bayes menggunakan Genetic Algorithm dan Bagging,†vol. 1, no. 10, pp. 504–510, 2021.
R. Nurhidayat and K. E. Dewi, “PENERAPAN ALGORITMA K-NEAREST NEIGHBOR DAN FITUR EKSTRAKSI N-GRAM DALAM ANALISIS SENTIMEN BERBASIS ASPEK,†vol. 12, no. 1, pp. 91–100, 2023.
A. Miftahusalam, H. Pratiwi, I. Slamet, P. S. Statistika, and U. S. Maret, “Perbandingan Metode Random Forest dan Naive Bayes pada Analisis Sentimen Review Aplikasi BCA Mobile,†pp. 1–8, 2023.
L. Qadrini, A. Seppewali, and A. Aina, “DECISION TREE DAN ADABOOST PADA KLASIFIKASI PENERIMA PROGRAM BANTUAN SOSIAL,†vol. 2, no. 7, 2021.
M. Ula, A. F. Ulva, M. Mauliza, M. A. Ali, and Y. R. Said, “Application of Machine Learning in Determining the Classification of Children’S Nutrition With Decision Tree,†J. Tek. Inform., vol. 3, no. 5, pp. 1457–1465, 2022, doi: 10.20884/1.jutif.2022.3.5.599.
M. Bansal, A. Goyal, and A. Choudhary, “A comparative analysis of K-Nearest Neighbor, Genetic, Support Vector Machine, Decision Tree, and Long Short Term Memory algorithms in machine learning,†Decis. Anal. J., vol. 3, no. November 2021, p. 100071, 2022, doi: 10.1016/j.dajour.2022.100071.
D. Septhya et al., “MALCOM: Indonesian Journal of Machine Learning and Computer Science Implementation of Decision Tree Algorithm and Support Vector Machine for Lung Cancer Classification Implementasi Algoritma Decision Tree dan Support Vector Machine untuk Klasifikasi Penya,†MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, pp. 15–19, 2023.
S. Bhatia and J. Malhotra, “Naïve bayes classifier for predicting the novel coronavirus,†Proc. 3rd Int. Conf. Intell. Commun. Technol. Virtual Mob. Networks, ICICV 2021, no. Icicv, pp. 880–883, 2021, doi: 10.1109/ICICV50876.2021.9388410.
N. Salmi and Z. Rustam, “Naïve Bayes Classifier Models for Predicting the Colon Cancer,†IOP Conf. Ser. Mater. Sci. Eng., vol. 546, no. 5, 2019, doi: 10.1088/1757-899X/546/5/052068.
F. J. Yang, “An implementation of naive bayes classifier,†Proc. - 2018 Int. Conf. Comput. Sci. Comput. Intell. CSCI 2018, pp. 301–306, 2018, doi: 10.1109/CSCI46756.2018.00065.
B. Srinivas and G. Sasibhushana Rao, “A hybrid CNN-KNN model for MRI brain tumor classification,†Int. J. Recent Technol. Eng., vol. 8, no. 2, pp. 5230–5235, 2019, doi: 10.35940/ijrte.B1051.078219.
Yulianto Anggi Priliani and S. Darwis, “Penerapan Metode K-Nearest Neighbors (kNN) pada Bearing,†J. Ris. Stat., vol. 1, no. 1, pp. 10–18, 2021, doi: 10.29313/jrs.v1i1.16.
W. Xing and Y. Bei, “Medical Health Big Data Classification Based on KNN Classification Algorithm,†IEEE Access, vol. 8, pp. 28808–28819, 2020, doi: 10.1109/ACCESS.2019.2955754.
E. Mardiani et al., “Komparasi Metode Knn , Naive Bayes , Decision Tree , Ensemble , Linear Regression Terhadap Analisis Performa Pelajar Sma,†vol. 3, pp. 13880–13892, 2023.
R. I. Arumnisaa and A. W. Wijayanto, “Perbandingan Metode Ensemble Learning : Random Forest , Support Vector Machine , AdaBoost pada Klasifikasi Indeks Pembangunan Manusia ( IPM ) Comparison of Ensemble Learning Method : Random Forest , Support Vector,†vol. 12, pp. 206–218, 2023.
Y. Religia, A. Nugroho, and W. Hadikristanto, “Analisis Perbandingan Algoritma Optimasi pada Random Forest untuk Klasifikasi Data Bank Marketing,†vol. 1, no. 10, pp. 187–192, 2021.