Optimalisasi Algoritma K-Means untuk Analisis pengelompokan Data Jurusan Siswa Baru Berbasis Numerical Measure
DOI:
https://doi.org/10.53513/jsk.v8i1.10599Keywords:
Algoritma K-Means, Clustering, Davies-Bouldin Index (DBI), NumericalMeasures, Knowledge Discovery in Database (KDD)Abstract
Dalam analisis pengelompokan data, algoritma K-Means adalah teknik yang umum digunakan. Karena memengaruhi kualitas pengelompokan, sangat penting untuk memilih jumlah cluster K yang tepat. Tujuan penelitian ini adalah untuk mengoptimalkan algoritma K-Means, yang menggunakan Davies-Bouldin Index (DBI) untuk menilai dua jenis jarak numerik, yaitu EuclideanDistance dan ManhattanDistance, untuk pengelompokan data jurusan siswa baru. KDD (Knowledge Discovery in Database) adalah pendekatan yang digunakan, yang mencakup proses Data Selection, Preprocessing, Transformasi, Data Mining, dan Evaluasi. Dataset jurusan siswa baru dengan cluster K antara 2 dan 10 digunakan untuk eksperimen. Hasil penelitian menunjukkan bahwa EuclideanDistance memiliki pemisahan cluster yang lebih baik daripada ManhattanDistance, dengan nilai DBI terendah (0.603) pada K=2. Hasil ini menunjukkan bahwa Euclidean Distance lebih efektif dalam mengoptimalkan pengelompokan data. Metode ini dapat diterapkan dalam analisis data pendidikan dan bidang lain.References
R. Sidik, N. Suarna, and A. Rinaldi Dikananda, “Analisa Data Set Peminatan Siswa Menggunakan Algoritma K-Means Dengan Optimize Parameter Di Sekolah Menengah Kejuruan,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 2, pp. 1197–1203, 2023, doi: 10.36040/jati.v7i2.6335.
R. B. Ardi, F. E. Nastiti, and S. Sumarlinda, “ALGORITMA K-MEANS CLUSTERING UNTUK SEGMENTASI PELANGGAN ( STUDI KASUS : FASHION VIRAL SOLO ),” INFOTECH J., vol. 9, no. 1, pp. 124–131, 2023, doi: https://doi.org/10.31949/infotech.v9i1.5214.
T. Maulana, R. Astuti, and Y. Arie Wijaya, “Implementasi Algoritma K-Means Dengan Optimize Parameter Grid Pada Data Kecelakaan Lalu Lintas Di Kota Cirebon,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 1, pp. 310–317, 2024, doi: 10.36040/jati.v8i1.8430.
J. Hutagalung, Y. H. Syahputra, and Z. P. Tanjung, “Pemetaan Siswa Kelas Unggulan Menggunakan Algoritma K-Means Clustering,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol. 9, no. 1, pp. 606–620, 2022, doi: 10.35957/jatisi.v9i1.1516.
E. Nurjannah, M. Nasution, and R. Muti, “Data Mining Clustering Analysis of Child Growth and Development Using the K-Means Method,” vol. 8, no. 3, pp. 1909–1919, 2024, doi: https://doi.org/10.33395/sinkron.v8i3.13817 e-ISSN.
A. Asmana, Y. Arie Wijaya, and M. Martanto, “Clustering Data Calon Siswa Baru Menggunakan Metode K-Means Di Sekolah Menengah Kejuruan Wahidin Kota Cirebon,” JATI (Jurnal Mhs. Tek. Inform., vol. 6, no. 2, pp. 552–559, 2022, doi: 10.36040/jati.v6i2.5236.
M. Zubair, M. A. Iqbal, A. Shil, M. J. M. Chowdhury, M. A. Moni, and I. H. Sarker, “An Improved K-means Clustering Algorithm Towards an Efficient Data-Driven Modeling,” Ann. Data Sci., vol. 11, no. 5, pp. 1525–1544, 2022, doi: 10.1007/s40745-022-00428-2.
S. S. Patel, N. Kumar, J. Aswathy, S. K. Vaddadi, S. A. Akbar, and P. C. Panchariya, “K-Means Algorithm: An Unsupervised Clustering Approach Using Various Similarity/Dissimilarity Measures BT - Intelligent Sustainable Systems,” J. S. Raj, R. Palanisamy, I. Perikos, and Y. Shi, Eds., Singapore: Springer Singapore, 2022, pp. 805–813.
S. N. Safitri, H. Setiadi, and E. Suryani, “Educational Data Mining Using Cluster Analysis Methods and Decision Trees based on Log Mining,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 6, no. 3 SE-Information Systems Engineering Articles, Jul. 2022, doi: 10.29207/resti.v6i3.3935.
A. Chaerudin, D. T. Murdiansyah, and M. Imrona, “Implementation of K-Means ++ Algorithm for Store Customers Segmentation Using Neo4J,” vol. 6, no. April, pp. 53–60, 2021, doi: 10.34818/indojc.2021.6.1.547.
D. Jollyta, D. Priyanto, A. Hajjah, and Y. N. Marlim, “Comparison of Distance Measurements Based on k-Numbers and Its Influence to Clustering,” vol. 23, no. 1, pp. 93–102, 2023, doi: 10.30812/matrik.v23i1.3078.
F. Nie, Z. Li, R. Wang, and X. Li, “An Effective and Efficient Algorithm for K-Means Clustering With New Formulation,” IEEE Trans. Knowl. Data Eng., vol. 35, no. 4, pp. 3433–3443, 2023, doi: 10.1109/TKDE.2022.3155450.
S. Zhou, F. Liu, and W. Song, “Estimating the Optimal Number of Clusters Via Internal Validity Index,” Neural Process. Lett., vol. 53, no. 2, pp. 1013–1034, 2021, doi: 10.1007/s11063-021-10427-8.
Downloads
Published
Issue
Section
License
This work is licensed under a Creative Commons Attribution 4.0 International License.
Nama dan alamat email yang masuk ke situs jurnal ini akan digunakan secara eksklusif untuk tujuan jurnal ini dan tidak akan digunakan untuk tujuan dan pihak lain.