Optimalisasi Algoritma K-Means untuk Analisis pengelompokan Data Jurusan Siswa Baru Berbasis Numerical Measure

Authors

  • Muhammad Mahda STMIK IKMI Cirebon
  • Rudi Kurniawan STMIK IKMI Cirebon
  • Tati Suprapti STMIK IKMI Cirebon

DOI:

https://doi.org/10.53513/jsk.v8i1.10599

Keywords:

Algoritma K-Means, Clustering, Davies-Bouldin Index (DBI), NumericalMeasures, Knowledge Discovery in Database (KDD)

Abstract

Dalam analisis pengelompokan data, algoritma K-Means adalah teknik yang umum digunakan. Karena memengaruhi kualitas pengelompokan, sangat penting untuk memilih jumlah cluster K yang tepat. Tujuan penelitian ini adalah untuk mengoptimalkan algoritma K-Means, yang menggunakan Davies-Bouldin Index (DBI) untuk menilai dua jenis jarak numerik, yaitu EuclideanDistance dan ManhattanDistance, untuk pengelompokan data jurusan siswa baru. KDD (Knowledge Discovery in Database) adalah pendekatan yang digunakan, yang mencakup proses Data Selection, Preprocessing, Transformasi, Data Mining, dan Evaluasi. Dataset jurusan siswa baru dengan cluster K antara 2 dan 10 digunakan untuk eksperimen. Hasil penelitian menunjukkan bahwa EuclideanDistance memiliki pemisahan cluster yang lebih baik daripada ManhattanDistance, dengan nilai DBI terendah (0.603) pada K=2. Hasil ini menunjukkan bahwa Euclidean Distance lebih efektif dalam mengoptimalkan pengelompokan data. Metode ini dapat diterapkan dalam analisis data pendidikan dan bidang lain.

Author Biographies

Muhammad Mahda, STMIK IKMI Cirebon

Teknik Informatika

Rudi Kurniawan, STMIK IKMI Cirebon

Teknik Informatika

Tati Suprapti, STMIK IKMI Cirebon

Teknik Informatika

References

R. Sidik, N. Suarna, and A. Rinaldi Dikananda, “Analisa Data Set Peminatan Siswa Menggunakan Algoritma K-Means Dengan Optimize Parameter Di Sekolah Menengah Kejuruan,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 2, pp. 1197–1203, 2023, doi: 10.36040/jati.v7i2.6335.

R. B. Ardi, F. E. Nastiti, and S. Sumarlinda, “ALGORITMA K-MEANS CLUSTERING UNTUK SEGMENTASI PELANGGAN ( STUDI KASUS : FASHION VIRAL SOLO ),” INFOTECH J., vol. 9, no. 1, pp. 124–131, 2023, doi: https://doi.org/10.31949/infotech.v9i1.5214.

T. Maulana, R. Astuti, and Y. Arie Wijaya, “Implementasi Algoritma K-Means Dengan Optimize Parameter Grid Pada Data Kecelakaan Lalu Lintas Di Kota Cirebon,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 1, pp. 310–317, 2024, doi: 10.36040/jati.v8i1.8430.

J. Hutagalung, Y. H. Syahputra, and Z. P. Tanjung, “Pemetaan Siswa Kelas Unggulan Menggunakan Algoritma K-Means Clustering,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol. 9, no. 1, pp. 606–620, 2022, doi: 10.35957/jatisi.v9i1.1516.

E. Nurjannah, M. Nasution, and R. Muti, “Data Mining Clustering Analysis of Child Growth and Development Using the K-Means Method,” vol. 8, no. 3, pp. 1909–1919, 2024, doi: https://doi.org/10.33395/sinkron.v8i3.13817 e-ISSN.

A. Asmana, Y. Arie Wijaya, and M. Martanto, “Clustering Data Calon Siswa Baru Menggunakan Metode K-Means Di Sekolah Menengah Kejuruan Wahidin Kota Cirebon,” JATI (Jurnal Mhs. Tek. Inform., vol. 6, no. 2, pp. 552–559, 2022, doi: 10.36040/jati.v6i2.5236.

M. Zubair, M. A. Iqbal, A. Shil, M. J. M. Chowdhury, M. A. Moni, and I. H. Sarker, “An Improved K-means Clustering Algorithm Towards an Efficient Data-Driven Modeling,” Ann. Data Sci., vol. 11, no. 5, pp. 1525–1544, 2022, doi: 10.1007/s40745-022-00428-2.

S. S. Patel, N. Kumar, J. Aswathy, S. K. Vaddadi, S. A. Akbar, and P. C. Panchariya, “K-Means Algorithm: An Unsupervised Clustering Approach Using Various Similarity/Dissimilarity Measures BT - Intelligent Sustainable Systems,” J. S. Raj, R. Palanisamy, I. Perikos, and Y. Shi, Eds., Singapore: Springer Singapore, 2022, pp. 805–813.

S. N. Safitri, H. Setiadi, and E. Suryani, “Educational Data Mining Using Cluster Analysis Methods and Decision Trees based on Log Mining,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 6, no. 3 SE-Information Systems Engineering Articles, Jul. 2022, doi: 10.29207/resti.v6i3.3935.

A. Chaerudin, D. T. Murdiansyah, and M. Imrona, “Implementation of K-Means ++ Algorithm for Store Customers Segmentation Using Neo4J,” vol. 6, no. April, pp. 53–60, 2021, doi: 10.34818/indojc.2021.6.1.547.

D. Jollyta, D. Priyanto, A. Hajjah, and Y. N. Marlim, “Comparison of Distance Measurements Based on k-Numbers and Its Influence to Clustering,” vol. 23, no. 1, pp. 93–102, 2023, doi: 10.30812/matrik.v23i1.3078.

F. Nie, Z. Li, R. Wang, and X. Li, “An Effective and Efficient Algorithm for K-Means Clustering With New Formulation,” IEEE Trans. Knowl. Data Eng., vol. 35, no. 4, pp. 3433–3443, 2023, doi: 10.1109/TKDE.2022.3155450.

S. Zhou, F. Liu, and W. Song, “Estimating the Optimal Number of Clusters Via Internal Validity Index,” Neural Process. Lett., vol. 53, no. 2, pp. 1013–1034, 2021, doi: 10.1007/s11063-021-10427-8.

Downloads

Published

2025-01-25