Pengelompokkan Film Trending di Youtube Menggunakan TF-IDF dan K-Means Clastering
DOI:
https://doi.org/10.53513/jursi.v4i1.10614Keywords:
Clustering, Data Mining, Film Trending, K-means, TF IDFAbstract
YouTube telah menjadi platform utama untuk konsumsi konten video, dengan tren video yang terus berkembang sesuai perubahan minat audiens. Penelitian ini bertujuan untuk mengelompokkan film trending di YouTube berdasarkan judul dan popularitasnya menggunakan pendekatan TF-IDF dan K-Means Clustering. TF-IDF digunakan untuk mengekstraksi fitur dari judul video, mengidentifikasi kata-kata kunci penting yang mencirikan tema setiap film. Algoritma K-Means kemudian digunakan untuk mengelompokkan video ke dalam beberapa cluster berdasarkan kemiripan fitur TF-IDF dan jumlah views. Hasil penelitian menunjukkan bahwa video dapat dikelompokkan ke dalam tiga cluster dengan karakteristik unik. Cluster pertama berisi video dengan tema komedi, aktor populer, dan jumlah views tinggi. Cluster kedua mencakup video dari berbagai genre dengan jumlah views yang bervariasi. Cluster ketiga terdiri dari video yang lebih spesifik dengan popularitas tinggi. Evaluasi menggunakan Silhouette Score menunjukkan bahwa kualitas clustering masih dapat ditingkatkan. Penelitian ini memberikan wawasan bagi kreator konten dan pemasar digital untuk menyusun strategi konten yang lebih menarik dan relevan, serta memberikan kontribusi akademis dalam analisis data berbasis teks.References
D. Röchert, G. Neubaum, B. Ross, F. Brachten, and S. Stieglitz, “Opinion-based homogeneity on youtube: Combining sentiment and social network analysis,” Comput. Commun. Res., vol. 2, no. 1, pp. 81–108, 2020, doi: 10.5117/CCR2020.1.004.ROCH.
E. D. Putra, M. H. Rifqo, D. Deslianti, and K. Krismiyani, “Analysis of The Theme Clustering Algorithm Using K-Means Method,” J. Komputer, Inf. dan Teknol., vol. 2, no. 2, pp. 431–442, 2022, doi: 10.53697/jkomitek.v2i2.884.
S. Kasus, S. Ransomware, and D. Nasional, “Topic Modelling Berbasis Embedding pada Komentar YouTube,” pp. 873–884, 2024.
M. Riduwan, C. Fatichah, and A. Yuniarti, “Klasterisasi Dokumen Menggunakan Weighted K-Means Berdasarkan Relevansi Topik,” JUTI J. Ilm. Teknol. Inf., vol. 17, no. 2, p. 146, 2019, doi: 10.12962/j24068535.v17i2.a892.
E. Susanto, V. C. Mawardi, and M. D. Lauro, “Aplikasi Clustering Berita Dengan Metode K Means Dan Peringkas Berita Dengan Metode Maximum Marginal Relevance,” J. Ilmu Komput. dan Sist. Inf., vol. 9, no. 1, p. 62, 2021, doi: 10.24912/jiksi.v9i1.11560.
S. Krisdianto Sitanggang, F. Rakhmat Umbara, and H. Ashaury, “Klasifikasi Video Pada Media Sosial Youtube Dengan Menggunakan Metode K-Means Dan Support Vector Machine,” J. Locus Penelit. dan Pengabdi., vol. 2, no. 10, pp. 1027–1032, 2023, doi: 10.58344/locus.v2i10.1732.
M. Rafi Haidar Arsyad, “Klusterisasi Data Review Pengguna Aplikasi Marketplace Blibli.Com dengan Algoritma K-Means dan K-Medoids,” vol. 09, pp. 2657–1501, 2024.
T. I. Saputra and R. Arianty, “Implementasi Algoritma K-Means Clustering Pada Analisis Sentimen Keluhan Pengguna Indosat,” J. Ilm. Inform. Komput., vol. 24, no. 3, pp. 191–198, 2019, doi: 10.35760/ik.2019.v24i3.2361.
M. Darwis, G. T. Pranoto, Y. E. Wicaksana, and Y. Yaddarabullah, “Implementation of TF-IDF Algorithm and K-mean Clustering Method to Predict Words or Topics on Twitter,” JISA(Jurnal Inform. dan Sains), vol. 3, no. 2, pp. 49–55, 2020, doi: 10.31326/jisa.v3i2.831.
I. Widaningrum, D. Mustikasari, R. Arifin, S. L. Tsaqila, and D. Fatmawati, “Algoritma Term Frequency-Inverse Document Frequency (TF-IDF) dan K-Means Clustering Untuk Menentukan Kategori Dokumen,” Pros. Semin. Nas. Sist. Inf. dan Teknol., pp. 145–149, 2022.
M. A. Haq, W. Purnomo, and N. Y. Setiawan, “Analisis Clustering Topik Survey menggunakan Algoritme K-Means (Studi Kasus: Kudata),” … Teknol. Inf. dan Ilmu …, vol. 7, no. 7, pp. 3498–3506, 2023, [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/13147%0Ahttps://j-ptiik.ub.ac.id/index.php/j-ptiik/article/download/13147/5928.
I. W. Ardiyasa, “Penerapan K-Means Clustering untuk Klasifikasi Serangan Cyber pada Syslog File,” J. Sist. dan Inform., vol. 14, no. 2, pp. 143–149, 2020, doi: 10.30864/jsi.v14i2.305.
A. Supriatman, “Pembobotan TF-IDF pada Judul Penelitian Dosen Sebagai Dasar Klasifikasi Menggunakan Algoritma K-NN (Studi Kasus: Universitas Siliwangi),” J. Serambi Eng., vol. 6, no. 1, pp. 1573–1579, 2021, doi: 10.32672/jse.v6i1.2645.
L. P. Refialy, H. Maitimu, and M. S. Pesulima, “Perbaikan Kinerja Clustering K-Means pada Data Ekonomi Nelayan dengan Perhitungan Sum of Square Error (SSE) dan Optimasi nilai K cluster,” Techno.Com, vol. 20, no. 2, pp. 321–329, 2021, doi: 10.33633/tc.v20i2.4572.
M. R. Irianto, A. Maududie, and F. N. Arifin, “Implementation of K-Means Clustering Method for Trend Analysis of Thesis Topics (Case Study: Faculty of Computer Science, University of Jember),” Berk. Sainstek, vol. 10, no. 4, p. 210, 2022, doi: 10.19184/bst.v10i4.29524.
S. Data et al., “Clustering Berita Menggunakan Algoritma TF-IDF Dan K-Means Dengan Memanfaatkan Sumber Data Crawling Pada Situs Detik.Com,” vol. 3, no. 1, 2022.
H. Nababan, I. Kelana Jaya, S. Manurung, and H. Artikel, “Analisis Sentimen Produk Penjualan Shopee Pada Pengguna Twitter Menggunakan Metode K-Means,” J. Ilm. Sist. Inf., vol. 3, no. 2, pp. 137–142, 2023, [Online]. Available: http://ojs.fikom-methodist.net/index.php/methosisfo.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Jurnal Sistem Informasi Triguna Dharma (JURSI TGD)
This work is licensed under a Creative Commons Attribution 4.0 International License.