Perancangan Sistem Pendeteksi Berita Hoax Menggunakan Algoritma Levenshtein Distance Berbasis Php

  • Nurhayati Nurhayati STMIK Kaputama
  • Aprilianda Pasaribu STMIK Kaputama
Keywords: Hoax, Levenshtein Distance, TF-IDF, Prepocessing Text, Detection System

Abstract

Di era 4.0 dimana Internet menjadi bagian penting dalam kehidupan saat ini, informasi dapat dengan mudah di akses kapanpun dan dimanapun. Namun tidak seluruh informasi yang disebarkan melalui internet berupa fakta. Data yang dipaparkan oleh Kementrian Komunikasi dan Informatika berdsarkan survey yang dilakukan pada tahaun 2018 menyebut sebanyak 800.000 situs di Indonesia terindikasi penyebar berita non-fakta atau hoax. Akibat yang ditimbulkan berita hoax sangat berbahaya karena menyerang pikiran alam bawah sadar manusia, sehingga sangat dibutuhkan sistem yang dapat mendeteksi berita hoax. Dalam penelitian ini digunakan database yang berisi dokumen berita hoax. Algoritma yang diterapkan adalah algoritma TF-IDF untuk mengukur bobot suatu kata dalam dokumen hoax dan dikombinasikan dengan algoritma Levenshtein Distance (LD) untuk mengukur jarak antar kata dalam dokumen. Penerapan Metode Levenshtein Distance dalam Sistem Deteksi Hoaxmemiliki beberapa tahap yang dimulai dengan tahap pra-pemrosesan kata (prepocessing text) dilanjutkan dengan tahap perhitungan TF-IDF dankemudian tahap perhitungan jarak minimum antar kata menggunakan algoritmaLevenshtein Distance. Hasil batas 0,1 pada 40 dokumen yang sudah terklasifikasi sebagai data uji memiliki nilai Precision, Recall dan Accuracy yang tinggi, yaitu Precision1; Recall0,71;dan Accuracy80%.

References

Vuković, M., Pripužić, K., & Belani, H. (2009). An intelligent automatic hoax detection system. Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 5711 LNAI(PART 1), 318–325. https://doi.org/10.1007/978-3-642-04595- 0_39

[2] Silverman, Craig. ‚Lies, Damn Lies and Viral Content.‛ Columbia Journalism Review, 2015, 1–149. https://doi.org/10.7916/D8Q81RHH.

[3] Weddiningrum, Frista Gifti. Deteksi Konten Hoax Berbahasa Indonesia Pada Media Social Menggunakan Metode Levenshtein Distance, Skripsi, Surabaya [ID] : Universitas Negeri Sunan Ampel Surabaya.

[4] Ryansyah Adi dan Sri Andayani. Implementasi Algoritma TF-IDF pada Pengukuran Kesamaan Dokumen, Jurnal Sistem dan Teknologi Informasi Komunikasi 1(1) : 2, diakses tanggal 18 Juli 2019.

[5] Rahadi Dedi, Rianto. 2017. Perilaku Pengguna Dan Informasi Hoax Di Media Sosial, Jurnal Manajemen dan Kewirausahaan 5(1) : 61:62,jurnal.unmer.ac.id/index.php/jmdk/article/download/1342/933,diakses tangggal 24 Mei 2019.

[6] Nangili, Supandi, dkk. 2014. Pengujian Algoritma Levenshtein Distance dan Algoritma Term Frequency Inverse Document Frequency (TF-IDF) untuk penilaian jawaban essay, Karya Ilmiah, Gorontalo [ID] : Universitas Gorontalo.

[7] Omar, Braddley Muhammad,dkk. Pengoreksian Ejaan Kata Berbahasa Indonesia Menggunakan Algoritma Levenshtein Distance, Prosiding Annual Research Seminar 2017 3(1): 169 :170, diakses tanggal 15 Agustus 2019..

Published
2020-08-22
Section
Articles