Deteksi Ketidakkonsistenan Font Sebagai Indikator Pemalsuan dan Penyuntingan Dokumen Digital Menggunakan Convolutional Neural Network (CNN)

Authors

  • Lumi Krismona Universitas Potensi Utama
  • Annisa Ashari Universitas Potensi Utama
  • Nurhayati Habib Universitas Potensi Utama
  • Adil Setiawan Universitas Potensi Utama
  • Rika Rosnelly Universitas Potensi Utama

DOI:

https://doi.org/10.53513/jsk.v8i2.11741

Keywords:

Citra, CNN, Dokumen Digital, Pemalsuan Dokumen

Abstract

Pemalsuan dan penyuntingan dokumen digital merupakan ancaman serius dalam konteks keamanan informasi dan validitas dokumen resmi. Salah satu contoh aktual adalah kasus pemalsuan dokumen kependudukan untuk Penerimaan Peserta Didik Baru (PPDB) 2024 oleh Ato et al.(Kompas, 2024), telah ditemukan penyalahgunaan data dan perubahan pada dokumen seperti Kartu Keluarga (KK) untuk memanipulasi zonasi pendidikan. Kasus ini menunjukkan bahwa dokumen digital sangat rentan dimanipulasi salah satunya melalui ketidakkonsistenan jenis font pada struktur dokumen digital. Penelitian ini bertujuan untuk mendeteksi secara otomatis terhadap ketidakkonsistenan font dalam dokumen digital menggunakan arsitektur Convolutional Neural Network (CNN). Model dilatih menggunakan 100.000 sampel dari Document Font Recognition Dataset (DTFR), dengan pra-pemrosesan berupa konversi grayscale, normalisasi dan resize citra menjadi 32×32 piksel. CNN dirancang dengan dua lapisan konvolusional, max pooling, dropout dan dense layer. Hasil evaluasi menunjukkan akurasi sebesar 96,85% dengan nilai precision, recall dan F1-score rata-rata sebesar 0,97. Pendekatan ini terbukti lebih akurat dibandingkan metode SVM yang sebelumnya dilaporkan hanya mencapai 94,6%. Penelitian ini menunjukkan bahwa pendekatan CNN efektif untuk mendeteksi ketidakkonsistenan font sebagai indikator awal kemungkinan manipulasi dokumen digital. Meskipun model menunjukkan kinerja tinggi, ruang lingkup penelitian ini masih terbatas pada atribut font bold sebagai indikator utama. Pengembangan selanjutnya dapat mencakup eksplorasi atribut font lain serta validasi pada dokumen dari dunia nyata.

Author Biographies

Annisa Ashari, Universitas Potensi Utama

Ilmu Komputer

Nurhayati Habib, Universitas Potensi Utama

Ilmu Komputer

Adil Setiawan, Universitas Potensi Utama

Ilmu Komputer

Rika Rosnelly, Universitas Potensi Utama

Ilmu Komputer

References

A.-S. Roman, B. Genge, A.-V. Duka, and P. Haller, “Privacy-Preserving Tampering Detection in Automotive Systems,” Electronics, vol. 10, no. 24, p. 3161, 2021, doi: 10.3390/electronics10243161.

C. Johnson, R. Davies, and M. Reddy, “Using digital forensics in higher education to detect academic misconduct,” Int. J. Educ. Integr., vol. 18, no. 1, pp. 1–19, 2022, doi: 10.1007/s40979-022-00104-1.

S. Ato, A. Insan, and A. Diveranta, “Kemendagri Ancam Pidanakan Pemalsu Dokumen Kependudukan untuk Akali PPDB,” Kompas.id, Jun. 25, 2024. [Online]. Available: https://www.kompas.id/baca/investigasi/2024/06/25/kemendagri-pemalsu-dokumen-kependudukan-bisa-dipidana

J. Koponen, K. Haataja, and P. Toivanen, “Recent Advancements in Machine Vision Methods for Product Code Recognition: A Systematic Review,” F1000research, vol. 11, p. 1099, 2022, doi: 10.12688/f1000research.124796.1.

Z. Wei and X. Zhang, “Feature Extraction and Retrieval of Ecommerce Product Images Based on Image Processing,” Trait. Du Signal, vol. 38, no. 1, pp. 181–190, 2021, doi: 10.18280/ts.380119.

Z. Alamin, S. Mutmainah, and M. Hayun, “Optimasi Ekstraksi Fitur Citra Karakter Font Menggunakan Algoritma Support Vector Machines ( SVM ) untuk Klasifikasi Tipografi”, doi: 10.34304/scientific.v2i1.344.

S. Longari, D. H. N. Valcarcel, M. Zago, M. Carminati, and S. Zanero, “CANnolo: An Anomaly Detection System Based on LSTM Autoencoders for Controller Area Network,” Ieee Trans. Netw. Serv. Manag., vol. 18, no. 2, pp. 1913–1924, 2021, doi: 10.1109/tnsm.2020.3038991.

R. Hamzehyan, F. Razzazi, and A. Behrad, “Printer Source Identification by Feature Modeling in the Total Variable Printer Space,” J. Forensic Sci., vol. 66, no. 6, pp. 2261–2273, 2021, doi: 10.1111/1556-4029.14822.

D. D. Indriani.S, E. J. A. Sinaga, G. Oktavia, H. Syahputra, and F. Ramadhani, “Identifikasi Tanda Tangan Dengan Menggunakan Metode Convolution Neural Network (CNN),” J-Intech, vol. 12, no. 1, pp. 138–147, 2024, doi: 10.32664/j-intech.v12i1.1273.

A. Qaroush, A. Awad, M. Modallal, and M. Ziq, “Segmentation-based, omnifont printed Arabic character recognition without font identification,” J. King Saud Univ. - Comput. Inf. Sci., vol. 34, no. 6, pp. 3025–3039, 2022, doi: 10.1016/j.jksuci.2020.10.001.

V. Thambawita, I. Strümke, S. A. Hicks, P. Halvorsen, S. Parasa, and M. A. Riegler, “Impact of image resolution on deep learning performance in endoscopy image classification: An experimental study using a large dataset of endoscopic images,” Diagnostics, vol. 11, no. 12, 2021, doi: 10.3390/diagnostics11122183.

H. Herdianto and D. Nasution, “Implementasi Metode Cnn Untuk Klasifikasi Objek,” METHOMIKA J. Manaj. Inform. dan Komputerisasi Akunt., vol. 7, no. 1, pp. 54–60, 2023, doi: 10.46880/jmika.vol7no1.pp54-60.

P. Meliuwati and E. Kurniati, “Ekstraksi Data Digital Menggunakan Teknik Max Pooling dan Average Pooling,” J. Ris. Mat., pp. 137–144, 2022, doi: 10.29313/jrm.v2i2.1338.

X. Liang et al., “R-Drop: Regularized Dropout for Neural Networks,” Adv. Neural Inf. Process. Syst., vol. 13, no. NeurIPS, pp. 10890–10905, 2021.

R. C. Moore, D. P. W. Ellis, E. Fonseca, S. Hershey, A. Jansen, and M. Plakal, “Dataset Balancing Can Hurt Model Performance,” ICASSP, IEEE Int. Conf. Acoust. Speech Signal Process. - Proc., vol. 2023-June, 2023, doi: 10.1109/ICASSP49357.2023.10095255.

H. Riski and D. W. Utomo, “Algoritma Principal Component Analysis (PCA) dan Metode Bounding Box pada Pengenalan Citra Wajah,” J. Inform. J. Pengemb. IT, vol. 9, no. 1, pp. 72–77, 2024, doi: 10.30591/jpit.v9i1.6165.

J. Wang and S. Lee, “Data augmentation methods applying grayscale images for convolutional neural networks in machine vision,” Appl. Sci., vol. 11, no. 15, 2021, doi: 10.3390/app11156721.

Y. S. Chernyshova, M. A. Aliev, E. S. Gushchanskaia, and A. V. Sheshkus, “Optical font recognition in smartphone-captured images and its applicability for ID forgery detection,” vol. 1, p. 59, 2019, doi: 10.1117/12.2522955.

G. Li, M. Zhang, J. Li, F. Lv, and G. Tong, “Efficient densely connected convolutional neural networks,” Pattern Recognit., vol. 109, 2021, doi: 10.1016/j.patcog.2020.107610.

M. F. Gunardi, “Implementasi Augmentasi Citra pada Suatu Dataset,” J. Inform., vol. 9, no. 1, pp. 1–5, 2023.

Tukino, “Penerapan Algoritma Convolutional Neural Network Untuk Klasifikasi Sentimen Pada Layanan e-Commerce,” J. DESAIN DAN Anal. Teknol., vol. 04, no. 1, pp. 44–53, 2025.

M. Fadli and R. A. Saputra, “Klasifikasi Dan Evaluasi Performa Model Random Forest Untuk Prediksi Stroke,” JT J. Tek., vol. 12, no. 02, pp. 72–80, 2023, [Online]. Available: http://jurnal.umt.ac.id/index.php/jt/index

M. Toyib, T. Decky, and K. Pratama, “Penerapan Algoritma CNN Untuk Mendeteksi Tulisan Tangan Angka Romawi dengan Augmentasi Data,” J. Mat. Ilmu Pengetah. Alam, Kebumian dan Angkasa, vol. 2, no. 3, pp. 108–120, 2024, [Online]. Available: https://doi.org/10.62383/algoritma.v2i3.69

Y. Rimal and N. Sharma, “Ensemble machine learning prediction accuracy: local vs. global precision and recall for multiclass grade performance of engineering students,” Front. Educ., vol. 10, no. April, pp. 1–16, 2025, doi: 10.3389/feduc.2025.1571133.

Downloads

Published

2025-07-30