Analisa Penggunaan K-Gram pada Karakter, Kata dan Kalimat untuk Mendeteksi Kesamaan Dokumen

Authors

  • Ida Widaningrum Universitas Muhammadiyah Ponorogo
  • Dyah Mustikasari Universitas Muhammadiyah Ponorogo
  • Rizal Arifin Universitas Muhammadiyah Ponorogo
  • Erika Dyah Cahyani Universitas Muhammadiyah Ponorogo

DOI:

https://doi.org/10.22236/teknoka.v5i.333

Keywords:

Python, Karakter K-Gram, Kata K-Gram, Kalimat K-Gram, Algoritma Winnowing, Kemiripan Dokumen

Abstract

Pemanfaatan teknologi digital menjadi sebuah kebutuhan saat ini, salah satu komponennya berupa dokumen. Pendeteksian kesamaan bisa menggunakan berbagi macam cara, diantaranya adalah metode fingerprinting. Fingerprint memiliki prinsip kerja menggunakan teknik hashing dan K-gram. Penelitian ini difokuskan pada model deteksi menggunakan K-gram dengan menggunakan algoritma winnowing dan python sebagai bahasa pemrograman.  Pengujian parsing k-gram menggunakan 5 buah k yaitu k=2 k=3 k=4 k=5 k=6. Hasilnya, parsing karakter mendapatkan presentase lebih besar dari presentase manual karakter. Presentase parsing kata, memiliki presentase yang paling mendekati dari presentase manual. Sedangkan pada kalimat, presentasenya paling rendah dari presentase manual

Author Biographies

Ida Widaningrum, Universitas Muhammadiyah Ponorogo

Teknik Informatika

Fakultas Teknik

Dyah Mustikasari, Universitas Muhammadiyah Ponorogo

Teknik Informatika

Fakultas Teknik

Rizal Arifin, Universitas Muhammadiyah Ponorogo

Teknik Mesin

Fakultas Teknik

Erika Dyah Cahyani, Universitas Muhammadiyah Ponorogo

Teknik Informatika

Fakultas Teknik

References

Kemdikbud. (2016, 22 Januari 2020). KBBI online.

P. Istiana, "Membuat Sitasi dan Daftar Pustaka," in "Materi Pelatihan Kursus Pelatihan Instruktur Literasi Informasi. ," Universitas Padjajaran Bandung, Universitas Sanata Dharma, Yogyakarta 2013, vol. 27 December 2014.

I. Widiastuti, C. Rahmad, and Y. Ariyanto, "Aplikasi Pendeteksi Kemiripanpada Dokumen Menggunakan Algoritma Rabin Karp," Jurnal Informatika Polinema, vol. 1, no. 2, pp. 13-13, 2015.

S. Sunardi, A. Yudhana, and I. A. Mukaromah, "Implementasi Deteksi Plagiarisme Menggunakan Metode N-Gram Dan Jaccard Similarity Terhadap Algoritma Winnowing," 2018.

A. Prastyanti and S. N. Endah, "Sistem deteksi kemiripan kata pada dua dokumen menggunakan algoritma Rabin-Karp," Universitas Diponegoro, 2014.

R. Y. Dillak, F. Laumal, and L. J. Kadja, "Sistem Deteksi Dini Plagiarisme Tugas Akhir Mahasiswa Menggunakan Algoritma Ngrams dan Winnowing," Jurnal Ilmiah Flash, vol. 2, no. 1, pp. 12-18, 2016.

A. Kurniawati and I. Wicaksana, "Perbandingan pendekatan deteksi plagiarism dokumen dalam bahasa inggris," in Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008), 2008: Gunadarma University.

N. Alamsyah, "Perbandingan Algoritma Winnowing Dengan Algoritma Rabin Karp Untuk Mendeteksi Plagiarisme Pada Kemiripan Teks Judul Skripsi," Technologia: Jurnal Ilmiah, vol. 8, no. 3, pp. 124-134, 2017.

B. Zaman, E. Hariyanti, and E. Purwanti, "Sistem Deteksi Bahasa pada Dokumen menggunakan N-Gram," Multinetics, vol. 1, no. 2, pp. 21-26, 2015.

A. Radili and S. Sanjaya, "Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen," Jurnal CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi, vol. 3, no. 2, pp. 69-75, 2018.

S. Niwattanakul, J. Singthongchai, E. Naenudorn, and S. Wanapu, "Using of Jaccard coefficient for keywords similarity," in Proceedings of the international multiconference of engineers and computer scientists, 2013, vol. 1, no. 6, pp. 380-384.

Downloads

Published

2021-01-04