Sistem Deteksi Self-Plagiarisme Pada Media Online Berbasis Model Word2vec

dc.contributor.authorFayza Permatasari
dc.date.accessioned2026-02-05T02:34:08Z
dc.date.issued2025-07-30
dc.descriptionReupload Repositori File 05 Februari 2026_Kholif Basri
dc.description.abstractSelf-plagiarism adalah menyajikan kembali karya tulisnya sendiri yang telah dipublikasikan tanpa mencantumkan sumber asli. Dalam media online, praktik ini sering kali tidak disadari namun dapat berdampak negatif terhadap kredibilitas dan orisinalitas konten berita. Permasalahan ini mendorong adanya sistem yang mampu mendeteksi self-plagiarisme pada media online. Pendeteksian self-plagiarisme pada konten media online dilakukan dengan teknik Text Mining. Penelitian ini terdiri dari beberapa tahapan utama yang saling berkesinambungan. Tahap pertama adalah pengumpulan data dari artikel berita Detik selama periode Januari hingga Maret 2024 menggunakan metode web scraping. Data yang berhasil dikumpulkan berjumlah 28.742 artikel. Kemudian dilakukan ekstraksi kalimat dan penghapusan entitas untuk meminimalkan bias dalam analisis kesamaan, tahap ini menghasilkan sebanyak 443.974 kalimat. Proses preprocessing teks mencakup pembersihan data (data cleaning), konversi huruf ke format lowercase, serta tokenisasi untuk memecah kalimat menjadi kata-kata terpisah. Setelah itu, dilakukan proses embedding dengan memanfaatkan model Word2Vec untuk merepresentasikan kata-kata dalam bentuk vektor. Nilai cosine similarity antar vektor kalimat kemudian dihitung untuk mengukur tingkat kemiripan semantik. Evaluasi sistem dilakukan menggunakan metode Mean Average Precision (MAP), yang menghasilkan skor evaluasi sebesar 1.00. Penilaian dilakukan dengan membagi pasangan kalimat ke dalam dua kategori: positive samples, yaitu pasangan dengan nilai similarity ≥ 0,95 (sebanyak 2–5 pasangan per kalimat), dan negative samples, yaitu pasangan dengan similarity ≤ 0,5 (sebanyak 15–45 pasangan per kalimat). Penelitian ini diakhiri dengan implementasi sistem berbasis web menggunakan framework Flask untuk mendukung pengguna dalam mendeteksi indikasi self-plagiarisme secara otomatis.
dc.description.sponsorshipDosen Pembimbing Utama : Achmad Maududie, ST., M.Sc. Dosen Pembimbing Anggota: --
dc.identifier.otherKholif Basri
dc.identifier.urihttps://repository.unej.ac.id/handle/123456789/1691
dc.language.isoother
dc.publisherFakultas Ilmu Komputer
dc.subjectSelf-plagiarism
dc.subjectkonten media online
dc.subjectteknik Text Mining
dc.titleSistem Deteksi Self-Plagiarisme Pada Media Online Berbasis Model Word2vec
dc.typeOther

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Fayza Permatasari - 212410102084.pdf
Size:
1.22 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: