Sistem Deteksi Self-Plagiarisme Pada Media Online Berbasis Model Word2vec
| dc.contributor.author | Fayza Permatasari | |
| dc.date.accessioned | 2026-02-05T02:34:08Z | |
| dc.date.issued | 2025-07-30 | |
| dc.description | Reupload Repositori File 05 Februari 2026_Kholif Basri | |
| dc.description.abstract | Self-plagiarism adalah menyajikan kembali karya tulisnya sendiri yang telah dipublikasikan tanpa mencantumkan sumber asli. Dalam media online, praktik ini sering kali tidak disadari namun dapat berdampak negatif terhadap kredibilitas dan orisinalitas konten berita. Permasalahan ini mendorong adanya sistem yang mampu mendeteksi self-plagiarisme pada media online. Pendeteksian self-plagiarisme pada konten media online dilakukan dengan teknik Text Mining. Penelitian ini terdiri dari beberapa tahapan utama yang saling berkesinambungan. Tahap pertama adalah pengumpulan data dari artikel berita Detik selama periode Januari hingga Maret 2024 menggunakan metode web scraping. Data yang berhasil dikumpulkan berjumlah 28.742 artikel. Kemudian dilakukan ekstraksi kalimat dan penghapusan entitas untuk meminimalkan bias dalam analisis kesamaan, tahap ini menghasilkan sebanyak 443.974 kalimat. Proses preprocessing teks mencakup pembersihan data (data cleaning), konversi huruf ke format lowercase, serta tokenisasi untuk memecah kalimat menjadi kata-kata terpisah. Setelah itu, dilakukan proses embedding dengan memanfaatkan model Word2Vec untuk merepresentasikan kata-kata dalam bentuk vektor. Nilai cosine similarity antar vektor kalimat kemudian dihitung untuk mengukur tingkat kemiripan semantik. Evaluasi sistem dilakukan menggunakan metode Mean Average Precision (MAP), yang menghasilkan skor evaluasi sebesar 1.00. Penilaian dilakukan dengan membagi pasangan kalimat ke dalam dua kategori: positive samples, yaitu pasangan dengan nilai similarity ≥ 0,95 (sebanyak 2–5 pasangan per kalimat), dan negative samples, yaitu pasangan dengan similarity ≤ 0,5 (sebanyak 15–45 pasangan per kalimat). Penelitian ini diakhiri dengan implementasi sistem berbasis web menggunakan framework Flask untuk mendukung pengguna dalam mendeteksi indikasi self-plagiarisme secara otomatis. | |
| dc.description.sponsorship | Dosen Pembimbing Utama : Achmad Maududie, ST., M.Sc. Dosen Pembimbing Anggota: -- | |
| dc.identifier.other | Kholif Basri | |
| dc.identifier.uri | https://repository.unej.ac.id/handle/123456789/1691 | |
| dc.language.iso | other | |
| dc.publisher | Fakultas Ilmu Komputer | |
| dc.subject | Self-plagiarism | |
| dc.subject | konten media online | |
| dc.subject | teknik Text Mining | |
| dc.title | Sistem Deteksi Self-Plagiarisme Pada Media Online Berbasis Model Word2vec | |
| dc.type | Other |
