Analisis Performa Face Sketch To Photo Transformation Menggunakan Multi Scale Self Attention Generative Adversarial Network

dc.contributor.authorGustian Aryasatya
dc.date.accessioned2026-03-05T06:02:04Z
dc.date.issued2025-07-02
dc.descriptionReupload Repositori File 05 Maret 2026_Kholif Basri
dc.description.abstractDalam penelitian ini, dijelaskan penerapan Generative Adversarial Network (GAN) yang ditingkatkan dengan multi scale self attention yang diaplikasikan pada arsitektur generator untuk menyelesaikan tugas face sketch to photo transformation. Masalah terpenting yang perlu diatasi adalah rendahnya kualitas visual keluaran face sketch to photo transformation, terutama hilangnya informasi identitas wajah dan risiko overfitting karena kelangkaan data. Dua buah feature extractor yang digunakan dalam percobaan ini adalah AlexNet dan VGG16, keduanya dikombinasikan dengan arsitektur encoder-decoder, baik versi dasar maupun versi yang ditingkatkan dengan multi scale self attention. Dataset yang digunakan adalah CUHK Face Sketch Dataset (CUFS), yang berisi 188 pasang set sketsa dan gambar wajah. Preprocessing dilakukan dengan mengubah ukuran gambar menjadi 256x256 pixel. Generator diimplementasikan dengan multi scale convolution dengan kernel 1x1, 3x3, dan 5x5 untuk menangkap beberapa level fitur lokal. Lebih jauh, perhatian diri dimasukkan untuk fokus pada daerah wajah yang menonjol selama pembuatan gambar. Model dievaluasi menggunakan dua metrik utama: Frechet Inception Distance (FID) dan Structural Similarity Index Measure (SSIM). FID memperkirakan kesamaan distribusi antara prediksi dan kebenaran dasar, sedangkan SSIM memperkirakan kesamaan visual struktural antara keduanya. Hasil eksperimen menunjukkan bahwa kombinasi AlexNet dengan multi scale self attention memberikan kinerja terbaik dengan skor FID minimum 11,4319 dan skor SSIM maksimum 0,4982 pada epoch 50. Konfigurasi di atas memberikan kinerja yang lebih baik daripada kombinasi lain, seperti VGG16, meskipun VGG16 memiliki arsitektur yang lebih dalam. Hal ini menunjukkan bahwa seberapa baik jenis feature extraction dan mekanisme spatial attention yang cocok lebih penting daripada kedalaman jaringan. Model multi scale self attention juga bisa memberikan hasil transformasi wajah yang lebih realistis, simetris, dan lebih tepat daripada yang generator encoder-decoder. Penelitian ini menentukan bahwa penggunaan multi scale self attention pada GAN sangat efektif dalam meningkatkan kualitas visual keluaran sketsa wajah ke konversi foto. AlexNet memang efektif dalam ekstraksi fitur dan dapat mengurangi kemungkinan overfitting karena modelnya lebih ringan. Di masa mendatang, disarankan untuk bereksperimen dengan arsitektur yang lebih baru seperti EfficientNet, dan juga mengeksplorasi penggabungan teknik isser-super-resolution untuk meningkatkan ketajaman hasil transformasi. Bagi para profesional forensik dan pengembang sistem keamanan, sistem ini dapat berfungsi sebagai dasar untuk mengembangkan sistem pengenalan wajah berbasis sketsa yang lebih akurat dan adaptif terhadap batasan data visual.
dc.description.sponsorshipDosen Pembimbing Utama : Tio Dharmawan S.Kom., M.Kom Dosen Pembimbing Anggota: --
dc.identifier.otherKholif Basri
dc.identifier.urihttps://repository.unej.ac.id/handle/123456789/4944
dc.language.isoother
dc.publisherFakultas Ilmu Komputer
dc.subjectGenerative Adversarial Network (GAN)
dc.subjectmulti scale self attention
dc.subjectface sketch to photo transformation
dc.titleAnalisis Performa Face Sketch To Photo Transformation Menggunakan Multi Scale Self Attention Generative Adversarial Network
dc.typeOther

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
GUSTIAN ARYASATYA - 212410102060.pdf
Size:
1.65 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: