Implementasi Model Vision Transformer dalam Klasifikasi Citra Batik Indonesia

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Fakultasi Ilmu Komputer

Abstract

Batik merupakan warisan budaya Indonesia yang memiliki nilai seni tinggi dengan beragam motif dari berbagai daerah. Keberagaman ini sering menyulitkan masyarakat dalam mengenali motif batik tanpa pengetahuan sebelumnya. Penelitian terdahulu menunjukkan bahwa Convolutional Neural Network (CNN) mampu mengklasifikasikan citra batik dengan akurasi tinggi, namun perkembangan terbaru seperti Vision Transformer (ViT) berpotensi memberikan performa yang lebih baik pada tugas klasifikasi citra. Penelitian ini bertujuan menganalisis implementasi dan evaluasi performa model Vision Transformer untuk klasifikasi 15 jenis motif batik Indonesia menggunakan transfer learning. Dataset yang digunakan adalah “Indonesian Batik Motifs (Corak App)” dari Kaggle dengan total 1.350 gambar. Metode penelitian meliputi preprocessing berupa pembagian data, center cropping ukuran 224×224, serta augmentasi citra. Dua model ViT yang diuji adalah microsoft/beit-base-patch16-224-pt22k-ft22k dan google/vit-base-patch16-224. Evaluasi model dilakukan menggunakan metrik accuracy, precision, recall, dan F1-score, dengan pengujian berbagai rasio pembagian data, ukuran batch, serta strategi fine-tuning dua tahap. Hasil penelitian menunjukkan bahwa model microsoft/beit-base-patch16-224-pt22k-ft22k memberikan performa terbaik dengan akurasi validasi 95% dan akurasi pengujian 91,85%, lebih unggul dibandingkan google/vit-base-patch16-224 yang memperoleh akurasi maksimum 84%. Konfigurasi terbaik diperoleh menggunakan batch size 8 dan rasio data 90%:5%:5% untuk training, validasi, dan testing.

Description

Finalisasi_Maya_10 Juni 2026

Citation

Endorsement

Review

Supplemented By

Referenced By