Modifikasi Arsitektur YOLOv10 untuk Meningkatkan Performa Deteksi Biota Laut pada Citra Bawah Air

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Fakultas Ilmu Komputer

Abstract

Penelitian ini dilakukan untuk mengatasi tantangan dalam deteksi objek bawah air yang sering mengalami kendala akibat kondisi lingkungan seperti pencahayaan rendah, kabut air, dan objek yang tersamarkan atau berukuran kecil. Deteksi secara manual oleh penyelam tidak hanya memerlukan waktu yang lama, tetapi juga tidak efisien dalam skala besar. Oleh karena itu, sistem deteksi otomatis berbasis deep learning menjadi solusi yang menjanjikan. YOLOv10 dipilih sebagai model dasar dalam penelitian ini karena merupakan versi terbaru dari keluarga YOLO yang menawarkan keseimbangan antara akurasi, kecepatan, dan efisiensi komputasi. Penelitian ini bertujuan untuk meningkatkan performa deteksi objek bawah air dengan memodifikasi arsitektur YOLOv10 melalui penambahan empat modul utama: High-order Deformable Attention (HDA), Enhanced Spatial Pyramid Pooling-Fast (ESPPF), Composite Detect (CD), dan Wise Intersection over Union (WIoU). HDA berfungsi untuk memperkuat perhatian spasial terhadap fitur penting pada citra, ESPPF meningkatkan efisiensi dalam mengekstraksi fitur multiskala, CD menyederhanakan proses deteksi dan meningkatkan kecepatan inferensi, sementara WIoU digunakan sebagai fungsi loss untuk mengoptimalkan prediksi bounding box. Dataset yang digunakan adalah DUO (Detection Underwater Object) yang terdiri dari 7.782 citra bawah air, masing-masing diklasifikasikan ke dalam empat jenis biota laut: echinus (bulu babi), holothurian (teripang), scallop (kerang), dan starfish (bintang laut). Proses pelatihan dilakukan menggunakan YOLOv10n sebagai baseline karena ukurannya yang ringan, dengan delapan kombinasi modifikasi model yang diuji untuk menilai kontribusi masing-masing modul terhadap performa akhir. Semua pelatihan dilakukan menggunakan GPU dalam lingkungan Jupyter Notebook, dengan tuning hyperparameter seperti learning rate, batch size, dan optimizer. Evaluasi performa dilakukan berdasarkan metrik mAP\@0.5, mAP\@0.5:0.95, precision, recall, F1-score, dan FPS. Model baseline menghasilkan mAP\@0.5 sebesar85,2%, sedangkan modifikasi dengan WIoU meningkatkan mAP menjadi 86,4%. Kombinasi ESPPF + HDA + CD + WIoU memberikan precision tertinggi sebesar 87,8%, meskipun disertai penurunan recall menjadi 75,3%. Modul CD sendiri menghasilkan FPS tertinggi yaitu 35, menunjukkan efisiensi inferensi yang sangat baik. Visualisasi hasil deteksi menunjukkan bahwa model mampu mengenali objek dengan cukup akurat, walaupun beberapa objek tetap sulit dikenali terutama pada citra dengan kualitas rendah dan kontras buruk. Model juga diuji pada lima citra baru dari internet, dan hasilnya menunjukkan kemampuan generalisasi yang baik di luar data latih. Secara keseluruhan, penelitian ini berhasil membuktikan bahwa modifikasi YOLOv10 dengan empat komponen utama tersebut dapat meningkatkan akurasi dan efisiensi deteksi objek bawah air. Kontribusi dari penelitian ini adalah dalam pengembangan model deteksi yang lebih andal dan ringan untuk diterapkan pada sistem monitoring laut otomatis, baik untuk tujuan konservasi, penelitian ilmiah, maupun teknologi robotika bawah air. Penelitian selanjutnya dapat mengeksplorasi implementasi model ini dalam perangkat edge computing serta pengujian pada kondisi citra ekstrem seperti kekeruhan tinggi dan pencahayaan sangat rendah.

Description

Reupload file repository 4 Februari 2026_Arif/Halima

Citation

Endorsement

Review

Supplemented By

Referenced By