Modifikasi Arsitektur YOLOv10 untuk Meningkatkan Performa Deteksi Biota Laut pada Citra Bawah Air
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Fakultas Ilmu Komputer
Abstract
Penelitian ini dilakukan untuk mengatasi tantangan dalam deteksi objek bawah air
yang sering mengalami kendala akibat kondisi lingkungan seperti pencahayaan rendah,
kabut air, dan objek yang tersamarkan atau berukuran kecil. Deteksi secara manual oleh
penyelam tidak hanya memerlukan waktu yang lama, tetapi juga tidak efisien dalam skala
besar. Oleh karena itu, sistem deteksi otomatis berbasis deep learning menjadi solusi yang
menjanjikan. YOLOv10 dipilih sebagai model dasar dalam penelitian ini karena
merupakan versi terbaru dari keluarga YOLO yang menawarkan keseimbangan antara
akurasi, kecepatan, dan efisiensi komputasi.
Penelitian ini bertujuan untuk meningkatkan performa deteksi objek bawah air
dengan memodifikasi arsitektur YOLOv10 melalui penambahan empat modul utama:
High-order Deformable Attention (HDA), Enhanced Spatial Pyramid Pooling-Fast
(ESPPF), Composite Detect (CD), dan Wise Intersection over Union (WIoU). HDA
berfungsi untuk memperkuat perhatian spasial terhadap fitur penting pada citra, ESPPF
meningkatkan efisiensi dalam mengekstraksi fitur multiskala, CD menyederhanakan
proses deteksi dan meningkatkan kecepatan inferensi, sementara WIoU digunakan
sebagai fungsi loss untuk mengoptimalkan prediksi bounding box.
Dataset yang digunakan adalah DUO (Detection Underwater Object) yang terdiri
dari 7.782 citra bawah air, masing-masing diklasifikasikan ke dalam empat jenis biota
laut: echinus (bulu babi), holothurian (teripang), scallop (kerang), dan starfish (bintang
laut). Proses pelatihan dilakukan menggunakan YOLOv10n sebagai baseline karena
ukurannya yang ringan, dengan delapan kombinasi modifikasi model yang diuji untuk
menilai kontribusi masing-masing modul terhadap performa akhir. Semua pelatihan
dilakukan menggunakan GPU dalam lingkungan Jupyter Notebook, dengan tuning
hyperparameter seperti learning rate, batch size, dan optimizer.
Evaluasi performa dilakukan berdasarkan metrik mAP\@0.5, mAP\@0.5:0.95,
precision, recall, F1-score, dan FPS. Model baseline menghasilkan mAP\@0.5 sebesar85,2%, sedangkan modifikasi dengan WIoU meningkatkan mAP menjadi 86,4%.
Kombinasi ESPPF + HDA + CD + WIoU memberikan precision tertinggi sebesar 87,8%,
meskipun disertai penurunan recall menjadi 75,3%. Modul CD sendiri menghasilkan FPS
tertinggi yaitu 35, menunjukkan efisiensi inferensi yang sangat baik. Visualisasi hasil
deteksi menunjukkan bahwa model mampu mengenali objek dengan cukup akurat,
walaupun beberapa objek tetap sulit dikenali terutama pada citra dengan kualitas rendah
dan kontras buruk. Model juga diuji pada lima citra baru dari internet, dan hasilnya
menunjukkan kemampuan generalisasi yang baik di luar data latih.
Secara keseluruhan, penelitian ini berhasil membuktikan bahwa modifikasi
YOLOv10 dengan empat komponen utama tersebut dapat meningkatkan akurasi dan
efisiensi deteksi objek bawah air. Kontribusi dari penelitian ini adalah dalam
pengembangan model deteksi yang lebih andal dan ringan untuk diterapkan pada sistem
monitoring laut otomatis, baik untuk tujuan konservasi, penelitian ilmiah, maupun
teknologi robotika bawah air. Penelitian selanjutnya dapat mengeksplorasi implementasi
model ini dalam perangkat edge computing serta pengujian pada kondisi citra ekstrem
seperti kekeruhan tinggi dan pencahayaan sangat rendah.
Description
Reupload file repository 4 Februari 2026_Arif/Halima
