Peningkatan Performa Model Klasifikasi Tingkat Depresi Pengguna Media Sosial X Menggunakan Algoritma Random Forest dan Hyperparameter Tuning
Abstract
Depresi adalah masalah kesehatan mental serius yang mempengaruhi 
berbagai kalangan. Media sosial X (sebelumnya Twitter) dengan 139 juta pengguna 
aktif di Indonesia sering digunakan untuk mengungkapkan perasaan dan opini. 
Diskusi tentang kesehatan mental di X meningkat 17% antara 2018. Penelitian ini 
bertujuan meningkatkan klasifikasi tingkat depresi pengguna X dengan mengganti 
algoritma Multinomial Naive Bayes dengan Random Forest, melakukan tuning 
hyperparameter, dan mengeksplorasi penggunaan n-gram (unigram, bigram, 
trigram). Dataset dari penelitian terdahulu (Armaini dkk, 2024) mengandung 2662 
data gambar terkait kesehatan mental pengguna X, dikelompokkan dalam tiga 
tingkat depresi: ringan, sedang, dan berat. Model Random Forest diterapkan dengan 
tiga skenario N-Gram dan pembagian dataset 90:10, 80:20, dan 70:30. Hasil 
menunjukkan model Random Forest dengan N-Gram Trigram dan parameter 
optimal (n_estimators = 200, max_depth = None, min_samples_split = 2, 
min_samples_leaf = 10) pada rasio 90:10 memberikan akurasi terbaik 98,50%.
