Klasifikasi Tangisan Bayi Menggunakan Parameter Pitch dengan K-Nearest Neighbor
Abstract
Emosi merupakan perasaan yang muncul akibat adanya kenyamanan atau
ketidaknyamanan seseorang terhadap keadaan tertentu. Berdasarkan urutan
peristiwa, emosi dapat diklasifikasikan menjadi dua, yaitu emosi primer dan
sekunder. Emosi primer atau dasar merupakan emosi yag pertama kali dirasakan
oleh bayi sejak lahir. Setiap bayi baru lahir mempunyai kemampuan dalam
mengekspresikan emosi atau kebutuhan dasarnya melalui suara tangisan yang
cukup keras. Tangisan pada bayi merupakan hal dasar yang perlu dan penting
untuk dipahami oleh ibu atau pengasuh bayi. Hal tersebut perlu dilakukan karena
tangisan menjadi media komunikasi utama bayi dalam menyampaikan
keinginannya kepada lingkungan tertuma pada ibu atau pengasuh bayi. Secara
umum, para ibu muda yang jauh dari keluarga atau tidak mendapat bimbingan
dari orang yang telah berpengalaman, biasanya mengartikan tangisan bayi hanya
sebagai tanda lapar saja padahal tangisan pada bayi mempunyai arti atau jenisjenis tangisan berbeda-beda bergantung dari segi pemicu/penyebab tangisan.
Berdasarkan penyebab tangisan, jenis-jenis tangisan bayi dapat dibedakan pola
suaranya dengan menganalisis salah satu parameter suara, yaitu pitch.
Perbedaan pola suara pitch dari masing-masing jenis tangisan bayi dapat
dibangun atau dinyatakan dalam bentuk histogram melalui Bag of Features.
Tangisan bayi yang digunakan untuk penelitian ini diambil dengan dua cara, yaitu
pengunduhan Dunstan Baby Language (DBL) dan pengukuran lapang
berdasarkan persepsi Ibu/Bidan. Jenis-jenis tangisan bayi yang digunakan dari
pengunduhan DBL ada lima jenis antara lain lapar, mengantuk, ingin bersendawa,
kembung dan tidak nyaman dengan perbandingan jumlah data suara, yaitu 21 : 18
: 18 : 9 : 17 sedangkan pada pengukuran lapang berdasarkan persepsi Ibu/Bidan,
jenis tangisan bayi yang digunakan ada dua jenis antara lain lapar dan sakit
dengan perbandingan jumlah suara, yaitu 14 : 42. Kumpulan data suara DBL dan
pengukuran tersebut akan diproses parameter pitch-nya dengan diekstraksi
fiturnya kemudian dilakukan klasifikasi untuk mengetahui akurasi yang dihasilkan
setelah jenis-jenis tangisan berdasarkan pada penyabab tangisan dapat
teridentifikasi dengan baik. Sebelum diekstraksi fiturnya, kumpulan data suara
DBL dan pengukuran akan melalui tahap preprocessing terlebih dahulu. Tahap
preprocessing ini dilakukan dengan tujuan untuk menghilangkan efek noise sinyal
masukan (data audio) dengan teknik clipping filtering. Teknik tersebut
menghasilkan threshold amplitude dan threshold area yang digunakan untuk
memproses kumpulan suara sebagai sinyal masukan, yaitu sebesar 0,01 (data
DBL), 0,08 (data pengukuran) dan 10.000. Kedua threshold tersebut digunakan
untuk mendapatkan elemen/bagian voiced speech dan sinyal noise terfilter dengan
baik. Tahap selanjutnya adalah ekstraksi fitur. Ekstraksi fitur yang digunakan
pada penelitian ini adalah pitch dan Bag of Features. Ekstraksi fitur pitch
dilakukan dengan cara mengubah parameter range dan metode dalam
mengestimasi frequency fundamental (pitch). Range dan metode yang digunakan
pada penelitian ini adalah (70 170) dan PEF (Pitch Estimation Filter). Hasil
ekstraksi fitur pitch tersebut kemudian dinyatakan dalam histogram melalui
ekstraksi Bag of Features. Histogram Bag of Features yang terbentuk akan
diwakili oleh 10 bin/kelas. Kelas/bin histogram tersebut menunjukkan probability
(frekuensi ternormalisasi) sebaran rata-rata pitch dari data DBL dan pengukuran.
Sebaran nilai pitch diperoleh dengan menentukan batas segmen yang disebut
sebagai data (voiced speech) terlebih dahulu. Penentuan batas segmen akan
menghasilkan jumlah data region yang akan diekstraksi ke dalam Bag of
Features. Selanjutnya adalah dilakukan proses building database dari data DBL
dan pengukuran untuk mendapatkan parameter yang dianalisis, yaitu mean pitch
serta sebaran nilai pitch rendah dan tinggi sampel audio tangisan bayi yang
diujikan melalui histogram Bag of Features. Building database tersebut kemudian
dilakukan pengujian database terhadap data testing. Pengujian database tersebut
dilakukan untuk mengetahui seberapa baik model atau algoritma yang telah
dibangun dapat menggeneralisasi dan mengklasifikasi kelas sesuai label yang
telah dibangun (building database) melalui akurasi yang dihasilkan. Metode
klasifikasi yang digunakan adalah K-Nearest Neighbor.
Berdasarkan karakteristik Bag of Features yang terbentuk dapat diketahui
bahwa rata-rata pitch tinggi dan rendah terletak pada bin 9 dan 1 baik dari data
DBL maupun data pengukuran. Urutan label tangisan bayi DBL yang mempunyai
probability (frekuensi ternormalisasi) rata-rata pitch tinggi berdasarkan histogram
Bag of Features adalah mengatuk (0,290), kembung (0,207), lapar (0,206), ingin
bersendawa (0,182) dan tidak nyaman (0,090) sedangkan urutan label tangisan
bayi dari data pengukuran menunjukkan bahwa label sakit mempunyai rata-rata
pitch yang lebih tinggi, yaitu sebesar 0,200 apabila dibandingkan dengan label
lapar yang rata-rata pitch tingginya sebesar 0,064. Hasil akurasi klasifikasi yang
diperoleh antara pengujian database DBL dan database pengukuran
menggunakan K-Nearest Neighbor terlihat optimal. Total akurasi yang diperoleh
dari pengujian database DBL adalah sebesar 92 %, tetapi terdapat 2 kelas data
yang terdeteksi salah dari 5 sampel uji pada label kembung. Kelas yang terdeteksi
salah hanya pada label kembung. Kesalahan tersebut dapat terjadi karena pada
proses building database dari data DBL, akurasi rendah hanya terletak pada label
kembung, yaitu sebesar 48,148%. Akurasi rendah tersebut dapat mempengaruhi
pengujian database dari data DBL terutama pada label kembung. Total akurasi
yang diperoleh dari pengujian database dari data pengukuran adalah sebesar 98%,
tetapi terdapat 1 kelas data yang terdeteksi salah dari 27 sampel uji, yaitu pada
label sakit. Pada proses building database dari data pengukuran, akurasi dari label
sakit adalah sebesar 100%. Berdasarkan akurasi saat building database dari data
pengukuran terutama label sakit, kelas data yang terdeteksi salah pada label sakit
dapat terjadi karena kemampuan bayi dalam menginterpretasikan sakit akibat
suntikan imunisasi berbeda-beda. Perbedaan tersebut dipengaruhi oleh usia dan
tingkat kematuran sistem neurologis terhadap transmisi impuls sakit akibat
suntikan imunisasi.