Skrining Virtual Inhibitor Protein Casein Kinase 2-Alpha dengan Pemodelan Quantitative Structure Activity Relationship (QSAR)
Abstract
Penelitian ini dilakukan untuk menentukan model terbaik yang diperoleh
dengan menggunakan metode Pemodelan QSAR, menentukan hasil skrining virtual
dari model terbaik dengan pemeringkatan nilai aktivitas (pIC50), menentukan hasil
clustering dari calon inhibitor protein Caseun Kinase 2-alpha (CK2α) yang teramati
dalam penyakit kanker leukimia. Penelitian ini dilakukan dengan menggunakan
machine learning yang menggunakan pemodelan QSAR dimana akan memperoleh
model terbaik yang digunakan untuk skrining virtual. Hasil skrining virtual
kemudian dikelompokkan (cluster) berdasarkan kemiripan senyawanya
menggunakan nilai similiarity. Hasil cluster kemudian dipilih 50 yang memiliki
senyawa terbanyak dimana masing-masing cluster diwakili satu senyawa. Hasil
tersebut diuji ADMET untuk mengetahui sifat-sifat molekulnya sebagai calon obat
untuk penyakit leukimia dengan protein target CK2α.
Penelitian ini dilakukan dengan memvariasikan hyperparameter untuk
mendapatkan model terbaik yang dimana model tersebut dikatakan baik jika nilai
evaluasi R2
lebih dari 0.6. Hasil yang didapatkan pada pemodelan menggunakan
QSAR ialah pemodelan dilakukan sebanyak 291 kombinasi hyperparameter,
dimana dihasilkan model terbaik dengan nilai R2
sebesar 0.71. Variasi yang
digunakan adalah dengan menggunakan 3 hidden layer, dimana masing-masing
layer berukuran secara berturut-turut sebesar 16, 512, 1024 dan batch size sebesar
8. Model terbaik tersebut kemudian digunakan untuk skrining virtual dari database
ZINC20. ZINC20 digunakan karena ia merupakan database yang dapat diakses
secara gratis dan memiliki molekul yang beragam, selain itu ZINC20 digunakan
karena dapat diintegrasikan dengan perangkat lunak atau alat untuk penelitian in
silico drug design. Skrining virtual dilakukan pada 593.405.102 senyawa. Senyawa hasil skrining virtual kemudian diperingkat dari nilai tertinggi dan dipilih dengan
batasan nilai pIC50 nya lebih besar sama dengan 6.99. Pemilihan batas tersebut
dikarenakan obat silmitasertib memiliki nilai pIC50 6.5. Hasil tersebut diperoleh
senyawa sebanyak 7373. Senyawa tersebut kemudian dikelompokkan berdasarkan
kemiiripannya dengan menggunakan nilai similiarity yang memiliki cut off bernilai
0.3. Cluster yang dihasilkan sebanyak 2997, kemudian dipilih 50 cluster teratas
yang berisi molekul paling banyak. Hal ini dilakukan agar lebih efisien, sebab
banyak molekul yang ada dalam satu cluster akan diwakili hanya dengan satu
molekul yang memiliki tetangga paling banyak. Cluster yang dihasilkan kemudian
diuji intra-cluster untuk memastikan dalam satu kelompok senyawanya mirip dan
diuji inter-cluster untuk mengetahui molekul dikelompok yang berbeda apakah
hasilnya berbeda. Hasil yang didapatkan senyawa dalam satu cluster mirip dan
senyawa lain cluster berbeda. Senyawa hasil cluster kemudian diuji ADMET. Hasil
yang didapatkan adalah 30 dari 50 molekul tidak beracun dan lolos parameter
ADMET, tetapi hanya 18 molekul yang memiliki nilai LD50 lebih tinggi daripada
obat silmitasertib, senyawa tersebut berkode 6, 14, 19, 20, 24, 25, 26, 27, 30, 31,
32, 34, 36, 37, 43, 46, 49, dan 50. Senyawa-senyawa tersebut dapat diuji lebih lanjut
untuk pengembangan obat leukemia yang lebih efektif.