Analisis Model Machine Learning dalam Forecasting Produksi Minyak Bumi Sumur 159-F14H pada Lapangan Volve
Abstract
Semakin maraknya kebutuhan akan artificial intelligence, terlebih di
industri minyak dan gas bumi. Akurasi yang dihasilkan oleh artificial intelligence
dalam memberikan informasi mengenai data yang dibutuhkan membuat para
petroleum engineer mulai melakukan berbagai studi dan penelitian. Produksi
minyak dan gas bumi pada suatu sumur yang terus-menerus akan membuat
menurunkan produktivitas sumur itu seiring berjalannya waktu. Sumur yang tua
atau yang memiliki produktivitas rendah ditandai dengan tingginya produksi air
dari sumur tersebut dan masalah-masalah lainnya. Untuk mengetahui kapan suatu
sumur dapat terus berproduksi beberapa orang melakukan penelitian dan
eksperimen menggunakan bantuan dari artificial intelligence yaitu menggunakan
pendekatan machine learning. Penelitian dilakukan untuk memprediksi rentang
waktu produktivitas suatu sumur sekaligus produksi sumur tersebut.
Penulis melakukan penelitian untuk memprediksi produksi minyak bumi
dan melakukan studi komparatif menggunakan model machine learning.
Penelitian dilakukan dengan menganalisis kinerja prediktif model machine
learning yang digunakan. Peneliti menggunakan model machine learning berbasis
pohon yaitu Random Forest, Extra Trees, Gradient Boosting. Kekakuratan model
akan ditentukan berdasarkan koefisien determinasi dan selisih nilai pada data
menggunakan RMSE dan R2
. Data yang digunakan adalah data pada sumur yang
sudah ada di lapangan Volve yaitu sumur 159-F-14H dengan jumlah data yang
digunakan sebanyak 1093 hari dari 14 Juli 2013 – 13 Juli 2016. Data akan dibagi
menjadi 2 bagian yaitu 70% untuk training dan 30% untuk testing. Penulis
menggunakan bahasa pemrograman Python dan menggunakan algoritma sklearn.
Selanjutnya model, koefisien determinasi, data akan di-import lalu dilakukan
training, pada tahap ini penulis melatih model menggunakan data set training dan
men-set model dengan sebaik mungkin agar menghasilkan output yang dianggap
baik. Pada tahap ini, penulis akan memilah-milah paramater pada setiap model
yang digunakan hingga model tersebut menghasilkan nilai RMSE dan R2
yang
bagus. Selanjutnya model akan digunakan untuk memprediksi data set testing.
Pada tahap ini, model tidak dilakukan pemilihan parameter lagi karena tahap ini
sudah tahap final dari modelling yang dilakukan. Dari tahap testing, Random
Forest menunjukkan kinerja prediktif yang paling baik yaitu menghasilkan RMSE
5,134 dan R2
0,974, model dengan kinerja prediktif yang baik setelah Random
Forest yaitu Gradient Boosting dengan nilai RMSE 5,927 dan R2
0,965, dan
model yang menghasilkan output paling rendah adalah Extra Trees yaitu RMSE
6,524 dan R2 0,958. Hal ini menunjukkan bahwa Random Forest adalah model
yang paling akurat dalam memprediksi dibanding kedua model lainnya dan
memiliki error paling sedikit.
Collections
- UT-Faculty of Engineering [4394]