23 Agustus 2019

Bayesian Linear Regression Merupakan Bagian Analisis Statistik Berbasis Bayesian Inference

Analisis regresi adalah metode statistik yang memungkinkan untuk melakukan pengamatan terhadap hubungan antara beberapa variabel yang menjadi objek analisis. Beberapa tahun terakhir pembelajaran Bayesian telah banyak diadopsi dan bahkan terbukti memberikan hasil yang lebih baik daripada teknik Machine Learning lainnya. Menghitung perkiraan untuk mendapatkan informasi tambahan sebagai bahan pertimbangan membuat keputusan tidak selalu harus dilakukan dengan data yang berukuran besar. Bayesian Linear Regression merupakan contoh penerapan Machine Learning yang paling praktis untuk melakukan analisis statistik dengan alat bantu komputer dan perangkat lunak. Bayesian Learning dapat memberikan informasi tambahan berdasarkan pengetahuan dan informasi yang telah diketahui sebelumnya. Berbagai macam keterbatasan dan halangan jika tidak dihadapi dengan bijaksana dapat mengakibatkan kegagalan yang merugikan. Penggunaan metode dan peralatan yang tepat memperbesar kemungkinan terselesaikan-nya permasalahan yang diteliti atau dihadapi. Berbagai teknik Bayesian telah banyak dimanfaatkan untuk memperbaiki dan menyelesaikan permasalahan yang dihadapi secara ilmiah. 
 
Regresi Linier seperti Bayesian Linear Regression, ANOVA dan T-Test adalah jenis pemodelan statistik yang paling umum digunakan. Perangkat lunak yang dapat digunakan secara umum adalah JAGS, sedangkan perangkat lunak seperti Rstudio dan SAS hanya baik untuk digunakan pada regresi Bayesian untuk menyelesaikan permasalahan yang bersifat berat atau sukar. Bayesian Inference merupakan suatu metode untuk menghitung perkiraan berdasarkan data. Hal tersebut sangat berguna untuk menghadapi situasi ketika memiliki jumlah data yang terbatas namun hasil perkiraan yang dilakukan memberikan dampak yang penting. CMC methods are used to approximate the posterior distribution of a parameter of interest by random sampling in a probabilistic space. Metode MCMC digunakan untuk memperkirakan distribusi posterior dari parameter minat secara acak melalui sampling pada lingkungan yang bersifat mudah berubah-ubah. Bayesian Estimation berbeda dengan semua metode klasik yang menganggap bahwa parameter sebagai variabel acak dan bukan suatu konstanta yang tidak diketahui. Berbagai perangkat lunak seperti JAGS, Rstudio dan SAS adalah perangkat lunak yang dapat dimanfaatkan untuk melakukan Bayesian Linear Regression sehingga menghasilkan perhitungan statistik untuk menyelesaikan berbagai permasalahan yang dihadapi. 
 
Tujuan dari penggunaan Bayesian Linear Regression bukan untuk menemukan nilai terbaik dari parameter yang telah ditentukan, tetapi untuk menentukan distribusi posterior pada parameter yang ditentukan sebelumnya. Dalam ilmu statistik, Bayesian Linear Regression merupakan pendekatan regresi linier dengan melakukan analisis statistik yang dilakukan sesuai dengan konteks Bayesian Inference. Keuntungan utama menggunakan Bayesian Linear Regression adalah jika sebelum melakukan analisis sudah memiliki hipotesis awal, maka hipotesis tersebut dapat dimasukkan ke dalam pemodelan yang dibuat. Keuntungan lainnya yaitu metode tersebut dapat diterapkan dengan menggunakan data real-time dan data terdahulu. Bayesian linear regression memiliki mekanisme yang berguna untuk menangani data tidak lengkap atau data yang di distribusikan dengan buruk. Adanya berbagai perangkat lunak yang dapat diperoleh secara gratis dan berbayar menjadikan aktivitas melakukan analisis Bayesian Linear Regression menjadi lebih mudah dan cepat. Metode tersebut dapat di terapkan pada berbagai perangkat lunak statistik, contohnya PSPP, Octave, SAS, SPSS dan Rstudio. 
 
Bayesian Inference memiliki cara untuk mendapatkan perkiraan yang tajam melalui data statistik terbatas, padahal hasil analisis tersebut dimanfaatkan untuk menyelesaikan permasalahan yang penting. Dengan kata lain Bayesian Inference memungkinkan pengguna membuat kesimpulan yang lebih kuat melalui data yang dimiliki dengan berdasarkan hal-hal yang sudah diketahui sebelumnya. Pada sekitar pertengahan tahun antara 1970 sampai 1980 gagasan Bayes yang sangat populer tersebut diperbaiki oleh Richard Price sehingga memberikan hasil akhir yang lebih akurat. Bayesian Inference adalah cara untuk membuat perkiraan yang akurat berdasarkan penggunaan akal sehat seperti data, informasi, pengetahuan dan perhitungan matematika. Untuk lebih memahami tentang teori Bayes yang dibahas, Anda dapat mencoba membuat perhitungan Bayesian Linear Regression pada berbagai perangkat lunak yang dapat diperoleh dengan gratis. Empat konsep dasar yang menjadi landasan teori Bayes adalah: probabilities, conditional probabilities, joint probabilities dan marginal probabilities. 
 
Metode MCMC juga dapat digunakan untuk menghitung distribusi posterior pada parameter dengan jumlah lebih dari satu. Pengambilan sampel terhadap parameter yang digunakan dilakukan secara acak dengan cara mengambilnya dari lingkungan yang terus berubah-ubah. Prosedur dasar melakukan analisis Bayesian Linear Regression adalah: Pertama, menentukan parameter yang ingin digunakan. Kedua, membuat sebuah model mapping dari training input hingga menjadi training output. Ketiga, gunakan algoritma MCMC untuk mengambil sampel dari distribusi posterior untuk setiap parameter. Untuk memulai menggunakan metode MCMC, pilih nilai parameter acak untuk dipertimbangkan dan taati aturan pembuatan nilai parameter agar memberikan hasil yang memuaskan. Hasil perhitungan statistik pada sekumpulan sampel yang dihasilkan oleh simulasi MCMC merupakan perkiraan terbaik pada distribusi posterior berdasarkan data statistik. 
 
Salah satu sifat utama dari pendekatan Bayesian adalah dapat dimanfaatkan untuk melakukan pencatatan data berskala kecil sekaligus menambahkan perhitungan secara berurutan ketika data baru tiba. Namun jika metode tersebut tidak dapat membuahkan hasil selama tiga percobaan awal, maka kemungkinan besar percobaan yang dilakukan akan menuai kegagalan. Pendekatan Bayesian dapat memberikan hasil yang memuaskan walaupun hanya didukung dengan jumlah data yang sedikit atau kecil. Tiga metode bayesian yang paling populer digunakan ialah minimum mean square error estimator (MMSE), Median dan Maximum a Posteriori (MAP). Pada Bayes Estimation risiko dapat diminimalkan untuk mendapatkan hasil perhitungan yang optimal. Dalam teori estimasi dan teori pengambilan keputusan, Bayes Estimation adalah estimator atau aturan pengambilan keputusan yang meminimalkan nilai harapan posterior melalui fungsi kerugian. Dengan kata lain Bayes Estimation mengoptimalkan harapan posterior melalui fungsi utilitas. 

Bayesian Linear Regression merupakan salah satu metode yang dapat digunakan untuk melakukan analisis regresi yang bersifat linier. Contoh metode regresi linier selain Bayesian Linear Regression antara lain adaah ANOVA dan T-Test. Metode Bayesian Linear Regression dapat dilakukan dengan berbagai perangkat lunak seperti Rstudio, SAS, SPSS, JAGS dan Octave. Metode tersebut dapat memberikan hasil optimal walaupun memiliki hambatan berupa keterbatasan data penelitian. Bayesian Linear Regression merupakan bagian dari metode Machine Learning dan Data Mining yang dimanfaatkan untuk membuat perkiraan berdasarkan data statistik. Perangkat lunak JAGS lebih dipilih karena dapat dimanfaatkan untuk melakukan analisis dalam keadaan tingkat kesulitan yang ringan hingga tingkat kesulitan yang berat. Sedangkan perangkat lunak Rstudio dan SAS kurang maksimal ketika dimanfaatkan untuk melakukan analisis dengan tingkat permasalahan sederhana.