24 Agustus 2019

Approximate Bayesian Computation Digunakan Ilmuwan Untuk Melakukan Berbagai Analisis Biologi

Dalam Bayesian Inference, informasi lengkap tentang vektor parameter model terkandung dalam distribusi posterior. Memahami kekuatan yang memengaruhi variasi alami di dalam dan di antara populasi telah menjadi tujuan para ahli evolusi biologi selama beberapa dekade. Biologi adalah ilmu yang kompleks, sehingga tidak dapat dihindari bahwa pengamatan tentang sistem biologis diarahkan untuk membuat suatu model yang kompleks. Kenyataan bahwa kemudahan penggunaan pendekatan Review Trend dalam ekologi dan evolusi algoritma seperti ABC dapat memudahkan untuk membuat kesimpulan ketika digunakan pada berbagai permasalahan kompleks adalah suatu kenyataan yang tidak dapat dihindari. ABC adalah alat yang sangat berguna untuk membuat kesimpulan pada suatu model yang bersifat kompleks. Tanpa metode yang tepat, model kompleks yang menjadi objek pengamatan menjadi sulit untuk di analisis sehingga informasi tentang permasalahan yang ingin di selesaikan atau diketahui juga sulit diperoleh. ABC sangat fleksibel dan relatif mudah diterapkan, sehingga memungkinkan subjek pengamatan untuk membuat kesimpulan pada berbagai model yang bersifat kompleks. Beberapa aspek pemikiran Bayesian belum di eksplorasi sepenuhnya dalam metode ABC. Namun, subjektivitas pengamatan dapat dikurangi melalui penerapan semua langkah analisis data Bayesian secara cermat. 

ABC dengan cepat menjadi populer selama beberapa tahun terakhir, khususnya untuk melakukan analisis permasalahan kompleks yang timbul dalam ilmu biologi, misalnya populasi genetika, ekologi, epidemiologi, dan sistem biologi. Sejumlah algoritma populer yang dapat dimanfaatkan untuk menghasilkan sampel dari distribusi posterior antara lain importance sampling, Markov Chain Monte Carlo (MCMC) dan Sequential Monte Carlo (SMC). Biologi komputasi lebih mirip dengan bioinformatika, dengan kata lain Biologi Komputasi merupakan ilmu bidang studi yang memanfaatkan penggunaan komputer untuk menyimpan dan mengolah data-data biologi. Distribusi prior merupakan distribusi awal yang memberikan informasi mengenai parameter dan harus ditentukan terlebih dahulu sebelum merumuskan distribusi posteriornya. Informasi yang diperoleh mengenai fungsi kepekatan peluang dari data sampel disebut dengan fungsi likelihood. ABC merupakan salah satu metode yang dapat dikelompokkan menjadi bagian dari Biologi Komputasi untuk melakukan analisis permasalahan kompleks sehingga memudahkan subjek penelitian melakukan analisis berdasar data yang dimiliki. 

Approximate Bayesian Computation yang biasa disingkat dengan ABC, pertama kali diciptakan oleh Beaumont dalam konteks teknik statistik Bayesian populasi genetika dan mengacu pada suatu jenis metode tertentu dari metode likelihood-free. Approximate Bayesian Computation (ABC) merupakan kelompok metode komputerisasi yang berakar pada metode statistik Bayesian yang dapat digunakan untuk memperkirakan distribusi parameter model posterior. Distribusi posterior yang dihasilkan berisi semua informasi yang diperlukan untuk melakukan analisis, termasuk pemeriksaan dan validasi sekaligus hipotesis dan pengambilan keputusan. Istilah Likelihood-free dan ABC biasa digunakan untuk menjelaskan metode komputerisasi Bayesian yang dikembangkan untuk digunakan ketika fungsi likelihood tidak bisa dilaksanakan secara komputerisasi. Algoritma ABC mirip dengan Algortima MCMC, namun secara keseluruhan algoritma ABC memiliki tingkat akurasi lebih rendah daripada MCMC. Beberapa kelemahan algortima ABC antara lain adalah: jumlah informasi sedikit, jumlah statistik ringkasan terbatas, membutuhkan banyak waktu untuk melakukan tahapan proses dan memerlukan banyak waktu untuk melakukan perhitungan statistik. 

Biologi komputasi mencakup banyak aspek dari ilmu pengetahuan yang menggunakan data biologi untuk mengembangkan algoritme atau model untuk memahami berbagai sistem dan hubungan biologis. Biologi komputasi berbeda dari komputasi biologi, komputasi biologi merupakan bagian dari ilmu komputer dan teknik komputer yang menggunakan bioteknologi dan biologi untuk membuat sebuah komputer. Bidang ini di definisikan secara luas dan mencakup dasar-dasar dalam ilmu komputer, matematika, animasi, statistik, biokimia, kimia, biofisika, biologi molekuler, genetika, genetika, ekologi, evolusi, anatomi, neuroscience, dan visualisasi. Sampai saat ini banyak ahli biologi yang tidak memiliki akses ke berbagai data umum, terutama dalam biologi molekuler dan genomik. Peneliti mampu mengembangkan metode analisis untuk menafsirkan informasi biologis, tetapi tidak mampu untuk membagikannya secara cepat kepada rekannya. Biologi komputasi meliputi pengembangan dan aplikasi dari data-analitis dan teoretis metode, algoritma matematika dan simulasi komputasi teknik untuk mempelajari biologi, perilaku dan sistem sosial. Bidang ilmu tersebut mulai berkembang pada sekitar awal tahun 1970. Hal tersebut dianggap sebagai ilmu untuk menganalisis informasi proses dari berbagai sistem biologi.

Teorema Bayes memungkinkan dua buah sumber informasi yang berisi tentang parameter dari suatu model statistik digabung menjadi satu. Dengan teorema tersebut informasi sampel (fungsi likelihood) dan informasi prior (distribusi prior) bisa digabung menjadi informasi posterior (distribusi posterior). Distribusi posterior merupakan salah satu konsep dasar Bayesian, dimana distribusi posterior akan proporsional terhadap perkalian antara distribusi prior dan likelihood. Pada ABC analisis Bayesian menggali dua buah sumber informasi tentang parameter suatu model statistik. Sumber informasi pertama berasal dari sampel dan disebut informasi sampel. Sumber informasi kedua berasal dari opini sang ahli atau peneliti, yang disebut dengan informasi prior. Gabungan dua buah sumber informasi tersebut akan membentuk informasi posterior. Gabungan kedua sumber informasi ini dicapai dengan mengikuti seperangkat aturan dalam teorema Bayes. 

Pada analisis Bayesian, informasi awal dan informasi sampel yang dinyatakan dengan fungsi likelihood di gabungkan untuk membentuk distribusi posterior. Bentuk dan kurva fungsi likelihood menunjukkan tentang informasi stabilitas perhitungan yang dilakukan. Untuk memudahkan perhitungan fungsi likelihood, maka fungsi tersebut biasanya di transformasi terlebih dahulu menjadi fungsi log-likelihood. Setelah nilai logaritma berhasil ditemukan, maka nilai likelihood diperoleh dengan mencari nilai inverse log dari hasil perhitungan log-likelihood sebelumnya. Menaksir parameter model dapat dilakukan dengan memilih nilai parameter yang menghasilkan nilai distribusi peluang terbesar atau maksimum. Nilai parameter tersebut diperoleh dengan cara memaksimumkan fungsi likelihood. Salah satu metode untuk menghitung nilai tersebut ialah dengan Maximum Likelihood Estimation (MLE). 

Metode ABC telah banyak dipelajari dan dikembangkan oleh ahli biologi untuk membuat suatu analisis tentang distribusi parameter model posterior pada objek yang diamati. Semua proses analisis pada algoritma ABC dilakukan dengan mematuhi seperangkat aturan pada teorema Bayes. ABC merupakan bagian dari kelompok metode statistik Bayesian berbasis komputerisasi untuk menghitung perkiraan distribusi parameter posterior. Perhitungan yang dilakukan akan menjadi lebih cepat dan akurat jika dilakukan dengan menggunakan alat bantu perangkat lunak. Perangkat lunak yang banyak dimanfaatkan untuk mencoba metode ABC adalah DIY-ABC, R dan ABCtoolbox. Pilih perangkat lunak yang sesuai dan memudahkan pengguna ketika melakukan berbagai percobaan agar perangkat lunak tersebut dapat berfungsi dengan optimal.