21 Juli 2019

Mengelola Data Warehouse Menjadi Lebih Efektif Dengan Perangkat Lunak ETL

Perubahan teknologi gudang data yang dimiliki oleh sistem TI terus berkembang sehingga harus diikuti dan dipertahankan oleh orang yang bekerja di lingkungan TI. Metodologi dan tugas ETL telah dikenal orang selama bertahun-tahun melalui berbagai macam aplikasi dan sistem basis data yang menjadi tulang punggung TI pada perusahaan. Tantangan yang dihadapi data Warehouse atau gudang data adalah melakukan integrasi, mengatur ulang dan konsolidasi volume data yang besar melalui berbagai sistem sehingga menghasilkan basis informasi baru untuk business intelligence atau kecerdasan bisnis. Walaupun ETL merupakan akronim dari Extract-Transform-Load tetapi ETL merupakan proses yang luas dan bukan hanya terdiri dari tiga langkah proses yang menjadi akronim istilah tersebut. Perbedaan utama antara ETL dengan metode pemindahan data konvensional adalah pada sisi kemudahan penggunaan. Tanpa menggunakan cara yang tepat proses penggalian dan penyimpanan data menjadi sulit dan tidak efektif. ETL banyak membantu orang yang bekerja pada lingkungan Information Management Systems dan Decission Support Systems. Berbagai perangkat lunak ETL atau perangkat lunak BI dapat diperoleh dengan membeli secara Online atau menyalin berkas instalasi perangkat lunak opensource dari website pengembang ETL.

Perangkat lunak ETL adalah bagian dari perangkat lunak yang bertanggung jawab melakukan ekstraksi, penyucian, penyesuaian kemudian menyimpannya ke gudang data. ETL merupakan sebuah metode untuk mengubah data yang bersifat heterogen dan kompleks sehingga dapat di simpan ke dalam gudang data. Gudang data memiliki beberapa elemen penting sehingga dapat meningkatkan peluang keberhasilan, contohnya data historis, meta-data, data rinci, data ringkas dan data ter-integrasi. Proses yang dilalui oleh ETL ialah ekstraksi, penyucian, penyesuaian dan memberikan data ke sistem penyimpanan yang sering disebut dengan gudang data. Keuntungan menggunakan perangkat lunak ETL adalah Ease of use, Graphical flow, Operational resilience, Structured design, Liniage and analysis, Data profilling and cleansing dan Complex data management. Mengolah data dengan menggunakan perangkat lunak yang menggunakan metode ETL menjadikan pengguna lebih mudah mengolah data menjadi informasi bermanfaat.

Berbagai data dengan berbagai format perlu di olah terlebih dahulu agar dapat berubah menjadi informasi berguna bagi kelangsungan proses bisnis. Proses penggalian data dari sistem sumber dan membawanya ke gudang data biasa disebut dengan ETL. Pengembang perangkat lunak ETL bertanggung jawab untuk merancang gudang data dan semua fungsi ETL untuk mengolah data di perusahaan. Setelah sistem ETL telah selesai dibuat, pengembang perangkat lunak juga harus menguji dan memastikan bahwa perangkat lunak tersebut dapat berjalan lancar. Pengetahuan yang wajib diketahui oleh pengembang perangkat lunak ETL antara lain Tools, SQL, Parameterization, Scripting Language dan Debugging. Perusahaan-perusahaan seperti AARP, ACE Hardware, amdocs dan asian paints menggunakan perangkat lunak ETL untuk membantu mereka meningkatkan kualitas data, mengurangi time-to-load data dan meningkatkan proses penjualan. Di perusahaan lain sumber data dari berbagai bagian seperti keuangan, hubungan pelanggan dan sumber daya manusia terlibat dalam berbagai proyek integrasi data menggunakan perangkat lunak ETL.

Konsep data Warehouse pertama kali dipelopori oleh peneliti dari perusahaan IBM pada tahun sekitar 1980-an bernama Barry Devlin dan Paul Murphy. Data Warehouse digunakan di berbagai bidang seperti perusahaan telekomunikasi, bank, perusahaan asuransi, perusahaan retail dan bidang olah raga. Data Warehouse adalah basis data yang di rancang khusus untuk mengerjakan proses query, membuat laporan dan analisis. Big data mencakup semua data pada data Warehouse namun data Warehouse tidak bisa disebut sebagai big data karena ruang lingkup-nya tidak seluas big data. Data Warehouse tidak dapat digunakan untuk menangani data yang memiliki ukuran sangat besar, sehingga ketika dihadapkan oleh permasalahan data berukuran besar perlu menggunakan teknologi Big Data. Teknologi Data Warehouse memungkinkan pengguna dapat mengakses data penting dari beberapa sumber secara keseluruhan dari satu tempat secara cepat.

Tujuan ETL adalah mengumpulkan, menyaringkan, mengolah dan menggabungkan data-data relevan dari berbagai sumber untuk disimpan ke data Warehouse. Kualitas ETL yang buruk dapat mengakibatkan data tidak sesuai harapan atau hilangnya data yang menjadi dasar untuk melakukan analisis maupun kontrol data. Proses ETL terdiri dari proses memilih dan mengambil data dari satu atau beberapa sumber kemudian mengakses tersebut, tahap selanjutnya data dibersihkan dan diubah dari bentuk asli menjadi bentuk yang sesuai kebutuhan, dan terakhir data tersebut dimasukkan ke dalam data Warehouse. Setiap tahapan pada ETL dilakukan secara paralel sehingga urutan proses pengolahan data harus berurutan dan tidak dapat dilakukan secara terbalik. Proses ETL dianggap benar jika pada proses itu melibatkan beberapa hal yaitu adanya proses ekstraksi data dari suatu sumber, mempertahankan kualitas data, menerapkan aturan-aturan standar, dan menyajikan data dalam berbagai bentuk. Untuk menilai baik atau buruk proses ETL dapat ditentukan melalui durasi proses keseluruhan, kualitas data yang dihasilkan dan kesesuaian proses yang dilakukan terhadap aturan standar yang ada.

Pemilihan perangkat lunak yang tepat akan mempermudah pengguna melakukan analisis, membuat rencana dan melakukan kontrol data. Akurasi data hasil proses ETL dengan perangkat lunak menjadikan para pembuat keputusan lebih memiliki gambaran tentang hal-hal yang ingin direncanakan dan dilaksanakan. Perangkat lunak yang berhasil menjadi perangkat lunak ETL terbaik antara lain adalah HEVO, Skyvia, Informatica, Infosphere Information Centre dan Oracle Data Integrator. Contoh perangkat lunak ETL yang bersifat opensource antara lain Talend, NiFi dan Jaspersoft. Proyek teknologi seperti proyek-proyek TI memiliki kecenderungan over-budget, over-time dan memiliki nilai guna lebih kecil dari yang diperkirakan. Perusahaan yang menggunakan perangkat lunak ETL banyak yang berasal dari perusahaan Perangkat Lunak Komputer, Layanan dan Teknologi Informasi, Asuransi, Bank, Rumah Sakit dan Perguruan Tinggi.

ETL adalah cara yang dapat digunakan oleh profesional TI untuk mengolah data menjadi informasi bermanfaat sehingga dapat dijadikan acuan untuk tujuan tertentu. Perangkat lunak ETL diperoleh dengan cara membelinya melalui website pengembang perangkat lunak tersebut atau menyalin berkas instalasi perangkat lunak opensource yang bisa dicari melalui Internet. ETL adalah salah satu cara untuk mengolah data dari berbagai sumber sehingga dapat disimpan pada gudang data. Banyak kritik yang dilontarkan kepada orang-orang yang mengerjakan proyek teknologi karena over-budget, over-time dan berkurangnya nilai guna proyek yang dilaksanakan. Sebaiknya pemilihan perangkat lunak yang tepat juga mempertimbangkan biaya pengadaan perangkat lunak tersebut sehingga tidak memberatkan pekerja lain. Pembengkakan biaya dan waktu sekaligus rendahnya nilai guna proyek teknologi sebaiknya dapat dijadikan refleksi diri bagi orang-orang yang bekerja di lingkungan teknologi termasuk TI.