20 Agustus 2019

Algoritma 1R Merupakan Salah Satu Algoritma Klasifikasi Pada Machine Learning

Algoritma klasifikasi pada data Mining merupakan sebuah catatan record data yang hendak di kelompokan ke salah satu dari sekian klasifikasi data yang tersedia pada variabel tujuan berdasarkan nilai-nilai variabel prediktor. Klasifikasi merupakan salah satu topik utama dalam Data Mining atau Machine Learning. Penelitian di bidang inovasi dan teknologi tidak selalu harus menggunakan metode state-of-the-art sebagai algoritma untuk melakukan analisis. Metode-metode mutakhir dan metode-metode sederhana sama-sama memiliki kelemahan dan kelebihan yang dapat dijadikan sebagai pertimbangan untuk diterapkan pada penelitian. OneR memberikan hasil sedikit kurang akurat daripada algoritma klasifikasi State-of-the-art. Hasil OneR tergolong sederhana untuk ditafsirkan oleh manusia. Pemilihan metode yang tidak tepat mengakibatkan berbagai kerugian bagi peneliti. Pemilihan metode yang tepat akan menjadikan hasil penelitian dapat sesuai dengan tujuan awal melakukan penelitian tersebut sekaligus penelitian yang dilakukan dapat selesai sesuai rencana awal. Dengan adanya 1R terwujud suatu algoritme Machine Learning yang sederhana, berkualitas dan hasilnya mudah dipahami oleh pengguna. 

Holte tidak mempromosikan penggunaan 1R sebagai saingan teknik pembelajaran arus utama tetapi ia menggunakannya untuk menunjukkan bahwa sebagian besar data-set yang digunakan peneliti untuk menguji algoritme mereka tidak mencakup aturan yang sangat kompleks. One R atau One Rule merupakan aturan klasifikasi yang di induksi berdasarkan nilai prediktor tunggal. OneR memiliki parameter yang membatasi kerumitan aturan. Pada tahun 1993 Robert Holte dari Universitas Ottawa menunjukkan kelemahan penggunaan data-set yang digunakan pada Machine Learning Benchmark sekaligus memperkenalkan algoritme Machine Learning yang sangat sederhana bernama 1R. WEKA merupakan sebuah perangkat lunak wrokbench eksperimental yang menggabungkan berbagai standar teknik Machine Learning . Perangkat lunak yang telah populer digunakan untuk melakukan berbagai algoritme Machine Learning antara lain adalah WEKA, KNIME, Orange, Rapid Miner dan SAS. One R yang juga disebut dengan 1R atau One Rule merupakan algoritma klasifikasi sederhana yang dapat menghasilkan representasi penelitian secara otomatis berdasarkan data-set yang dimasukkan.

Nama lain 1R adalah OneR dan One Rule. OneR adalah algoritme klasifikasi sederhana yang akurat dan menghasilkan satu aturan untuk setiap prediktor data, kemudian pengguna dapat memilih aturan dengan total kesalahan terkecil untuk dijadikan sebagai OneR. Pengguna 1R perlu memahami garis besar dengan baik sehingga dapat membuat representasi sederhana sekaligus berkualitas. Dengan begitu tercipta keseimbangan antara akurasi dan kesederhanaan. Semakin tinggi nilai akurasi yang tercipta menunjukkan semakin tinggi kualitas hasil analisis. Kesederhanaan menunjukkan tingkat kemudahan hasil analisis untuk dimengerti oleh manusia. Dari berbagai jurnal yang telah diterbitkan dapat dilihat bahwa OneR banyak diterapkan di bidang kedokteran, teknologi informasi dan statistik. Perangkat lunak seperti WEKA, Orange dan Knime dapat berjalan dengan baik pada komputer dengan sistem operasi Windows, Linux dan Macintosh.

Benchmark adalah proses menguji kemampuan perangkat komputer dengan menggunakan program yang dirancang secara khusus. Hal tersebut dilakukan untuk menghasilkan informasi tentang tingkat kualitas objek yang diamati. Pengujian dilakukan dengan cara membandingkan produk-produk perangkat lunak maupun perangkat keras dengan percobaan yang sama. Dengan melakukan Benchmark maka perbandingan berbagai parameter pada objek yang diamati dapat terlihat sehingga kualitas masing-masing objek dapat dibandingkan. Benchmark dikelompokkan menjadi dua jenis, yaitu Synthetic Benchmark dan Application Benchmark. Synthetic Benchmark merupakan tes untuk mengetahui batas kemampuan komponen atau sistem komputer melalui rangkaian tes yang sangat berat. Sedangkan Application Benchmark berguna untuk mengetahui kemampuan komponen atau sistem komputer ketika menjalankan aplikasi sehari-hari.

Kerumitan suatu training-data berukuran besar membuatnya tidak mungkin di analisis secara manual, karena selain membutuhkan waktu yang lama kemungkinan berhasilnya juga sedikit. Untuk mengolah data-set berukuran besar diperlukan alat bantu berupa perangkat lunak sehingga representasi hasil penelitian dapat terbentuk secara otomatis. Salah satu fitur paling penting pada WEKA adalah memungkinkan untuk melakukan berbagai skema dari sebuah data-set dan setiap hasil di evaluasi secara konsisten. Workbench Machine Learning WEKA digunakan untuk menghasilkan aturan dan pohon keputusan berdasarkan data-set yang ada. Sayangnya perangkat lunak WEKA masih dirasa sulit untuk digunakan oleh orang yang awam tentang teknologi komputer. Sehingga perangkat lunak tersebut hanya dikenal di kalangan orang yang telah mahir komputer saja, sedangkan orang yang awam tentang komputer membutuhkan latihan khusus untuk menjalankannya.

Tahapan langkah 1R terdiri dari empat tahapan, yaitu pertama, meninjau setiap fitur secara bergantian. Kedua, menuliskan percabangan di setiap pohon keputusan. Ketiga, menentukan Majority class setiap percabangan yang dihasilkan. Terakhir, mengulangi hal yang sama untuk semua atribut dan memilih salah satu hasil dengan tingkat kesalahan paling rendah. Perangkat lunak berbayar yang dapat menjadi perlengkapan melakukan Data Mining antara lain IBM Cognos, IBM SPSS Modeller, Teradata, Dundas dan Oracle Data Mining. Perangkat lunak open source yang bersifat gratis dan perangkat lunak dengan lisensi yang bersifat berbayar sama-sama dapat digunakan untuk melakukan berbagai analisis Machine Learning. Rapid Miner merupakan perangkat lunak paling populer diantara sekian banyak perangkat lunak yang dapat digunakan sebagai perlengkapan melakukan Data Mining. Waikato Environment for Knowledge Analysis (Weka) merupakan seperangkat perangkat lunak Machine Learning yang dibuat dengan bahasa Java, dikembangkan di University of Waikato, Selandia Baru. Perangkat lunak tersebut dapat dimanfaatkan secara gratis dan memiliki lisensi GNU General Public License.

Perlengkapan perangkat lunak yang dapat dimanfaatkan untuk melakukan analisis dengan 1R antara lain WEKA, Rapid Miner, KNIME, SAS dan Orange. One R atau 1R merupakan salah satu algoritma klasifikasi sederhana yang akurat sehingga dapat menjadi pilihan untuk menghasilkan keseimbangan representasi data antara akurasi dan kemudahan. 1R merupakan salah satu algoritme klasifikasi bagian dari Machine Learning yang berfungsi untuk mengelompokkan suatu data berdasarkan class tertentu. Penambangan data atau Data Mining memiliki tujuan utama menemukan pola pada data yang memiliki volume besar dan mengubah data tersebut menjadi informasi yang berguna. Untuk mempelajari berbagai teknik Data Mining perangkat lunak open source merupakan pilihan terbaik karena pengguna dapat menggunakannya dengan bebas tanpa mengeluarkan biaya tambahan. Pilih perangkat lunak yang mendukung algoritma yang akan digunakan untuk melaksanakan Data Mining agar penelitian atau analisis yang dilakukan dapat berjalan sesuai dengan rencana.