Beberapa teknik data mining yang telah dikembangkan dan digunakan di berbagai proyek data mining antara lain Association, Classification, Clustering, Prediction, Sequential Pattern dan Decision Tree. Algoritma Apriori adalah sebuah algoritma untuk melakukan Frequent Itemset Mining dan pembelajaran Association Rule melalui basis data transaksi.
Algoritma Apriori adalah bagian dari sebuah metode Association Rule yang berfungsi untuk menemukan kombinasi barang berdasarkan barang yang telah dibeli oleh pelanggan. Jenis-jenis Association Rule ada tiga, yaitu: Apriori, Generalized Rule Induction dan Algoritma Hash Based. Association Rule mining merupakan teknik data mining untuk menemukan Association Rule antara suatu kombinasi barang. contohnya Analisis pembelian barang di suatu pasar swalayan, dapat diketahui jumlah kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Hasil analisis dapat digunakan oleh pemilik swalayan untuk mengatur penempatan barang atau membuat rencana promosi penjualan dengan memakai kupon diskon untuk kombinasi barang tertentu. Algoritma apriori merupakan salah satu algoritma klasik data mining. Algoritma tersebut digunakan agar komputer dapat mempelajari aturan asosiasi kemudian mencari pola hubungan antar barang dalam suatu data-set.
Algoritma apriori merupakan salah satu algoritma data mining yang memiliki fungsi untuk menemukan Frequent Pattern Mining. Frequent Pattern Mining adalah barang yang sering muncul pada basis data dan memiliki frekuensi support di atas ambang tertentu yang disebut dengan istilah minimum support. Frequent Pattern Mining tersebut digunakan untuk menyusun berbagai aturan asosiatif dan juga beberapa teknik data mining lainnya. Dari teknik pengerjaan-nya algoritma apriori dibagi menjadi beberapa tahap yang disebut dengan Iterasi. Tiap Iterasi menghasilkan Frequent Pattern Mining dengan panjang yang sama, proses tersebut dimulai dari Iterasi pertama yang menghasilkan Frequent Pattern Mining dengan panjang satu. Di Iterasi pertama ini support dari setiap barang dihitung dengan membaca basis data. Setelah support dipilih sebagai Frequent Pattern Mining dengan panjang 1 atau sering disebut 1-Itemset. Singkatan k-Itemset memiliki arti satu set barang yang berasal dari k set item.
Algoritma apriori adalah algoritma pengambilan data dengan Association Rule untuk menentukan hubungan asosiatif suatu kombinasi barang. Association Rule yang dimaksud dilakukan melalui mekanisme menghitung support dan confidence dari suatu hubungan item. Algoritma apriori ini cocok untuk diterapkan ketika terdapat beberapa hubungan item yang ingin dianalisis. Contoh bidang yang menerapkan algoritma tersebut ialah di bidang kesehatan dan penentuan pola pembelian obat.
Association Rule menjadi terkenal karena aplikasinya untuk menganalisis isi keranjang belanja pelanggan di pasar swalayan, makanya itu sering disebut Market Basket Analysis. Analisis asosiasi di definisikan sebagai suatu proses untuk menemukan semua Association Rule yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). Sebuah Association Rule dikatakan interesting jika nilai support lebih besar dari minimum support dan nilai confidence juga lebih besar dari nilai minimum confidence. Di lain pihak Apriori memiliki kelemahan karena harus melakukan scan basis data setiap kali melakukan iterasi, sehingga waktu yang diperlukan bertambah dengan makin banyak iterasi. Masalah tersebut dapat terselesaikan oleh algoritma-algoritma baru seperti FP-growth.
Suatu Association Rule biasanya dinyatakan dalam bentuk: {roti, mentega} -> {susu} (support = 40%, confidence = 50%). Pernyataan tersebut memiliki arti “Seorang konsumen yang membeli roti dan mentega memiliki kemungkinan 50% untuk membeli susu. Aturan tersebut dinilai cukup signifikan karena mewakili 40% dari catatan transaksi selama ini.”
Association Rule Mining merupakan prosedur untuk mencari hubungan antar barang dalam suatu data-set yang telah ditentukan, proses tersebut meliputi : mencari kombinasi yang sering muncul dari suatu Itemset. dan mendefinisikan condition dan result. Dalam menentukan Association Rule terdapat suatu interestingness dari hasil pengolahan data tertentu. Iterasi kedua menghasilkan 2-Itemset. yang mana setiap set-nya terdiri dari dua barang. Pertama dibuat kandidat 2-Itemset. dari kombinasi semua 1-Itemset. Lalu untuk setiap kandidat 2-Itemset. tersebut dihitung support-nya dengan membaca basis data. Setelah support dari semua kandidat 2-Itemset. diperoleh, kandidat 2-Itemset. yang memenuhi syarat minimum support ditetapkan sebagai 2-Itemset.
Salah satu tahap analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis Frequent Pattern Mining. Parameter Support adalah persentase kombinasi barang dalam basis data yang menjadi objek penelitian. Parameter Confidence adalah nilai kekuatan hubungan antar barang dalam aturan asosiasi tersebut. Frequent Pattern Mining adalah subjek Data Mining dengan objektif melakukan ekstraksi frequent Itemset. dari sebuah basis data. Frequent Pattern Mining merupakan nama lain dari Association Rule Mining. Frequent Pattern Mining adalah sebuah proses analisis yang mencari frequent Pattern, asosiasi atau struktur umum dari data-set yang diperoleh di berbagai jenis penyimpanan data. Frequent Pattern adalah Itemset, subsequences atau substruktur yang muncul pada suatu data-set dengan frekuensi tidak kurang dari ambang batas yang telah ditentukan oleh pengguna. Misalnya satu set barang, seperti susu dan roti yang sering muncul secara bersama-sama dalam suatu kumpulan data transaksi merupakan sebuah frequent Itemset. Algoritma Pattern Mining dapat diterapkan pada berbagai jenis basis data seperti basis data transaksi, basis data sequence, stream, string, spatial data dan grafik. Algoritma Pattern Mining dapat dirancang untuk menangani berbagai jenis pola seperti subgraphs, asosiasi, Indirect Association, tren, pola periodik, Sequential Rule, Sequential Pattern dan Itemset.
Penyelesaian masalah pada proses ekstraksi informasi dari sebuah basis data dilakukan dengan melakukan iterasi frequent Itemset. yang memenuhi aturan Association Rule Mining sehingga menghasilkan nilai support dan confidence. Untuk menghasilkan nilai support dan confidence komputer harus membaca basis data secara berulang sehingga menghasilkan frequent Itemset. cukup banyak. Basis data dengan ukuran yang cukup besar mengakibatkan proses pencairan Association Rule Mining pada algoritma apriori membutuhkan waktu lebih lama, karena semakin besar ukuran basis data maka semakin banyak pula frequent dan candidate generation yang dihasilkan. Sehingga perlu ada metode yang lebih baru untuk mengatasi berbagai frequent item atau Itemset. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut sebagai affinity analysis atau Market basket analysis. Analisis asosiasi atau Association Rule mining adalah teknik data mining untuk menemukan Association Rule antara suatu kombinasi barang. Karena analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisis isi keranjang belanja di pasar swalayan maka analisis asosiasi juga sering disebut dengan istilah Market basket analysis. Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut frequent pattern mining yang menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien.
Algoritma Apriori adalah bagian dari sebuah metode Association Rule yang berfungsi untuk menemukan kombinasi barang berdasarkan barang yang telah dibeli oleh pelanggan. Jenis-jenis Association Rule ada tiga, yaitu: Apriori, Generalized Rule Induction dan Algoritma Hash Based. Association Rule mining merupakan teknik data mining untuk menemukan Association Rule antara suatu kombinasi barang. contohnya Analisis pembelian barang di suatu pasar swalayan, dapat diketahui jumlah kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Hasil analisis dapat digunakan oleh pemilik swalayan untuk mengatur penempatan barang atau membuat rencana promosi penjualan dengan memakai kupon diskon untuk kombinasi barang tertentu. Algoritma apriori merupakan salah satu algoritma klasik data mining. Algoritma tersebut digunakan agar komputer dapat mempelajari aturan asosiasi kemudian mencari pola hubungan antar barang dalam suatu data-set.
Algoritma apriori merupakan salah satu algoritma data mining yang memiliki fungsi untuk menemukan Frequent Pattern Mining. Frequent Pattern Mining adalah barang yang sering muncul pada basis data dan memiliki frekuensi support di atas ambang tertentu yang disebut dengan istilah minimum support. Frequent Pattern Mining tersebut digunakan untuk menyusun berbagai aturan asosiatif dan juga beberapa teknik data mining lainnya. Dari teknik pengerjaan-nya algoritma apriori dibagi menjadi beberapa tahap yang disebut dengan Iterasi. Tiap Iterasi menghasilkan Frequent Pattern Mining dengan panjang yang sama, proses tersebut dimulai dari Iterasi pertama yang menghasilkan Frequent Pattern Mining dengan panjang satu. Di Iterasi pertama ini support dari setiap barang dihitung dengan membaca basis data. Setelah support dipilih sebagai Frequent Pattern Mining dengan panjang 1 atau sering disebut 1-Itemset. Singkatan k-Itemset memiliki arti satu set barang yang berasal dari k set item.
Algoritma apriori adalah algoritma pengambilan data dengan Association Rule untuk menentukan hubungan asosiatif suatu kombinasi barang. Association Rule yang dimaksud dilakukan melalui mekanisme menghitung support dan confidence dari suatu hubungan item. Algoritma apriori ini cocok untuk diterapkan ketika terdapat beberapa hubungan item yang ingin dianalisis. Contoh bidang yang menerapkan algoritma tersebut ialah di bidang kesehatan dan penentuan pola pembelian obat.
Association Rule menjadi terkenal karena aplikasinya untuk menganalisis isi keranjang belanja pelanggan di pasar swalayan, makanya itu sering disebut Market Basket Analysis. Analisis asosiasi di definisikan sebagai suatu proses untuk menemukan semua Association Rule yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). Sebuah Association Rule dikatakan interesting jika nilai support lebih besar dari minimum support dan nilai confidence juga lebih besar dari nilai minimum confidence. Di lain pihak Apriori memiliki kelemahan karena harus melakukan scan basis data setiap kali melakukan iterasi, sehingga waktu yang diperlukan bertambah dengan makin banyak iterasi. Masalah tersebut dapat terselesaikan oleh algoritma-algoritma baru seperti FP-growth.
Suatu Association Rule biasanya dinyatakan dalam bentuk: {roti, mentega} -> {susu} (support = 40%, confidence = 50%). Pernyataan tersebut memiliki arti “Seorang konsumen yang membeli roti dan mentega memiliki kemungkinan 50% untuk membeli susu. Aturan tersebut dinilai cukup signifikan karena mewakili 40% dari catatan transaksi selama ini.”
Association Rule Mining merupakan prosedur untuk mencari hubungan antar barang dalam suatu data-set yang telah ditentukan, proses tersebut meliputi : mencari kombinasi yang sering muncul dari suatu Itemset. dan mendefinisikan condition dan result. Dalam menentukan Association Rule terdapat suatu interestingness dari hasil pengolahan data tertentu. Iterasi kedua menghasilkan 2-Itemset. yang mana setiap set-nya terdiri dari dua barang. Pertama dibuat kandidat 2-Itemset. dari kombinasi semua 1-Itemset. Lalu untuk setiap kandidat 2-Itemset. tersebut dihitung support-nya dengan membaca basis data. Setelah support dari semua kandidat 2-Itemset. diperoleh, kandidat 2-Itemset. yang memenuhi syarat minimum support ditetapkan sebagai 2-Itemset.
Salah satu tahap analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis Frequent Pattern Mining. Parameter Support adalah persentase kombinasi barang dalam basis data yang menjadi objek penelitian. Parameter Confidence adalah nilai kekuatan hubungan antar barang dalam aturan asosiasi tersebut. Frequent Pattern Mining adalah subjek Data Mining dengan objektif melakukan ekstraksi frequent Itemset. dari sebuah basis data. Frequent Pattern Mining merupakan nama lain dari Association Rule Mining. Frequent Pattern Mining adalah sebuah proses analisis yang mencari frequent Pattern, asosiasi atau struktur umum dari data-set yang diperoleh di berbagai jenis penyimpanan data. Frequent Pattern adalah Itemset, subsequences atau substruktur yang muncul pada suatu data-set dengan frekuensi tidak kurang dari ambang batas yang telah ditentukan oleh pengguna. Misalnya satu set barang, seperti susu dan roti yang sering muncul secara bersama-sama dalam suatu kumpulan data transaksi merupakan sebuah frequent Itemset. Algoritma Pattern Mining dapat diterapkan pada berbagai jenis basis data seperti basis data transaksi, basis data sequence, stream, string, spatial data dan grafik. Algoritma Pattern Mining dapat dirancang untuk menangani berbagai jenis pola seperti subgraphs, asosiasi, Indirect Association, tren, pola periodik, Sequential Rule, Sequential Pattern dan Itemset.
Penyelesaian masalah pada proses ekstraksi informasi dari sebuah basis data dilakukan dengan melakukan iterasi frequent Itemset. yang memenuhi aturan Association Rule Mining sehingga menghasilkan nilai support dan confidence. Untuk menghasilkan nilai support dan confidence komputer harus membaca basis data secara berulang sehingga menghasilkan frequent Itemset. cukup banyak. Basis data dengan ukuran yang cukup besar mengakibatkan proses pencairan Association Rule Mining pada algoritma apriori membutuhkan waktu lebih lama, karena semakin besar ukuran basis data maka semakin banyak pula frequent dan candidate generation yang dihasilkan. Sehingga perlu ada metode yang lebih baru untuk mengatasi berbagai frequent item atau Itemset. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut sebagai affinity analysis atau Market basket analysis. Analisis asosiasi atau Association Rule mining adalah teknik data mining untuk menemukan Association Rule antara suatu kombinasi barang. Karena analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisis isi keranjang belanja di pasar swalayan maka analisis asosiasi juga sering disebut dengan istilah Market basket analysis. Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut frequent pattern mining yang menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien.