Metode Penelitian Data Mining Asosiasi FP-Growth

Penelitian ini menggunakan jenis penelitian eksperimen, dengan tahapan penelitian sebagai berikut:
  1. Pengumpulan Data
  2. Pengolahan Data
  3. Pengujian
  4. Kesimpulan

1. Pengumpulan Data
Pengumpulan data ini dilakukan secara kuantitatif, dengan mengambil dataset analisis keranjang pasar, Dalam dataset ini mendefinisikan transaksi penjualan pada sebuah supermarket. Terdapat 8 atribut yang merupakan barang dan terdapat 25 record transaksi.

Contoh Dataset default  bertype bolean
Contoh Dataset default bertype bolean

2. Pengolahan Data
Dalam point ini data akan diolah dengan beberapa tahap sehingga menjadi sebuah dataset yang akan diimplementasikan terhadap metode-metode data mining. Semua record transaksi yang ada pada dataset penjualan digunakan dalam tahap pengolahan data.

Tahapan pengolahan data yang dilakukan yaitu:

2.1 Data Preprocessing
Data Preprocessing yaitu dilakukan pembersihan dan persiapan data untuk menghilangkan kosistensi data, data tidak lengkap dan redundant data yang terdapat pada data awal. Data Preprocessing juga melakukan pengubahan status barang yang semula true / false menjadi 1 / 0, yang akan digunakan untuk proses asosiasi.

2.2 Menghitung Jumlah Barang yang Dibeli / Tidak Dibeli
Penghitungan jumlah barang yang dibeli maupun yang tidak dibeli dilakukan dengan menambah 2 atribut di dalam dataset, kedua atribut tersebut digunakan untuk melakukan proses clustering data.

Menghitung barang dibeli dan tidak dibeli
Menghitung barang dibeli dan tidak dibeli

3. Pengujian
Dalam pengujian ini saya menggunakan bagian dari dataset yang ada. Sebelum pengujian dilakukan, dataset yang ada harus sudah di clustering menjadi beberapa cluster. Setiap cluster yang dihasilkan dari proses clustering akan dilakukan asosiasi dengan FP-Growth untuk menghasilkan rekomendasi produk.

3.1 Clustering Dengan K-Medoids
K-Medoids merupakan fungsi statistik yang digunakan untuk mengevaluasi hasil dari algoritma clustering secara kuantitatif. Secara umum, K-Medoid bertujuan untuk menentukan apakah jumlah kelas yang di proses nanti oleh (K-Means) yang terbentuk optimal atau tidak.

Dengan fungsi k-medods ini bertujuan mendapatkan nilai davies-bouldin, karena semakin kecil nilai davies-bouldin, maka nanti, pada point asosiasi FP-Growth akan semakin baik hasilnya.

Proses mendapatkan nilai davies-bouldin dengan K-Medoids
Proses mendapatkan nilai davies-bouldin dengan K-Medoids

Nilai Optimal

3.2 Clustering Data Dengan K-Means
Clustering Data Dengan K-Means bertujuan untuk membagi data menjadi 7 clustering dan hasilnya akan di export dalam bentuk excel untuk metode selanjutnya yaitu asosiasi FP-Growth.

Sebagai contoh kami melakukan proses clustering dengan K-Means pada gambar dibawah ini :

Proses Clustering data
Proses Clustering data

Hasil Clustering
Hasil Clustering

Hasil clustering yang di export
Hasil clustering yang di export

3.3 Asosiasi FP-Growth
Setiap cluster pada gambar di atas akan dilakukan asosiasi dengan FP-Growth untuk menghasilkan rekomendasi produk.

Untuk menghasilkan rekomendasi produk maka akan dilanjutkan dengan proses Create Association Rule. Seperti contoh gambar dibawah ini :

Proses asosiasi FP-Growth
Proses asosiasi FP-Growth

Hasil rule serta nilai confidence
Hasil rule serta nilai confidence

Hasil frequent sertan nilai support
Hasil frequent serta nilai support

4. Kesimpulan / (Evaluasi Penelitian)
Hasil akurasi untuk menentukan rekomendasi produk kepada pelanggan yang didapat dari penelitian ini dapat diukur dengan menggunakan Lift Ratio. Lift Ratio merupakan nilai yang menunjukkan kevalidan proses transaksi dan memberikan informasi apakah benar produk A dibeli bersamaan dengan produk B. Sebuah transaksi dikatakan valid jika mempunyai nilai Lift Ratio lebih dari 1, yang berarti bahwa dalam transaksi tersebut, produk A dan B benar-benar dibeli secara bersamaan.
Lift Ratio mengukur seberapa penting rule yang telah terbentuk berdasarkan
nilai support dan confidence.

Comments