Pengenalan Konsep Model Machine Learning: Random Forest Classification


Pengenalan Konsep Model Machine Learning: Random Forest Classification

Deskripsi Singkat Mengenai Random Forest Classification

Machine Learning merupakan bagian dari AI (Artificial Intelligence) yang digunakan untuk melatih komputer dalam mempelajari data dengan kapasitas yang besar agar menghasilkan analisis maupun prediksi. Di dalam machine learning terdapat berbagai model yang digunakan untuk melakukan analisis maupun prediksi, salah satunya adalah Random Forest Classification.

Random Forest Classification merupakan algoritma machine learning berbasis "Tree" atau bisa disebut "Percabangan" yang mana algoritma tersebut dapat menggunakan feature yang ada di dalam dataset untuk menghasilkan decision tree.

 

Cara Kerja Random Forest Classification

Random Forest Classification menggunakan teknik ensemble, simpelnya teknik ensemble merupakan teknik yang menggunakan penggabungan beberapa model (bisa dikatakan membentuk beberapa layer yang bercabang) dalam melakukan prediksi untuk menghasilkan output berdasarkan data yang diberikan. Teknik Ensemble yang ada di dalam Random Forest Classification menggunakan metode Bagging.

Metode Bagging merupakan metode yang membentuk subset training berdasarkan dari sample training dataset dan di voting subset training mana yang menghasilkan prediksi yang paling dominan, dari prediksi dominan tersebut dhasilkanlah output.

 

 

 

Dari arsitektur random forest classification tersebut. Hal pertama yang dilakukan adalah random forest adalah mengambil input dari dataset secara acak atau random, selanjutnya dibentuklah decision tree (Tree 1, Tree 2, Tree 3), setiap decision tree tersebut menghasilkan output(Class 1, Class 2, Class 3) selanjutnya output tersebut akan di voting, karena usecasenya classification maka di voting berdasarkan yang paling dominan (Final Class), sedangkan usecase regresi berbeda lagi, pengambilan output diambil berdasarkan nilai rata-ratanya(Final Class).

 

Contoh Kasus Pemakaian Algortima Random Forest Classification

  • Credit Card Fraud Detection

Di dalam perusahaan bank yang menyediakan kartu kredit rentan dengan kasus penipuan kartu kredit yang mana membuat para pemiliki kartu kredit harus membayar barang yang tidak mereka beli. Adanya 1000 kasus penipuan dalam jutaan transaksi yang ketika dibentuk datasetnya, membuat dataset tersebut tidak seimbang(imbalance) sehingga sulit untuk dilakukan dengan simple classification. Dengan adanya algortima Random Forest Classification dapat memudahkan deteksi penipuan penggunaan kartu kredit

  • ​​​​​Image Detection

Random Forest Classification berguna untuk melakukan prediksi klasifikasi sebuah gambar. Misalkan katakan saja ada tiga gambar hewan seperti, gajah, jerapah dan harimau. Ketiga gambar tersebut ingin diprediksi oleh model Random Forest setelah melalui image processing seperti, VGG atau Resnet, setelah melalui proses tersebut, maka dilanjutkan dengan melakukan prediksi identifikasi gambar hewan menggunakan Random Forest Classification dengan metode voting pada decision tree seperti yang dijelaskan pada gambar arsitektur sebelumnya dalam menentukan atau mengidentifikasi ketiga gambar tersebut.