MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE

Hartono Hartono

Abstract


Objek penelitian yang akan diteliti pada penelitian ini adalah permasalahan class imbalance yang merupakan salah satu permasalahan utama di dalam klasifikasi data. Salah satu metode yang dapat dipakai untuk menyelesaikan permasalahan class imbalance adalah Hybrid Ensembles. Namun, terdapat 2 (dua) isu utama yang perlu dibahas yaitu masalah jumlah classifier dan diversity data. Peneliti di dalam penelitian akan melakukan proses optimisasi terhadap hybrid ensembles. Peneliti akan mengemukakan model yang menambahkan ensemble learning berbasis sample (sample based). Di dalam model ini peneliti akan melakukan penggabungan penggunaan bagging dengan metode DCS (Differenct Contribution Sampling) yang terbukti dapat mengurangi jumlah classifier dan meningkatkan diversity data dibandingkan dengan menggunakan AdaBoost. Model ini juga akan mengunakan Random Balance Ensemble Method yang menggabungkan random undersampling dengan SMOTEBoost yang dapat digunakan tahapan prepocessing yang ditujukan untuk mengurangi ukuran data training dan meningkatkan diversity dari dataset.


Full Text:

PDF

References


Chawla, N.V., N. Japkowicz, and A. Kolcz. 2004. Special Issue Learning Imbalanced Datasets. SGIKDD Explor. Newsl 6(1)

Fernandez, A., V. Lopez, M. Galar, M.J.D. Jesus, F. Herrera. 2013. Analysing the Classification of Imbalanced Data-Sets with Multiple Classes: Binarization Techniques and Ad-hoc Approaches. Knowledge-Based Systems 42: 97-110

Galar, M., A. Fernandez, E. Barrenechea, and H. Bustince. 2012. A Review on Ensembles for the Class Imbalance Problem: Bagging, Boosting, and Hybrid-Based Approachs. IEEE Transactions on Systems, Man, and Cybernetics-Part C: Applications and Reviews42(4): 1-21

Galar, M., A. Fernandez, E. Barrenechea, and F. Herrera. 2013. EUSBoost: Enhancing Ensembles for Highly Imbalanced Data-Sets by Evolutionary Undersampling. Pattern Recognition 46: 3460-3471

Jian, C., J. Gao, and Y. Ao. 2016. A New Sampling Method for Classifying Imbalanced Data Based on Support Vector Machine Ensemble. Neurocomputing

Jose, F.D.P., J.J. Rodriguez, C.G. Osorio, and L.I. Kuncheva. 2015. Random Balance: Ensembles of Variable Priors Classifiers for Imbalanced Data. Knowledge-Based Systems85(2015): 96-111

Krawczyk, B., G. Schaefer, M. Wozniak. 2015. A Hybrid Cost-Senstivie Ensemble for Imbalanced Breast Thermogram Classification. Artificial Intelligence in Medicine65 (2015): 219-227

Pengyi, Y. et al. 2014. Sample Subset Optimization Techniques for Imbalanced and Ensemble Learning Problems in Bioinformatics Applications. IEEE Transaction on Cybernetics44 (3): 445-455

Seiffert, C., T. Khoshgoftaar, J.V. Hulse, and A. Napolitano. 2010. RUSBoost: A Hybrid Approach to Alleviating Class Imbalance. IEEE Trans. Syst. Man. Cybern. A. Syst 40(1): 185-197




DOI: https://doi.org/10.29103/techsi.v8i2.134

Article Metrics

 Abstract Views : 401 times
 PDF Downloaded : 3 times

Refbacks

  • There are currently no refbacks.


Copyright (c) 2019 Hartono Hartono

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

 


Indexed by:

          

Google Scholar
   
 

 


© Copyright of Journal TECHSI, (e-ISSN:2614-6029, p-ISSN:2302-4836).

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.