MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE
Abstract
Objek penelitian yang akan diteliti pada penelitian ini adalah permasalahan class imbalance yang merupakan salah satu permasalahan utama di dalam klasifikasi data. Salah satu metode yang dapat dipakai untuk menyelesaikan permasalahan class imbalance adalah Hybrid Ensembles. Namun, terdapat 2 (dua) isu utama yang perlu dibahas yaitu masalah jumlah classifier dan diversity data. Peneliti di dalam penelitian akan melakukan proses optimisasi terhadap hybrid ensembles. Peneliti akan mengemukakan model yang menambahkan ensemble learning berbasis sample (sample based). Di dalam model ini peneliti akan melakukan penggabungan penggunaan bagging dengan metode DCS (Differenct Contribution Sampling) yang terbukti dapat mengurangi jumlah classifier dan meningkatkan diversity data dibandingkan dengan menggunakan AdaBoost. Model ini juga akan mengunakan Random Balance Ensemble Method yang menggabungkan random undersampling dengan SMOTEBoost yang dapat digunakan tahapan prepocessing yang ditujukan untuk mengurangi ukuran data training dan meningkatkan diversity dari dataset.
Full Text:
PDFReferences
Chawla, N.V., N. Japkowicz, and A. Kolcz. 2004. Special Issue Learning Imbalanced Datasets. SGIKDD Explor. Newsl 6(1)
Fernandez, A., V. Lopez, M. Galar, M.J.D. Jesus, F. Herrera. 2013. Analysing the Classification of Imbalanced Data-Sets with Multiple Classes: Binarization Techniques and Ad-hoc Approaches. Knowledge-Based Systems 42: 97-110
Galar, M., A. Fernandez, E. Barrenechea, and H. Bustince. 2012. A Review on Ensembles for the Class Imbalance Problem: Bagging, Boosting, and Hybrid-Based Approachs. IEEE Transactions on Systems, Man, and Cybernetics-Part C: Applications and Reviews42(4): 1-21
Galar, M., A. Fernandez, E. Barrenechea, and F. Herrera. 2013. EUSBoost: Enhancing Ensembles for Highly Imbalanced Data-Sets by Evolutionary Undersampling. Pattern Recognition 46: 3460-3471
Jian, C., J. Gao, and Y. Ao. 2016. A New Sampling Method for Classifying Imbalanced Data Based on Support Vector Machine Ensemble. Neurocomputing
Jose, F.D.P., J.J. Rodriguez, C.G. Osorio, and L.I. Kuncheva. 2015. Random Balance: Ensembles of Variable Priors Classifiers for Imbalanced Data. Knowledge-Based Systems85(2015): 96-111
Krawczyk, B., G. Schaefer, M. Wozniak. 2015. A Hybrid Cost-Senstivie Ensemble for Imbalanced Breast Thermogram Classification. Artificial Intelligence in Medicine65 (2015): 219-227
Pengyi, Y. et al. 2014. Sample Subset Optimization Techniques for Imbalanced and Ensemble Learning Problems in Bioinformatics Applications. IEEE Transaction on Cybernetics44 (3): 445-455
Seiffert, C., T. Khoshgoftaar, J.V. Hulse, and A. Napolitano. 2010. RUSBoost: A Hybrid Approach to Alleviating Class Imbalance. IEEE Trans. Syst. Man. Cybern. A. Syst 40(1): 185-197
DOI: https://doi.org/10.29103/techsi.v8i2.134
Article Metrics
Abstract Views : 428 timesPDF Downloaded : 3 times
Refbacks
- There are currently no refbacks.
Copyright (c) 2019 Hartono Hartono
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Indexed by:
© Copyright of Journal TECHSI, (e-ISSN:2614-6029, p-ISSN:2302-4836).
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.