SVBO: Support Vector-Based Oversampling for Handling Class Imbalance in k-NN

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,239

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE20_034

تاریخ نمایه سازی: 14 مرداد 1391

چکیده مقاله:

We propose a novel algorithm for handling class imbalance in the k-NN classifier. Class imbalance is a problem occurring in some valuable data such as medical diagnosis,fraud detection, oil spills and etc. The problem influences all supervised classification algorithms therefore a large amount ofresearch is being done. We tackle the problem by preprocessing the data using oversampling techniques. A two phase algorithm, based on Support Vector Data Description (SVDD) is proposed.SVDD is a tool for data description. In our approach we firstly describe data from the minority class i.e. the class with lessdata using SVDD. This is followed by oversampling of the support vectors, which is suitable for k-NN. We evaluate ourmethod using real world datasets with different imbalance ratios and compare it with four other oversampling methods namely SMOTE, Borderline SMOTE, random oversampling and cluster based sampling. The results show that the proposed algorithm is a suitable preprocessing method for the k-NN classifier

کلیدواژه ها:

Class Imbalance ، Oversampling ، Support Vector Data Description ، k-NN

نویسندگان

Adel Ghazikhani

PhD student, Ferdowsi University of Mashhad and Lecturer at Imam Reza University Mashhad

Reza Monsefi

Assistant professor, Computer Engineering Department, Ferdowsi University of Mashhad

Hadi Sadoghi Yazdi

Associate professor, Computer Engineering Department, Ferdowsi University of Mashhad

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • H. He, E. A. Garcia, "Learning from Imbalanced Data, " ...
  • R. Batuwita, V. Palade, _ Fuzzy Support Vector Machines for ...
  • Reasoning, vol. 50, pp. 561-577, 2009. ...
  • _ _ _ In Proc. AAMAS02 15-19 2002. ...
  • X.Y. Liu, J. Wu, and Z.H. Zhou, "Exploratory Under Sampling ...
  • _ _ _ V _ _ Proc. Int1 Conf. Machine ...
  • _ _ _ CLASS IMB ALANCE, " IEEE Trans. ON ...
  • H. Han, W.Y. Wang, and B.H. Mao, _ :B orderline- ...
  • _ _ _ Advanced Information Networking and Applications Workshops, pp. ...
  • نمایش کامل مراجع