ارائه روش جدید نمونه گیری مبتنی بر رتبه بندی نمونه ها و خوشه بندی کاهشی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,501

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CESD01_028

تاریخ نمایه سازی: 25 اسفند 1392

چکیده مقاله:

در مسائل طبقه بندی تعداد نمونه های هر کلاس می تواند متفاوت باشد در مسائل طبقه بندی باینری، مساله عدم توازن هنگامی رخ می دهد که یک کلاس تعداد نمونه های بسیاری دارد در حالی که کلاس دیگر توسط تعداد نمونه های کمی نمایش داده می شود. در این مقاله بر روی روش های under-sampling (نمونه گیری از داده های با کلاس اکثریت) تمرکز می کنیم در روش پیشنهادی ابتدا با استفاده از روش خوشه بندی کاهشی، نمونه های اکثریت را به تعدادی خوشه تقسیم و سپس با رتبه بندی نمونه های هر خوشه، تعدادی نمونه انتخاب می کنیم. نمونه های اکثریت انتخاب شده با همراه نمونه های اقلیت، مجموعه داده نهایی را تشکیل می دهند. آزمایش را بر روی 20 مجموعه داده از مجموعه داده های KEEL اجرا و سپس نتایج بدست آمده را با استفاده از تست های آماری تحلیل می کنیم. نتایج حاصل نشان می دهد که کارایی الگوریتم طبقه بندی با استفاده از روش پیشنهادی بهبود می یابد.

نویسندگان

محبوبه مهدی زاده

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه شهید باهنر کرمان

مهدی افتخاری

عضو هیات علمی دانشگاه شهید باهنر کرمان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • T. S. Lee, and I. F. Chen, A two-stage hybrid ...
  • Q. Yang and X. Wu, 10 challenging problems in data ...
  • V. Lopez, A. Fernandez, J. G. Moreno -Torres, and F. ...
  • H. Yu, J. Ni, and J. Zhao, ACOSampling: An ant ...
  • _ J. Berlanga, A. Rivera, M. J. del Jesus, F. ...
  • J. Alcala, A. Fernandez, J. Luengo, J. Derrac, S. Garcia, ...
  • A. Estabrooks, T. Jo, and N. Japkowicz, A multiple resampling ...
  • S.-J. Yen and Y.-. Lee, Cluster-based under- sampling approaches for ...
  • I. Tomek, Two modifications of CNN, IEEE Transactions _ Systems, ...
  • P.E. Hart, The Condensed Nearest Neighbor Rule, IEEE Transactions _ ...
  • J. Liang, L. Bai, C. Dang, and F. Cao, The ...
  • H. Izakian, and A. Abraham, Fuzzy C-means and fuzzy swarm ...
  • D.-W. Kim, K. Lee, D. Lee, and K. H. Lee, ...
  • M.-Y. Chen, A hybrid ANFIS model for business failure prediction ...
  • Y. Sun, M. S. Kamel, A. K. Wong, and Y. ...
  • J. Laurikkala. Improving Identification of Difficult Small Classes by Balancing ...
  • S. Yen, Y. Lee. Under- sampling approaches for improving prediction ...
  • M. Kubat, S. Matwin. Addressing the curse of imbalanced training ...
  • M. Cortina-Borja, Handbook of Parametric and Nonparametric Statistical Procedures, ed: ...
  • S. Garcia, A. Fernandez, J. Luengo, and F. Herrera, Advanced ...
  • S. Holm, A simple sequentially rejective multiple test procedure, Scandinavian ...
  • H. Finner, On a monotonicity problem in step-down multiple test ...
  • نمایش کامل مراجع