استفاده از الگوهای مرزی و غیر مرزی در طبقه بندی داده های نامتوازن

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 594

فایل این مقاله در 10 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF03_129

تاریخ نمایه سازی: 6 اردیبهشت 1396

چکیده مقاله:

مسیله کلاس های نامتوازن مشکلی است که اکثر طبقه بندها در برخورد با این کلاس ها خوب عمل نمی کنند. اکثر طبقه بندها در تشخیص کلاس اقلیت و اکثریت دیتاست های نامتوازن به خطا می انجامند. برای برخورد با این مشکل محققان، ابتدا سایز کلاس ها را متوازن می کنند. برای انجام این کار از روش های under sampling کلاس اکثریت و یا over sampling کلاس اقلیت استفاده می شود. سپس دادهای متوازن شده را برای آموزش طبقه بند مورد استفاده قرار می دهند. این عمل منجر به ایجاد الگوهای موردعلاقه برای انجام عمل طبقه بندی می شود. از طرفی با انجام متوازن کردن کلاس ها، می توان مقدار پارامتر AUC را افزایش داد. AUC یک کمیت اندازه گیری خوب برای بیان میزان کارایی طبقه بندی است. در این مقاله، ما با استفاده از روش های جداسازی الگوهای مرزی و غیر مرزی، کلاس اکثریت و اقلیت را به این دو مجموعه تبدیل می کنیم. تحت عمل under sampling الگوهای مرزی کلاس اکثریت را حذف می کنیم. این به نوعی باعث متوازن شدن دیتاست نامتوازن می شود. نتیجه این که کمیت AUC بهبود داده می شود. آزمایش های انجام شده بهبود AUC را نسبت به سایر الگوریتم ها نشان می دهد.

کلیدواژه ها:

الگوهای مرزی و غیرمرزی ، داده های نامتوازن ، کلاس بندی داده ، طبقه بندی داده ها

نویسندگان

علی یعقوبی

کارشناس ارشد مهندسی نرم افزار موسسه آموزش عالی پارس رضوی شهرستان گناباد

حمیدرضا رضاپور

دانشجوی کارشناسی ارشد هوش مصنوعی آستان قدس رضوی-کتاخانه امام رضا(ع)

محسن کرامتی شهری

دانشگاه آزاد اسلامی مشهد، واحد مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Mollineda, V. G. J. S. R., and R. A. J. ...
  • Akbani R, Kwek S, Japkowicz N: Applying Support Vector Machines ...
  • Z. Jin, J.Y. Yang, Z.S. Hu, Z. Lou, Face recognition ...
  • M. Loog, R.P.W. Duin, R. Haeb-Umbach, Multiclass Linear Dimension Reduction ...
  • Yaghoubi, A., & Ghaffari, H. R. Improved LDA by using ...
  • _ Loog and R.P.W. Duin, "Non-Iterative Heteros cedastic Linear Dimension ...
  • Fisher, R. A. (1936). The use of multiple measuremens in ...
  • J.H. Na, S.M. Yun, M. Kim, J.Y. Choi, Relevant Pattern ...
  • Duda R, Hart P, Stork D:Pattern Classification 2nd edition. New ...
  • Salvi, Giampiero. "Accent clustering in Swedish using the Bhattacharya distance." ...
  • Na, J. H., Park, M. S., & Choi, J. Y. ...
  • Fisher, Ronald A. "The Luse of multiple measurement in taxonomic ...
  • Duin, R. P. W., & Loog, M. (2004). Linear dimensionality ...
  • J. Alcala-Fdez, A. Fernandez, J. Luengo, J. Derrac, S. Garcia, ...
  • Ding, S., Zhang, S., Li, Y, & Wang, T. (2012). ...
  • prediction method based on predicted secondary structure. Biochimie, 94(5), 1166- ...
  • Tom Fawcett, "An introduction to ROC analysis", Elsevier, Pattern Recognition ...
  • Friedman, Jerome H. "Regularized discriminant analysis. " Journal of the ...
  • Masip, David, Ludmila I. Kuncheva, and Jordi Vitria. "An ens ...
  • Transactions On Patter Analysis And Machine Intelligence, Vol. 23, No. ...
  • نمایش کامل مراجع