طبقه بندی داده های نامتعادل چندکلاسه مبتنی بر تجزیه چندکلاسی و بهینه سازی ازدحام ذرات

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 645

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ARGCONF03_023

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

یادگیری یک طبقه بند از یک مجموعه داده نامتعادل یک مسیله مهم در داده کاوی و یادگیری ماشین است. ازآنجاکه اطلاعات بیشتری درباره کلاس های حداکثر نسبت به کلاس های حداقل در یک مجموعه داده نامتعادل وجود دارد، طبقه بند درباره نمونه های کلاس حداکثر دچار بیش برازش میشود. مطالعات قبلی بر افزایش حساسیت یادگیری نسبت به نمونه های کلاس حداقل تمرکز کردهاند و یا از روشهای متوازنسازی قبل از یادگیری، بهره گرفتهاند. اما تعیین اینکه کلاس های حداکثر و حداقل تا چه اندازه باید متوازن شوند، هنوز یک مسیله حل نشده است. بیشتر مطالعات انجام شده، روی مسایل طبقه بندی نامتعادل دوکلاسی تمرکز کرده اند. یکی از متداول ترین روشهای حل مسایل نامتعادل چندکلاسی، تجزیه آنها به یک سری از مسایل نامتعادل دودویی است. از میان این استراتژی ها، روش های تجزیه یکی در مقابل همه و یکی در مقابل یکی توجه زیادی را به خود جلب کرده اند. در این پژوهش، برای حل مسیله طبقه بندی نامتعادل چندکلاسی از تجزیه یکی در مقابل یکی استفاده شده است بدین ترتیب مسیله چندکلاسی به چندین زیر مسیله دوکلاسی تبدیل میشود. برای غلبه بر مشکل عدم توازن در زیر مسیله های دوکلاسی، از ایده ترکیب تجمعی استفادهشده که در آن از الگوریتم های هوش جمعی برای انتخاب ترکیب بهینه از نمونه ها جهت طبقه بندی بهره گرفته شده است. در مقایسه با روش های متداول متوازن سازی مانند جستجوی خطی، روش پیشنهادی میتواند ترکیب های بهینه را با صحت و قابلیت اعتماد بیشتر بیابد. الگوریتم ارایه شده با سایر الگوریتم های موجود مقایسه شده است و نتایج، عملکرد مناسب روش پیشنهادی را در مقایسه با سایر روش ها نشان میدهد.

کلیدواژه ها:

یادگیری نامتعادل - تجزیه چندکلاسی - ترکیب تجمعی-بهینه سازی

نویسندگان

منیژه معصومی

دانشجو کارشناسی ارشد دانشگاه امام رضا ع

عادل قاضی خانی

استادیار و عضو هییت علمی دانشگاه امام رضا ع