استفاده از خوشهبندی برای کلاسبندی دادههای نامتوازن

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,093

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC02_141

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینهی دادهکاوی قرار گرفته است. در موارد متعددی کلاسی که از نقطه نظر دامنهی کاربردی اهمیت زیادی دارد(کلاس اصلی) شامل تعداد حالات کمتری نسبت به کلاسی است که کلاس اکثریت میباشد. این مجموعهی دادهها نامتوازن نامیده میشود. رویکرد سنتی دادهکاوی توانایی خوبی برای پیشبینی نمونههای اقلیت که مورد توجه است ندارند. متأسفانه در اکثر موارد دادههای واقعی دارای این خصوصیت هستند. به عنوان مثال در تشخیص بیماریهای نادر، حملات شبکه، متنکاوی و ... معمولاً توزیع دادهها نامتوازن می باشد . در این مقاله روشی بر مبنای خوشهبندی دادهها برای کلاسبندی دادههای نامتوازن پیشنهاد شده است . در روش پیشنهادی با استفاده از خوشه بندی، خوشه هایی از داده ها ایجاد میشود. سپس این خوشه ها مجدداً توصیف میشوند و کلاس بندی بر مبنای این خوشه ها انجام میشود. در این مقاله نشان دادیم که با استفاده از این روش بر روی مجموعه های مختلفی از داده های نامتوازن معیارهای مورد نظر به اندازهای قابل توجه بهبود یافته است.

کلیدواژه ها:

مجموعه داده های نامتوازن ، کلاسبندی داده ها ، خوشه بندی داده ها

نویسندگان

محمد حمزه ئی

دانشجوی کارشناسی ارشد، دانشگاه علم و صنعت ایران

مجتبی اکبرزاده

دانشجوی کارشناسی ارشد، دانشگاه علم و صنعت ایران