ارائه یک روش جدید برای خوشه بندی داده ها با بهینه سازی الگوریتم K-means توسط الگوریتم سنجاقک

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 652

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECMM02_130

تاریخ نمایه سازی: 7 آبان 1398

چکیده مقاله:

خوشه بندی قابلیت ورود به فضای داده و تشخیص ساختارش را امکان پذیر می نماید. لذا به عنوان یکی از ایده آل ترین مکانیزیم ها، برای کار با دنیای عظیم داده ها محسوب می شود. به بیان ساده می توان گفت که خوشه بندی قرار دادن داده ها در گروه هایی است که اعضای هر گروه از زاویه خاصی شبیه یکدیگرند و در نتیجه شباهت بین داده های درون هر خوشه حداکثر و شباهت بین داده های درون خوشه های متفاوت حداقل می باشد. معیار شباهت در اینجا، فاصله است یعنی نمونه هایی که به یکدیگر نزدیکترند در یک خوشه قرار می گیرند. به عنوان نمونه در خوشه بندی اسناد دوری و یا نزدیکی متناسب با تعداد کلمه های مشترکی است که در دو سند وجود دارد و یا در خوشه بندی سبد خرید مشتریان، فاصله براساس شباهت خرید تعیین می شود. یکی از روش های معروف در این زمینه k-means می باشد که علی رغم وابستگی به شرایط اولیه و همگرائی به نقاط بهینه محلی، تعداد N داده را به k خوشه با سرعت بالا، دسته بندی می نماید. در این پژوهش جهت رفع مشکلات موجود از روش خوشه بندی ترکیبی مبتنی بر الگوریتم سنجاقک و الگوریتم k-means بهره گرفته خواهد شد؛ الگوریتم سنجاقک یک تکنیک جدید ر بهینه سازی هوشمند برای حل مسائل گوناگون است.

کلیدواژه ها:

الگوریتم فرا اکتشافی سنجاقک ، خوشه بندی داده ها ، الگوریتم k-means ، الگوریتم فرا ابتکاری ، بهینه سازی هوشمند

نویسندگان

ناهید ابراهیمی

دانشجو، گروه کامپیوتر، واحد کرمان، دانشگاه آزاد اسلامی، کرمان، ایران

وحید خطیبی

استادیار، گروه کامپیوتر، واحد بردسیر، دانشگاه آزاد اسلامی، بردسیر، ایران