ارائه ناحیه بندی S-B جهت انتخاب بهتر مرکز داده در الگوریتم خوشه بندی K-means
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 550
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TEDECE02_026
تاریخ نمایه سازی: 21 شهریور 1395
چکیده مقاله:
یکی از ابتدایی ترین روش ها برای تحلیل مسئله های مختلف استفاده از الگوها و بررسی آنهاست. خوشه بندی روشی مفید برای کشف توزیع داده ها و الگوهای موجود در داده می باشد. در نظام های بازیابی اطلاعات، خوشه بندی نقشی مؤثر ایفا می کند. از این رو تصحیح در خوشه بندی مورد توجه قرار می گیرد.یکی از الگوریتم های خوشه بندی اطلاعات K-means است که جزء پرکاربردترین الگوریتم ها در این زمینه است. از مزایای آن می توان از سادگی و سرعت بالایاین الگوریتم و از معایب آن، انتخاب نقاط اولیه به صورت تصادفی و تاثیر نقاط اولیه بر مراکز خوشه ها نام برد. در الگوریتم مذکور، مراکز خوشه ها به صورت تصادفی انتخاب می گردد که موجب می شود نتایج خوشه بندی ناپایدار باشد. در این راستا روشی در جهت بهبود این الگوریتم ارائه گردیده است. در این روش در نظر است که اثر وجود نقاط نویزدار کمتر شود، به همین جهت به ناحیه بندی نقاط یک مجموعه قبل از اجرای الگوریتم پرداخته می شود. با استفاده از نرم افزار متلب به همراه تعدادی از مجموعه داده های استاندارد UCI و شاخص های ارزیابی خوشه بندی، این نتیجه حاصل می شود که ناحیه بندی پیشنهادی تاثیر انتخاب تصادفی نقاط اولیه را کاهش داده و احتمال انتخاب خوشه ای فاقد داده را به صفر می رساند
کلیدواژه ها:
نویسندگان
بهنوش کریمی مفرح
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد تهران شمال
کامران لایقی
استادیار دانشگاه آزاد اسلامی واحد تهران شمال
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :