CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود دقت خوشه بندی روش CLARANS برای مجموعه داده های بزرگ

عنوان مقاله: بهبود دقت خوشه بندی روش CLARANS برای مجموعه داده های بزرگ
شناسه ملی مقاله: NCCOS03_122
منتشر شده در سومین همایش ملی کامپیوتر در سال 1394
مشخصات نویسندگان مقاله:

مرضیه معصومی چنار - دانشجوی کارشناسی ارشد علوم کامپیوتر دانشگاه آزاد اسلامی واحد شبستر
شاهین اکبر پور - استادیار گروه کامپیوتر دانشگاه آزاد اسلامی واحد شبستر

خلاصه مقاله:
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده های ذخیره شده درآنها نیاز به استخراج اطلاعات و دانش سودمند ازآنها می باشد باخوشه بندی میتوان داده های حجم بالا را درگروه های مشابه قراردادتاکشف اطلاعات مفید ازآنها اسان تر شود الگوریتم CLARANS برای خوشه بندی داده های حجم بالا به کارمیرود ولی اگرتعدادنمونه ها بیشتر باشد زمان رسیدن به خوشه بندی بهتر افزایش خواهد یافت دراین مقاله براساس الگوریتم CLARANS الگوریتم جدیدی پیشنهاد شده که باسرعت بالا خوشه بندی داده ها را انجام میدهد الگوریتم پیشنهادی براساس دوایده ارایه شده که درایده اول درهرمرحله بجای انتخاب تصادفی مراکز اولیه خوشه ها ازکل داده ها نمونه برداری را بصورت تصادفی ازداده های مرزی انجام میدهیم و درایده دوم برای پیدا کردن همسایگی های یک جواب بجای استفاده ازتمامی داده ها به عنوان جایگزین برای یک مرکز نزدیک ترین داده های موجودبرای یک مرکز به عنوان جایگزین آن استفاده میگردد

کلمات کلیدی:
خوشه بندی داده های حجم بالا ، الگوریتم خوشه بندی افرازی ، الگوریتم CLARANS ، مراکز خوشه ها ، سرعت الگوریتم

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/482073/