ارائه روشی جدید مبتنی بر الگوریتم K-Means برای حل مسئله خوشه بندی توزیع شده

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 4,001

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTM05_015

تاریخ نمایه سازی: 5 بهمن 1388

چکیده مقاله:

خوشه بندی عملیاتی است که روی مجموعه ای از داده ها انجام شده و آنها را به دسته هایی منفصل تقسیم می کند طوری که حداقل شباهت بین داده های موجود در دسته های مجزا و حداکثر شباهت بین داده های موجود در یک دسته وجود داشته باشد یکی از مهمترین مسائل مطرح در این زمینه نحوه مدیریت و اعمال تکنیک های خوشه بندی روی داده هایی است که به صورت طبیعی در سایت های توزیع شده تولید و نگهداری می شوند دراین مقاله روشی برای اعمال خوشه بندی به صورت متمرکز بدون ارسال کامل داده ها به سایت مرکزی ارائه گردیده است برای این کار به جای ارسال کل داده ها تنها بخشی از آنها به نمایندگی از سایرین ارسال می گردند همچنین اطلاعات اماری داده هایی که فرستاده نمیشوند به سایت مرکزی ارسال می شوند تا در انجا بتوان دوباره داده ها را به صورت تقریبی بازسازی کرد بااستفاده از این روش بدون صرف هزینه اضافی برای انتقال کل داده ها به سایت مرکزی عملیات خوشه بندی به طرز موثری انجام خواهد شد.

کلیدواژه ها:

داده کاوی ، خوشه بندی ، خوشه بندی توزیع شده ، استخراج دانش ، سیستم های توزیع شده ، موازی سازی

نویسندگان

سمانه حسینی سمنانی

دانشجوی دکترای دانشکده فنی و مهندسی دانشگاه اصفهان

کامران زمانی فر

عضو هیئت علمی دانشکده فنی و مهندسی دانشگاه اصفهان