بهبود زمان اجرای الگوریتم خوشه بندی k-means با استفاده از خلاصه سازی داده های ورودی و مدل نگاشت - کاهش

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 763

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC01_386

تاریخ نمایه سازی: 9 فروردین 1395

چکیده مقاله:

الگوریتم k-means یکی از کاربردی ترین الگوریتم های خوشه بندی می باشد، که به دلیل سادهو قابل فهم بودن مورد توجه قرار گرفته است. در حالت کلی زمانی که حجم داده های ورودی بهالگوریتم خوشه بندی k-means زیاد شود، کارایی آن به دلیل محاسبات زیاد کاهش می یابد. دراین مقاله، یک الگوریتم خوشه بندی تقریبی مبتنی بر k-means را ارائه می کنیم که در آن باخلاصه سازی داده ها حجم محاسبات تا حد زیادی کاهش می یابد. فرآیند خلاصه سازی داده ها برمبنای دو پارامتر فاصله و زاویه داده ها از یک مبدا مختصات انجام شده و داده های نزدیک به هم بهعنوان یک مجموعه در نظر گرفته می شوند. سپس نماینده وزنی داده ها جایگزین مجموعه دادهمی گردد. از سوی دیگر برای کاهش زمان اجرا از مدل موازی نگاشت کاهش برای خلاصه سازی -داده های ورودی و همچنین اجرای الگوریتم، استفاده می کنیم. پیاده سازی الگوریتم پیشنهادی ومقایسه آن با خوشه بندی مرسوم k-means نشان دهنده بهبود پیچیدگی زمانی خوشه بندی به مقدارقابل توجه می باشد.

کلیدواژه ها:

نویسندگان

محدثه درویش زاده

گروه کامپیوتر، پردیس علوم و تحقیقات شاهرود، دانشگاه آزاد اسلامی واحد شاهرود، ایران

هدی مشایخی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه شاهرود، شاهرود، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
  • Arthur, David and Sergei Vassilvitskii. (2007). K-Means++- The advantages of ...
  • Bahmani, Bahman; Benjamin Moseley; Andrea Vattani. (2012). Scalable K-Means _ ...
  • Cai, Deng; Xiaofei He; Jiawei Han. (2005). Document Clustering Using ...
  • Dean, Jeffrey and Sanjay Ghemawat. (2008). MapReduce: Simplified Data Processing ...
  • Ester, Martin; Hans-Peter Kriegel; Jiirg Sander, Xiaowei Xu. (1996). A ...
  • Harting. J.A and M.A Wong. (1979). Algorithm AS 136: A ...
  • Sander, Jorg; Martin Ester; Hans-Peter Kriegel; Xiaowei Xu. (1998). Density-based ...
  • databases: The algorithm GDBSCAN and its applications. Data Mining and ...
  • Singh, Dilpreet and Chandan K Reddy. (2014). A survey on ...
  • Szekely, Gabor and Maria Rizzo. (2005). Hierarchical clustering via Joint ...
  • extending ward's minimum variance method. Jourmal of Classification Vol. 22. ...
  • Welcome to ApacheT* Hadoop@!". hadoop. apache.org. Retrieved 2015-09-20. Zhang, Jinsong; ...
  • نمایش کامل مراجع