تکنیک های داده کاوی برای کاوش دانش در مجموعه داده های بزرگ

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,628

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCONF01_087

تاریخ نمایه سازی: 14 آذر 1394

چکیده مقاله:

درهرجهان واقعی یک حجم وسیعی ازاطلاعات وجود دارد بنابراین اداره نمودن موثر این داده ها یک مسئله چالش برانگیز و قابل توجه است ازاین رو دراین مقاله ابتدا یک ترکیبی ازالگوریتم k-means موازی و روش رابط انتقال پیام MPI به نام Mkmeans ارایه میشود سپس یک متدولوژی برای کشف مکعبهای علاقه مندی ها درپایگاه داده های چندبعدی و بزرگ ارایه میشود درمتدلوژی پیشنهادی ازتکنیکهای تحلیل مولفه اصلی PCA و تحلیل تناظر چندگانه MCA به منظور کاهش داده استفاده میشود این رویکرد برخلاف تحقیقات گذشته به یک دامنه خاصی ازدانش تکیه ندارد مراحل این متدلوژی عبارتنداز: خوشه بندی کل پایگاه داده با استفاده ازالگوریتم سلسله مراتبی متراکم شونده /اعمال تکنیکهای تحلیل مولفه اصلی PCA برروی متغیرهای عددی و تحلیل تناظر چندگانه MCA برروی متغیرهای اسمی /ایجادشمار چندبعدی /ایجادمکعب داده بامعنی /استخراج دانش ازطریق مسیرهای درجه بالا /این متدلوژی روی یک مجموعه داده واقعی پیاده سازی شده است نتایج ازمایشی نشان میدهد که ازنظر اماری و کاربردی بسیارمفید می باشد الگوریتم ترکیبی Mkmeans درمحیطهای موازی بسیارمفید و کاربردی است نتایج ازمایشی نشان میدهد که این الگوریتم ترکیبی نسبتا پایدار وقابل حمل است و برای حجم بالای داده ها مرتبه زمانی پایینی دارد

کلیدواژه ها:

الگوریتم ترکیبی Mkmeans ، روش انتقال پیام ، تکنیک تحلیل مولفه اصلی ، تکنیک تحلیل تناظر چندگانه ، الگوریتم k-means موازی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • H. Abdi, D. Valentin, Multiple cن orrespondence analysis, Encyclopedia of ...
  • Pattern Recognition Letters, vol. 31, no. ...
  • Ieap Devlton _ _ other Pats _ Devlatioa ...
  • A. Jain, "Data clustering: 50 years beyond K-means, " 8, ...
  • B. Hayes, "Cloud computing, " Commu nications of the ACM, ...
  • E. Rasmussen, P. Willett, "Efficicency of hierarchic agglomerative clustering using ...
  • C. Olson, "Parallel algorithms for hierarchical clustering, " Parallel Computing, ...
  • W. Zhao, H. Ma, Q. He, "Parallel K-Means Clustering Based ...
  • N. Kumar, A. Gangop adhyay, G. Karabatis, S. Bapna, Z. ...
  • J. Pardillo, J. Zubcoff, J.N. Mazn, J. Trujillo, Applying MDA ...
  • S. Sarawagi, iDiff: informative summarization of differences in multidimensio nal ...
  • S. Sarawagi, R. Agrawal, N. Megiddo, H.-J. Schek, G. Alonso, ...
  • R. Nkambou, P. Fournier-viger, E.M. Nguifo, Learning task models in ...
  • N. Zhong, J. Dong, C. Liu, S. Ohsuga, A hybrid ...
  • Muhammad Usman, Russel Pears, A.C.M. Fong, " A data mining ...
  • Jing Zhang, Gongqing Wu, Xuegang Hu, Shiying Li, Shuilong Hao, ...
  • S. Kantabutra, A. Couch, "Parallel K-means Clustering Algorithm on NOWs, ...
  • J. MacQueen, "Some Methods for Classification and Analysis of Multivariate ...
  • H. Uguz, A two-stage feature selection method for text categorization ...
  • P. Tryfos, Methods for Business Analysis and Forecasting: Text and ...
  • M.J. Greenacre, Interpreting multiple corresp ondence analysis, Applied Stochastic Models ...
  • . B. Le roux, H. Rouanet, Multiple C orrespondence Analysis, ...
  • N. Kumar, A. Gangop adhyay, G. Karabatis, S. Bapna, Z. ...
  • J.C. Schlimmer, Automobile dataset, 1985. _ ://archive.ics .uci.edu/ml/ data S ...
  • R. Kohavi, B. Becker, Adult dataset, 1996. _ ://archive .ics.uci.edu/ml ...
  • نمایش کامل مراجع