CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تکنیک های داده کاوی برای کاوش دانش در مجموعه داده های بزرگ

عنوان مقاله: تکنیک های داده کاوی برای کاوش دانش در مجموعه داده های بزرگ
شناسه ملی مقاله: ICCONF01_087
منتشر شده در اولین همایش ملی کامپیوتر،فناوری اطلاعات وارتباطات اسلامی ایران در سال 1394
مشخصات نویسندگان مقاله:

زینب صادقیان
جواد محمدزاده

خلاصه مقاله:
درهرجهان واقعی یک حجم وسیعی ازاطلاعات وجود دارد بنابراین اداره نمودن موثر این داده ها یک مسئله چالش برانگیز و قابل توجه است ازاین رو دراین مقاله ابتدا یک ترکیبی ازالگوریتم k-means موازی و روش رابط انتقال پیام MPI به نام Mkmeans ارایه میشود سپس یک متدولوژی برای کشف مکعبهای علاقه مندی ها درپایگاه داده های چندبعدی و بزرگ ارایه میشود درمتدلوژی پیشنهادی ازتکنیکهای تحلیل مولفه اصلی PCA و تحلیل تناظر چندگانه MCA به منظور کاهش داده استفاده میشود این رویکرد برخلاف تحقیقات گذشته به یک دامنه خاصی ازدانش تکیه ندارد مراحل این متدلوژی عبارتنداز: خوشه بندی کل پایگاه داده با استفاده ازالگوریتم سلسله مراتبی متراکم شونده /اعمال تکنیکهای تحلیل مولفه اصلی PCA برروی متغیرهای عددی و تحلیل تناظر چندگانه MCA برروی متغیرهای اسمی /ایجادشمار چندبعدی /ایجادمکعب داده بامعنی /استخراج دانش ازطریق مسیرهای درجه بالا /این متدلوژی روی یک مجموعه داده واقعی پیاده سازی شده است نتایج ازمایشی نشان میدهد که ازنظر اماری و کاربردی بسیارمفید می باشد الگوریتم ترکیبی Mkmeans درمحیطهای موازی بسیارمفید و کاربردی است نتایج ازمایشی نشان میدهد که این الگوریتم ترکیبی نسبتا پایدار وقابل حمل است و برای حجم بالای داده ها مرتبه زمانی پایینی دارد

کلمات کلیدی:
الگوریتم ترکیبی Mkmeans ، روش انتقال پیام ، تکنیک تحلیل مولفه اصلی ، تکنیک تحلیل تناظر چندگانه ، الگوریتم k-means موازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/408888/