CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک روش جدید استخراج کلاسهای رگرسیونی در مجموعه داده های بزرگ

عنوان مقاله: یک روش جدید استخراج کلاسهای رگرسیونی در مجموعه داده های بزرگ
شناسه ملی مقاله: IDMC01_031
منتشر شده در اولین کنفرانس داده کاوی ایران در سال 1386
مشخصات نویسندگان مقاله:

طاهره نصراله زاده - دانشجوی کارشناسی ارشد دانشگاه صنعتی امیرکبیر
صادق رضایی - عضو هیات علمی دانشگاه صنعتی امیرکبیر

خلاصه مقاله:
استخراج الگوها و مدلهای مطلوب از پایگاه داده های عظیم توجه بسیاری را در رشته های مختلف بخود جلب کرده است، در این خصوص DM (Knowledge Discovery in Database) KDD و (Data Mining) DM دو زمینه جالب برای محققین در شناسایی الگوها، آمار ، هوش مصنوعی ، یادگیری ماشینی و خصوصا محاسبات در سطوح بالا می باشد. در این مقاله یک روش کارا و استوار (Effect and Robust) به نام (Regression – Class Mixture Decomposition) RCMD برای استخراج کلاسهای رگرسیونی در مجموعه داده های بزرگ (contaminated by noise) ارائه می گردد. اولین گام در پروسه استخراج بیان مفهوم جدید کلاس رگرسیونی می باشد که به عنوان یک زیر مجموعه از مجموعه داده هایی تعریف می شود که موضوع اصلی در مدل رگرسیونی است، گام بعد اختصاص یک مجموعه از داده های درونی به هر کدام از این کلاسهای رگرسیونی و در نهایت تعیین مدلهای رگرسیونی معنی دار در مجوعه داده هاست. این روش با طی کردن این سه مرحله ثابت می کند که در مقابل سهم بزرگی از داده های آمیخته با noise نیز مقاوم است. مجموعه داده های بزرگ به عنوان یک جامعه آمیخته مورد بحث قرار می گیرد که درآن تعداد زیاد و متناهی کلاس رگرسیونی و دیگر ساختارهایی که مدل رگرسیونی به حساب نمی ایند وجود دارد. در انتها ملاک کارایی و استواری روش RCMD یک سلسله از آزمایشهای شبیه سازی شده واقعی می باشد که نشان میدهد روش فوق برای برازاندن کلاسهای رگرسیونی خطی و ساختارهای دیگر غیر خطی به داده های آمیخته در شرایط مختلف مورد استفاده قرار می گیرد.

کلمات کلیدی:
داده کاوی ، الگوریتم ژنتیک ، ماکزیمم درستمایی ، مدلبندی آمیخته ، روش RCMD ، کلاس رگرسیونی ، استواری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/33008/