|
يك روش جديد استخراج كلاسهاي رگرسيوني در مجموعه داده هاي بزرگ Fulltext
نويسندهگان:
[ طاهره نصراله زاده ] - دانشجوي كارشناسي ارشد دانشگاه صنعتي اميركبير [ صادق رضايي ] - عضو هيات علمي دانشگاه صنعتي اميركبير
خلاصه مقاله:
استخراج الگوها و مدلهاي مطلوب از پايگاه داده هاي عظيم توجه بسياري را در رشته هاي مختلف بخود جلب كرده است، در اين خصوص DM (Knowledge Discovery in Database) KDD و (Data Mining) DM دو زمينه جالب براي محققين در شناسايي الگوها، آمار ، هوش مصنوعي ، يادگيري ماشيني و خصوصا محاسبات در سطوح بالا مي باشد.
در اين مقاله يك روش كارا و استوار (Effect and Robust) به نام (Regression – Class Mixture Decomposition) RCMD براي استخراج كلاسهاي رگرسيوني در مجموعه داده هاي بزرگ (contaminated by noise) ارائه مي گردد. اولين گام در پروسه استخراج بيان مفهوم جديد كلاس رگرسيوني مي باشد كه به عنوان يك زير مجموعه از مجموعه داده هايي تعريف مي شود كه موضوع اصلي در مدل رگرسيوني است، گام بعد اختصاص يك مجموعه از داده هاي دروني به هر كدام از اين كلاسهاي رگرسيوني و در نهايت تعيين مدلهاي رگرسيوني معني دار در مجوعه داده هاست. اين روش با طي كردن اين سه مرحله ثابت مي كند كه در مقابل سهم بزرگي از داده هاي آميخته با noise نيز مقاوم است. مجموعه داده هاي بزرگ به عنوان يك جامعه آميخته مورد بحث قرار مي گيرد كه درآن تعداد زياد و متناهي كلاس رگرسيوني و ديگر ساختارهايي كه مدل رگرسيوني به حساب نمي ايند وجود دارد. در انتها ملاك كارايي و استواري روش RCMD يك سلسله از آزمايشهاي شبيه سازي شده واقعي مي باشد كه نشان ميدهد روش فوق براي برازاندن كلاسهاي رگرسيوني خطي و ساختارهاي ديگر غير خطي به داده هاي آميخته در شرايط مختلف مورد استفاده قرار مي گيرد.
كلمات كليدي:
داده كاوي ، الگوريتم ژنتيك ، ماكزيمم درستمايي ، مدلبندي آميخته ، روش RCMD ، كلاس رگرسيوني ، استواري
فایل PDF حاوی متن کامل این مقاله در حال حاضر در سایت موجود نمیباشد.
[ لينک دايمي به اين صفحه: http://www.civilica.com/Paper-IDMC01-IDMC01_031.html ]
|