حل مسیله بهینه سازی برای انتخاب متغیرهای مهم در داده های با بعد بالا

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 474

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIORS10_274

تاریخ نمایه سازی: 11 شهریور 1397

چکیده مقاله:

پیش بینی متغیر پاسخ به کمک چندین متغیر توضیحی همواره مورد توجه محققین است. هدف ساختن مدلی است که متغیر پاسخ را به متغیرهای توضیحی مرتبط کند. وقتی تعداد متغیرهای توضیحی مدل زیاد باشد، تفسیر مدل مشکل تر و هزینه محاسبات افزایش می یابد. لذا، شناسایی متغیرهای توضیحی موثر بر پاسخ بسیار مهم است. در داده های با بعد بالا مانند داده های پزشکی و ژنتیکی که تعداد متغیرهای مهم زیاد است، انتخاب این متغیرها معمولا با استفاده از یک روش بهینه سازی درجه دوم مانند مینیمم کردن مجموع مربعات خطا تحت یک شرط محدودکننده انجام می شود. با استفاده از روش لاگرانژ، میتوان این مسیله را به صورت یک تابع هدف جریمه شده در نظر گرفت. حل این مسیله مینمم سازی مستلزم استفاده از روش های بهینه سازی است. در این مقاله، فرض می کنیم رابطه بین متغیرهای توضیحی و متغیر پاسخ به صورت جمعی ناپارامتری است و برای انتخاب متغیرهای مهم، توابع جریمه مختلف را در نظر می گیریم. حل این مسیله بهینه سازی به وسیله الگوریتم مختصات نزولی گروهی انجام می شود. در پایان، عملکرد این الگوریتم را تحت انواع توابع جریمه، برای متغیرهای گروهی، با یک مثال شبیه سازی بررسی می کنیم.

کلیدواژه ها:

نویسندگان

محمد کاظمی

گروه آمار دانشگاه صنعتی شاهرود

داود شاهسونی

گروه آمار دانشگاه صنعتی شاهرود

محمد آرشی

گروه آمار دانشگاه صنعتی شاهرود