توسعه یک روش انتخاب مشخصه مبتنی بر نظریه اطلاعات و الگوریتم ژنتیک

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 74

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_STIM-9-3_001

تاریخ نمایه سازی: 10 بهمن 1402

چکیده مقاله:

هدف: در مواجهه با مجموعه داده های با ابعاد بالا، کاهش بعد یک گام پیش پردازشی مهم برای حصول دقت بالا، کارایی و مقیاس پذیری در مسائل کلاسبندی است. هدف تحقیق حاضر ارائه یک روش انتخاب مشخصه در مواجهه با مجموعه داده های با ابعاد بالا، با استفاده از کاهش بعد و الگوریتم ژنتیک است.روش: در این تحقیق یک الگوریتم ابتکاری توسعه یافته است که با استفاده از یک معیار جدید، اطلاعات متقابل بین ویژگی ها و کلاس هدف را مشخص می کند. در این روش مشخصه های جدید براساس ترکیب یا تبدیل مشخصه های اصلی تولید می شود و به این ترتیب فضای چند بعدی، به فضایی جدید با ابعاد کمتر نگاشت پیدا می کند. همچنین علاوه بر در نظر گرفتن معیار جدید اطلاعات متقابل، از الگوریتم ژنتیک به منظور بهبود سرعت روش پیشنهادی استفاده شده است.یافته ها: عملکرد این روش بر روی مجموعه داده هایی با ابعاد مختلف، که تعداد مشخصه ها در آن ها از ۱۳ تا ۶۰ متفاوت بوده، ارزیابی شده است. ارزیابی روش پیشنهادی در مقایسه با روش های مشابه، از لحاظ دقت کلاسبند بررسی شده و نتایج نویدبخشی بدست آمد.نتیجه گیری: روش پیشنهادی با روش های MRMR, DISR, JMI, NJMIM در مجموعه داده های متفاوت اعمال شده است. متوسط دقت های به دست آمده از روش پیشنهادی ۶۵.۳۲، ۷۴.۵۱، ۷۰.۸۸ و ۵۸.۲ درصد می باشد، که حاکی از کارآمدی روش پیشنهادی است. طبق نتایج بدست آمده، به جز در مورد مجموعه داده sonar که نتیجه ای بهتر از روش پیشنهادی داشته است، متوسط عملکرد روش پیشنهادی بهتر از DISR, JMI, NJMIM و MRMR بوده است.

نویسندگان

مهدی جباری

کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه صنعتی قم، قم، ایران.

جلال رضائی نور

استاد، گروه مهندسی صنایع، دانشگاه قم، قم، ایران

امیرحسین اکبری

دانشجوی دکتری، دانشکده مهندسی صنایع، دانشگاه علم و صنعت، تهران، ایران.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Amiri, F. & et al. (۲۰۱۱). Mutual information-based feature selection ...
  • Battiti, R. (۱۹۹۴). Using mutual information for selecting features in ...
  • Blum, A.L. & Langley, P. (۱۹۹۷). Selection of relevant features ...
  • Boukharouba, A. & Bennia, A. (۲۰۱۷). Novel feature extraction technique ...
  • Cellucci, C.J., Albano, A.M. & Rapp, P.E. (۲۰۰۵). Statistical validation ...
  • Dash, M. & Liu, H. (۱۹۹۷). Feature Selection for Classification. ...
  • Fleuret, F. (۲۰۰۴). Fast binary feature selection with conditional mutual ...
  • Gao, W., Hu, L. & Zhang, P. (۲۰۱۸). Class-specific mutual ...
  • Guyon, I. & Elisseeff, A. (۲۰۰۳). An introduction to variable ...
  • Hall, M.A. (۱۹۹۹). Correlation-based Feature Selection for Machine Learning. P.hD. ...
  • Hicks, Y., Setchi, R. & Bennasar, M. (۲۰۱۵). Feature selection ...
  • Hoquea, N., Bhattacharyyaa, D.K. & Kalitab, J.K. (۲۰۱۴). MIFS-ND: A ...
  • Kira, K. & Rendell, L.A. (۱۹۹۲). The feature selection problem: ...
  • Kramer, O. (۲۰۱۳). Dimensionality Reduction with Unsupervised Nearest Neighbors. Intelligent ...
  • Kramer, O. (۲۰۱۳). Dimensionality Reduction with Unsupervised Nearest Neighbors. Intelligent ...
  • Kwak, N. & Choi, C.-H. (۲۰۰۲). Input feature selection for ...
  • Lewis, D.D. (۱۹۹۲). Feature selection and feature extraction for text ...
  • Peng, H., Long, F. & Ding, C. (۲۰۰۵). Feature selection ...
  • Shannon, C.E. (۱۹۴۸). A Mathematical Theory of Communication. Bell System ...
  • Vergara, J.R. & Estevez, P.A. (۲۰۱۴). A review of feature ...
  • Yang, H.H. & Moody, J. (۲۰۰۰). Data visualization and feature ...
  • نمایش کامل مراجع