انتخاب ویژگی در مجموعه داده های دستنویس با استفاده از الگوریتم تکاملی ژنتیک

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 522

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

REGCMAES02_035

تاریخ نمایه سازی: 30 دی 1394

چکیده مقاله:

مقاله ای که به پیاده سازی آن پرداخته شده است بدون اطلاعات اولیه خاص در مورد تعداد زیر مجموعه ویژگی ها عملیات انتخاب ویژگی صورت می پذیرد و برای جستجو و انتخاب ویژگی از الگوریتم ژنتیک باینری بهره برده شده است و تابع هزینه نیز تابعی است بر اساس معیار LDA یا Linear Discriminant Analysis یا معیار آنالیز جدایی کننده خطی بدست آمده است. رابطه Ida با استفاده از این مفهوم که میانگین فاصله های داده های بین کلاسی یا ∑ باید ماکزیمم شود و میانگین داده های درون کلاسی ∑ باید مینیمم شود، عملیات رتبه دهی به ویژگی ها را انجام می دهد. رابطه زیر قسمتی از رابطه Ida هست که در تابع ارزیابی ژنتیک از آن استفاده شده است. انتخاب ویژگی در مجموعه داده هایی که ابعاد بزرگی دارند همواره جز چالشهایی بوده که افراد در حوزه یادگیری ماشین و شناسایی الگو همواره بدنبال روش هایی بودند که عملیات کاهش ابعاد را در این مجموعه داده ها اعمال کنند. چرا که طبق اصل نفرین ابعاد اگر در یک مجموعه داده ای تعداد ویژگیها افزایش ابعاد را در این مجموعه داده ها اعمال کنند. چرا که طبق اصل نفرین ابعاد اگر در یک مجموعه داده ای تعداد ویژگیها افزایش یابد نه تنها صحت دقت سیستم کمتر خواهد شد بلکه پیچیدگی و مدلسازی سیستم نیز افزایش خواهد یافت. لذا با حذف ویژگی هایی که اطلاعات خاصی در مورد هدف به ما نمیدهند و همچنین حذف ویژگی هایی که با یکدیگر تقریباً مشابهند می توان راه کاری را پیشنهاد داد که عملیات کاهش ابعاد با موفقیت و حتی با افزایش صحت دقت دسته بند صورت گیرد. در مجموعه داده های با ابعاد بالا عملیات انتخاب ویژگی یک مساله complete-np ( مساله ای که هیچ گونه جواب مشخص چند جمله ای برای حل آن وجود ندارد) به حساب می آید و اگر بخواهیم به صورت کلی تمام ویژگی ها را مورد بررسی قرار دهیم N2 پاسخ را باید مورد ارزیابی قرار دهیم که از لحاظ پیاده سازی برای مجموعه داده های با ابعاد بالا این کار غیر ممکن می باشد.

نویسندگان

صحرا رجب لو

دانشجو، ارشد مهندسی نرم افزار، دانشگاه آزاد اسلامی واحد سمنان

فاطمه امیرجان

دانشجو، ارشد مهندسی نرم افزار، دانشگاه آزاد اسلامی واحد سمنان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Chouaib, H., Terrades, O.R., Tabbone, S., Cloppet, F., Vincent, N., ...
  • Chung, K., Yoon, J., 1997. Performance comparison of several feature ...
  • th Internat. Conf. on Document Analysis and Recognition (ICDAR 97). ...
  • Cordella, L., De Stefano, C., Fontanella, F., Marrocco, C., 2008. ...
  • Cordella, L, De Stefano, C., Fontanella, F., Marrocco, C., Scotto ...
  • classifier. In: 20th Internat. Conf. _ Pattern Recognition (ICPR 2010), ...
  • Dash, M., Liu, H., 2003. C onsistency-b ased search in ...
  • De Stefano, C., Fontanella, F., Marrocco, C., Schirinzi, G., 2007. ...
  • Fodor, I., 2002. A survey of dimension reduction techniques, Tech. ...
  • Frank, A., Asuncion, A., 2010. UCI machine learning repository. URL ...
  • Fukunaga, K., , 1990. Introduction to Statistical Patterm Recognition, second ...
  • Goldberg, D.E., 1989. Genetic Algorithms in Search Optimization and Machine ...
  • Grother, P.J., 1995. Nist special database 19. URL _ ://www. ...
  • Gutlein, M., Frank, E., Hall, M., Karwath, A., 2009. Large-scale ...
  • Ahlgren, R., Ryan, H., Swonger, C., 1971. A character recognition ...
  • Ben-Bassat, M., 1982. Pattern recognition and reduction of dimensionality. In: ...
  • Krishnaiah, P., Kanal, L. (Eds.), Handbook of Statistics-I. North Holland, ...
  • Blickle, T., Thiele, L, , 1996. A comparison of selection ...
  • نمایش کامل مراجع