روشی مبتنی بر تصفیه برای انتخاب ویژگی از داده های ابعاد بالا با هدف دسته بندی اسناد

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 410

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ02_189

تاریخ نمایه سازی: 11 آبان 1395

چکیده مقاله:

با توجه به اینه دسته بندی اسناد منجر به بازیابی اطلاعات مناسب می شود ولی ابعاد بالای فضای ویژگی ها یک چالش مهم در کارایی دسته بندی اسناد است. این چالش موجب کاهش صحت و پیچیدگی بالای محاسبات در الگوریتم های یادگیری ماشین جهت دسته بندی اسناد می شود. در این مقاله یک روش دو مرحله ای مبتنی بر تصفیه، جهت کاهش ابعاد با هدف حفظ دقت دسته بندی اسناد ارائه داده ایم. در فاز تصفیه ویژگی ها توسط معیار IG امتیازدهی می شوند و مجموعه بهینه از ویژگی ها را انتخاب کرده ایم. سپس در فاز بعدی، ویژگی های مازاد را از مجموعه بهینه ویژگی ها حذف کرده ایم. در نهایت اسناد به همراه بهترین ویژگی های انتخاب شده، توسط دسته بندی های Naïve Bayes و c4.5 دسته بندی می شوند. با توجه به آزمایشات انجام شده بر روی مجموعه داده رویترز، میزان صحت روش پیشنهادی با دسته بند c4.5،؛ 0.927 است.

نویسندگان

مریم کرباسی

کارشناسی ارشد کامپیوتر، دانشگاه علوم و تحقیقات واحد نیشابور

محمدحسین معطر

استادیار گروه کامپیوتر، دانشگاه آزاد اسلامی واحد مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • categorization. ACM computing surveys (CSUR), 2002. 34(1): p. 1-47. ...
  • selection and feature extraction techniques in machine learing. in Science ...
  • _ Expert _ 2012. Pinheiro, R.H., G.D. Cavalcanti, and T.I. ...
  • global-ranking local feature selection methods for text categorization. Expert Systems ...
  • and genetic algorithm. Knowledge-B ased Systems, 2011. 24(7): p. 1024-1032. ...
  • نمایش کامل مراجع