روشی مبتنی بر تصفیه برای انتخاب ویژگی از داده های ابعاد بالا با هدف دسته بندی اسناد
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 410
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ02_189
تاریخ نمایه سازی: 11 آبان 1395
چکیده مقاله:
با توجه به اینه دسته بندی اسناد منجر به بازیابی اطلاعات مناسب می شود ولی ابعاد بالای فضای ویژگی ها یک چالش مهم در کارایی دسته بندی اسناد است. این چالش موجب کاهش صحت و پیچیدگی بالای محاسبات در الگوریتم های یادگیری ماشین جهت دسته بندی اسناد می شود. در این مقاله یک روش دو مرحله ای مبتنی بر تصفیه، جهت کاهش ابعاد با هدف حفظ دقت دسته بندی اسناد ارائه داده ایم. در فاز تصفیه ویژگی ها توسط معیار IG امتیازدهی می شوند و مجموعه بهینه از ویژگی ها را انتخاب کرده ایم. سپس در فاز بعدی، ویژگی های مازاد را از مجموعه بهینه ویژگی ها حذف کرده ایم. در نهایت اسناد به همراه بهترین ویژگی های انتخاب شده، توسط دسته بندی های Naïve Bayes و c4.5 دسته بندی می شوند. با توجه به آزمایشات انجام شده بر روی مجموعه داده رویترز، میزان صحت روش پیشنهادی با دسته بند c4.5،؛ 0.927 است.
کلیدواژه ها:
نویسندگان
مریم کرباسی
کارشناسی ارشد کامپیوتر، دانشگاه علوم و تحقیقات واحد نیشابور
محمدحسین معطر
استادیار گروه کامپیوتر، دانشگاه آزاد اسلامی واحد مشهد
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :