بهبود یک روش مبتنی برانتخاب ویژگی به منظور دسته بندی متون با الگوریتم های متن کاوی
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 997
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SENACONF02_095
تاریخ نمایه سازی: 30 آبان 1394
چکیده مقاله:
یکی از مهمترین تکنیک های متنکاوی، دسته بندی متون است. متن کاوی را میتوان به عنوان متدها و الگوریتم هایی از فیلدهای یادگیری ماشین و آماری برای متنها با هدف پیدا کردن الگوهای مفید در نظرگرفت. برای این هدف پیش پردازش کردن متون ضروری است. در بسیاری از روشها، متدهای استخراج اطلاعات، پردازش کردن زبان طبیعی یا برخی پیش پردازشهای ساده برای استخراج داده از متون استفاده می شود. سپس می توان الگوریتم های داده کاوی را بر روی داده های استخراج شده اعمال کرد دسته بندی متون بدین معنی است که اسناد متنی موجود را به چند دسته از قبل تعریف شده که اسناد متعلق به آنها هستند، نسبت دهیم. دادههای ذخیره شده در بیشتر پایگاه داده های متنی، داده های نیمه ساختار یافته هستند چون نه به طور کامل غیرساخت یافته هستند و نه به طور کامل ساختیافته هستند. الگوریتم انتخاب ویژگی فیلتری، جهت کاهش پیچیدگی دسته بندی در قسمت پیش پردازش مورد استفاده قرار گرفته است و در قسمت یادگیری الگوریتم یادگیری بیز ساده، درخت تصمیم و ماشین بردار پشتیبان جهت ارزیابی و بهبود کارایی استفاده نموده ایم .
کلیدواژه ها:
نویسندگان
عارف سیاحی
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سید محسن هاشمی
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سعید مزرعه
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :