بهبود عملکرد طبقه بندی متون فارسی با استفاده از تجزیه و تحلیل مولفه های اصلی با کمک معیار میانگین یادآوری و دقت
محل انتشار: چهاردهمین کنفرانس دانشجویی مهندسی برق کشور
سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,021
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCEE14_115
تاریخ نمایه سازی: 31 مرداد 1390
چکیده مقاله:
طبقه بندی متون فازی به دلیل دارا بودن ویژگیهای زیاد و کم اهمیت فرایندی بسیار پیچیده می باشد از انجا که مطالعات کمی روی این موضوع انجام شده است هدف از مقاله حاضر استخراج بهترین ویژگیهای متن فارسی با استفاده ازروش تجزیه و تحلیل مولفه های اصلی PCA با کمک معیارهیا میانگین دقت و یادآوری خواهد بود با اختیار داشتن ششصد و سه سند متنی که در پنج طبقه تقسیم شده بودن فرایند طبقه بندی آغاز شد دراین مقاله از روش وزن دهی ویژگی مبتنی بر اطلاعات کلاس درحوزه طبقه بندی مستندات TFCRF برای انتخاب ویژگیها استفاده شده است نتایج به دست آمده نشاندادکه با درنظر گرفتن روشهای طبقه بندی نزدیکترین همسایه KNN و بیزین Bayesian درروش پیشنهادی بهبود قابل توجهی در طبقه بندی متون فارسی و کاهش مدتزمان تست با ویژگیهای استخراج شده به دست خواهد آمد.
کلیدواژه ها:
نویسندگان
علی قنبری سرخی
دانشگاه صنعتی شاهرود
فاطمه ابراهیمی
دانشگاه قم فناوری اطلاعات
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :