مقایسه ی روشهای وزن دهی ویژگی درفرآیند طبقه بندی مستندات
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,516
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_447
تاریخ نمایه سازی: 29 دی 1392
چکیده مقاله:
محوری ترین موضوع درحوزه متن کاوی طبقه بندی مستندات است اساس کارطبقه بندی مستندات برپایه کلمات کلیدی ومهمی است که ازمستندات استخراج میشود این کلمات یاهمان ویژگیها مضمون اصلی مطلب رابه مخاطب می رسانند ویانکات اصلی مطلب رابرمیگیرند بعدازاین مرحله فرایند وزن دهی به ویژگیها است وزن هرویژگی نشان دهنده قدرت ویژگی دربیان مفهوم کلی یک مستند است این دومرحله جز تکنیکهای پیش پردازش درحوزه طبقه بندی مستندات به شمار میرود بدیهی است انتخاب روشهای کارامد درشناسایی استخراج ووزن دهی ویژگی نقش مهمی دربالا بردن کارایی و دقت طبقه بندی کننده مستندات است درروشهای انتخاب ویژگی مواردی همچون میزان وابستگی ویژگی به مستندات تعدادتکرار ویژگی قدرت ویژگی درجداسازی مستندات و وابستگی ویژگیها به طبقات مورد بررسی قرارمیگیرد همچنین درموضوع وزن دهی روشهای مبتنی برتعدادتکرار کلمه IF روشهای مبتنی برتعدادتکرار کلمه درمستندات مختلف IDF,روشهای ترکیبی IDF,TF مطرح هستند بعدازمقایسه ی روشهای مطرح وزن دهی معلوم شد برخی ازآنها دربرابر افزیاش تعدادمستندات افزایش طول مستندات افزایش تعدادویژگیها افزایش طبقات و یاناهمگونی ماهیت ویژگیها درعملکرد و دقت دچار ضعف میشوند
کلیدواژه ها:
نویسندگان
مصطفی کریمی منش
دانشگاه پیام نورمرکزتهران
حسین شیرازی
دانشیاردانشگاه صنعتی مالک اشترتهران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :