مقایسه ی روشهای وزن دهی ویژگی درفرآیند طبقه بندی مستندات

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,516

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BPJ01_447

تاریخ نمایه سازی: 29 دی 1392

چکیده مقاله:

محوری ترین موضوع درحوزه متن کاوی طبقه بندی مستندات است اساس کارطبقه بندی مستندات برپایه کلمات کلیدی ومهمی است که ازمستندات استخراج میشود این کلمات یاهمان ویژگیها مضمون اصلی مطلب رابه مخاطب می رسانند ویانکات اصلی مطلب رابرمیگیرند بعدازاین مرحله فرایند وزن دهی به ویژگیها است وزن هرویژگی نشان دهنده قدرت ویژگی دربیان مفهوم کلی یک مستند است این دومرحله جز تکنیکهای پیش پردازش درحوزه طبقه بندی مستندات به شمار میرود بدیهی است انتخاب روشهای کارامد درشناسایی استخراج ووزن دهی ویژگی نقش مهمی دربالا بردن کارایی و دقت طبقه بندی کننده مستندات است درروشهای انتخاب ویژگی مواردی همچون میزان وابستگی ویژگی به مستندات تعدادتکرار ویژگی قدرت ویژگی درجداسازی مستندات و وابستگی ویژگیها به طبقات مورد بررسی قرارمیگیرد همچنین درموضوع وزن دهی روشهای مبتنی برتعدادتکرار کلمه IF روشهای مبتنی برتعدادتکرار کلمه درمستندات مختلف IDF,روشهای ترکیبی IDF,TF مطرح هستند بعدازمقایسه ی روشهای مطرح وزن دهی معلوم شد برخی ازآنها دربرابر افزیاش تعدادمستندات افزایش طول مستندات افزایش تعدادویژگیها افزایش طبقات و یاناهمگونی ماهیت ویژگیها درعملکرد و دقت دچار ضعف میشوند

نویسندگان

مصطفی کریمی منش

دانشگاه پیام نورمرکزتهران

حسین شیرازی

دانشیاردانشگاه صنعتی مالک اشترتهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • F. Sebastiani, "Machine Learning _ Automated Text Categorization, " ACM ...
  • Y. Yang, J. O. Pedersen, _ Comparative Study on Feature ...
  • S. Giri, XML Classification, B.E. Thesis, Madras University, India, 2004. ...
  • G. Salton, C. Buckley, _ _ erm-Weighting Approaches in Automatic ...
  • _ _ _ for Semi- structured Document Categorization, " Information ...
  • E. Leopold, J. Kindermann, _ Categorization with Support Vector Machines. ...
  • _ _ _ 3 _ Storage and Retrieval, vol. 9, ...
  • _ _ _ _ 546-551, 2005. ...
  • M. Maleki, A. Abdollahzadeh, "TFCRF: A Novel Feature Weighting Method ...
  • G. Salton, C. Buckley, _ _ erm-Weighting Approaches in Automatic ...
  • _ _ _ New York, US, ...
  • _ _ 1 Categorization 2 Clustering ...
  • Accuracy 15 Precision 16 Recall ...
  • نمایش کامل مراجع