روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 821

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ELECOM01_102

تاریخ نمایه سازی: 9 تیر 1393

چکیده مقاله:

امروزه اطلاعات زیادی در قالب متون الکترونیکی و پایگاه های داده ای متنی ذخیره شده اند. برای استخراج دانش از این حجم بالای اطلاعات متنی، نیازمند استفاده از روش های خوشه بندی و طبقه بندی مستندات متنی هستیم. در اکثر روشهای طبقه بندی متن معمولا براساس فراوانی کلمات و در نظر گرفتن متن به صورت مجموعه ای از کلمات، طبقه بندی انجام می شود ولی چنین نمایشی باعث ابعاد بالای متون، تعداد بسیار زیاد ویژگی ها و منجر به کاهش کارایی الگوریتم های طبقه بندی می گردد. در این مقاله به منظور کاهش تعداد ویژگی ها و انتخاب ویژگی های اصلی متن، از دانش پس زمینه و تکنیکهای یادگیری ماشین استفاده شده است. در واقع با استفاده از هستان شناس وردنت و دانش پس زمینه ویژگی های اصلی متون انتخاب می شوند و با استفاده از الگویتم های یادگیری ماشین متون طبقه بندی می شوند. نتایج شبیه سازی روش پیشنهادی، نشان می دهد بهبود موثری در کاهش ابعاد متن و در نتیجه افزایش کارایی طبقه بندی متن ایجاد شده است.

نویسندگان

هاجر فرهمند

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

علی هارون آبادی

استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر

سید جواد میرعابدینی

استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • D.D. Lewis, Y. Yang, T. Rose, F. Li, :RCV1: A ...
  • A. Hotho, S. Staab, G. Stumme, "Ontologies Improve Text Clustering", ...
  • _ _ and representatios for text categorization", in Proc. 7th ...
  • A. McCallum, K. Nigam, "A comparison of event models for ...
  • _ _ _ and extention of RELLIEF, in Proc. 6th ...
  • T. Wang; H. Chiang, "Fuzzy support vector machine for multi- ...
  • _ _ _ _ Springer _ ...
  • C. Cardie, "Using decision tree to improve case based learning, ...
  • H. Schutze, D. Hull, J. O. Pedersen, "A comparison of ...
  • Verlag, Heidelberg, Pages 188, 1995-200, ...
  • _ _ _ _ Analysis and Information Retrieval, pp. 317-332, ...
  • _ _ _ _ _ _ [13] _ _ 2006. ...
  • Y. Yang, J.P. Pedersen, _ Comparative Study on Feature Selection ...
  • Y. Yang, X. Liu, _ Re-examination of Text Categorization Methods", ...
  • D. Bracewell, F. Ren, S. Kuroiwa, "Mulilingual Single Document Keyword ...
  • T. Joachims, :-Text Categorization with Support Vector Machines: ...
  • Z. Zheng, R. Srihari, "Optimally Combining Positive and Negative Features ...
  • نمایش کامل مراجع