روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی

هاجر فرهمند; علی هارون آبادی; سید جواد میرعابدینی

روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی

محل انتشار: اولین همایش منطقه ای بهینه سازی و روش های محاسبه نرم در مهندسی برق و کامپیوتر

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 821

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری ماشین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/261650

شناسه ملی سند علمی:

ELECOM01_102

تاریخ نمایه سازی: 9 تیر 1393

چکیده مقاله:

امروزه اطلاعات زیادی در قالب متون الکترونیکی و پایگاه های داده ای متنی ذخیره شده اند. برای استخراج دانش از این حجم بالای اطلاعات متنی، نیازمند استفاده از روش های خوشه بندی و طبقه بندی مستندات متنی هستیم. در اکثر روشهای طبقه بندی متن معمولا براساس فراوانی کلمات و در نظر گرفتن متن به صورت مجموعه ای از کلمات، طبقه بندی انجام می شود ولی چنین نمایشی باعث ابعاد بالای متون، تعداد بسیار زیاد ویژگی ها و منجر به کاهش کارایی الگوریتم های طبقه بندی می گردد. در این مقاله به منظور کاهش تعداد ویژگی ها و انتخاب ویژگی های اصلی متن، از دانش پس زمینه و تکنیکهای یادگیری ماشین استفاده شده است. در واقع با استفاده از هستان شناس وردنت و دانش پس زمینه ویژگی های اصلی متون انتخاب می شوند و با استفاده از الگویتم های یادگیری ماشین متون طبقه بندی می شوند. نتایج شبیه سازی روش پیشنهادی، نشان می دهد بهبود موثری در کاهش ابعاد متن و در نتیجه افزایش کارایی طبقه بندی متن ایجاد شده است.

کلیدواژه ها:

انتخاب ویژگی ، طبقه بندی متن ، هستان شناسی ، یادگیری ماشین

نویسندگان

هاجر فرهمند

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

علی هارون آبادی

استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر

سید جواد میرعابدینی

استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

D.D. Lewis, Y. Yang, T. Rose, F. Li, :RCV1: A ...
A. Hotho, S. Staab, G. Stumme, "Ontologies Improve Text Clustering", ...
_ _ and representatios for text categorization", in Proc. 7th ...
A. McCallum, K. Nigam, "A comparison of event models for ...
_ _ _ and extention of RELLIEF, in Proc. 6th ...
T. Wang; H. Chiang, "Fuzzy support vector machine for multi- ...
_ _ _ _ Springer _ ...
C. Cardie, "Using decision tree to improve case based learning, ...
H. Schutze, D. Hull, J. O. Pedersen, "A comparison of ...
Verlag, Heidelberg, Pages 188, 1995-200, ...
_ _ _ _ Analysis and Information Retrieval, pp. 317-332, ...
_ _ _ _ _ _ [13] _ _ 2006. ...
Y. Yang, J.P. Pedersen, _ Comparative Study on Feature Selection ...
Y. Yang, X. Liu, _ Re-examination of Text Categorization Methods", ...
D. Bracewell, F. Ren, S. Kuroiwa, "Mulilingual Single Document Keyword ...
T. Joachims, :-Text Categorization with Support Vector Machines: ...
Z. Zheng, R. Srihari, "Optimally Combining Positive and Negative Features ...

نمایش کامل مراجع