بهبود یک روش مبتنی برانتخاب ویژگی به منظور دسته بندی متون با الگوریتم های متن کاوی

عارف سیاحی; سید محسن هاشمی; سعید مزرعه

بهبود یک روش مبتنی برانتخاب ویژگی به منظور دسته بندی متون با الگوریتم های متن کاوی

محل انتشار: دومین کنگره سراسری فناوریهای نوین ایران با هدف دستیابی به توسعه پایدار

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 997

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/399585

شناسه ملی سند علمی:

SENACONF02_095

تاریخ نمایه سازی: 30 آبان 1394

چکیده مقاله:

یکی از مهمترین تکنیک های متنکاوی، دسته بندی متون است. متن کاوی را میتوان به عنوان متدها و الگوریتم هایی از فیلدهای یادگیری ماشین و آماری برای متنها با هدف پیدا کردن الگوهای مفید در نظرگرفت. برای این هدف پیش پردازش کردن متون ضروری است. در بسیاری از روشها، متدهای استخراج اطلاعات، پردازش کردن زبان طبیعی یا برخی پیش پردازشهای ساده برای استخراج داده از متون استفاده می شود. سپس می توان الگوریتم های داده کاوی را بر روی داده های استخراج شده اعمال کرد دسته بندی متون بدین معنی است که اسناد متنی موجود را به چند دسته از قبل تعریف شده که اسناد متعلق به آنها هستند، نسبت دهیم. دادههای ذخیره شده در بیشتر پایگاه داده های متنی، داده های نیمه ساختار یافته هستند چون نه به طور کامل غیرساخت یافته هستند و نه به طور کامل ساختیافته هستند. الگوریتم انتخاب ویژگی فیلتری، جهت کاهش پیچیدگی دسته بندی در قسمت پیش پردازش مورد استفاده قرار گرفته است و در قسمت یادگیری الگوریتم یادگیری بیز ساده، درخت تصمیم و ماشین بردار پشتیبان جهت ارزیابی و بهبود کارایی استفاده نموده ایم .

کلیدواژه ها:

متن کاوی ، داده کاوی ، درخت تصمیم ، بیزساده ، یادگیری ماشین

نویسندگان

عارف سیاحی

آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

سید محسن هاشمی

آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

سعید مزرعه

آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Shahbaz, M., Ahsen, S. M., Shaheen, M., Shaheen, M., Masood, ...
Ruta, D., Gabrys, B., 2000. An Overview of classifier fusion ...
Jiye Liang , FengWanga, Chuangyin Dangb, Yuhua Qian , 2012. ...
Nicolas Garcia-Pedraj as, Aida de Haro-Garcia, Javier Perez -Rodriguez , ...
Huawen Liu, JiguiSun, LeiLiu, HuijieZhang , 2009. Feature selection with ...
Ruichu Cai , ZhenjieZhang , ZhifengHao _ 2011. BASSUM: A ...
Jiana Meng, Hongfei Lin , Yuhai Yu , 2011. A ...
Ganiz, M. C., George, C., & Pottenger, W. M. (2011). ...
Aghdam, M. H., Aghaee, N. G., Basiri, M. E., 2009. ...
Al-Mubaid, H., Umair, S. A., 2006. A New Text Categorization ...
Arturo, M. R., 2006. Automatic Text Categorization of documens in ...
Rennie, J. D., Shih, L., Teevan, J., & Karger, D. ...
Jing, L. P., Huang, H. K., & Shi, H. B. ...
Bi, _ Bell, D., Wang, H., Guo, G., Dubitzky, W., ...
Kecman, V. (2001). Learning and soft computing: support vector machines, ...

نمایش کامل مراجع