سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از ترکیب الگوریتم هایSMO و SVM

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 692

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IAUFASA02_027

تاریخ نمایه سازی: 17 اسفند 1393

چکیده مقاله:

افزایش کاربران ایمیل منجر به افزایش چشمگیرهرزنامه هادرطی سالهای اخیر شده است تولید کنندگان هرزنامه همواره تلاش می کنند که راهکارهای جدیدتری به منظور گریز ازفیلترهای موجود بیابند بنابراین ضرورت دارد که فیلترهای جدیدی متناسب با این هرزنامه ها توسعه یابد عموما مهمترین ابزار به منظور فیلتر کردن هرزنامه ها براساس طبقه بندی متون کار می کنند مهمترین روشهای طبقه بندی ازتکنیکهای یادگیری ماشین استفاده می کنند تاکنون روش های زیادی به منظور مقابله باهرزنامه پیشنهاد شده است اما باتوجه به بکارگیری مستمر تکنیکهای جدید توسط تولید کنندگان هرزنامه ها نیاز بیش ازپیش به استفاده ازتکنیکهای جدید و هوشمند مقابله با این هرزنامه ها احساس میشود درحال حاضر استفاده ازالگوریتم های یادگیری ماشین یکی ازموثرترین ومحبوب ترین روشهادرفیلترکردن خودکارهرزنامه ها می باشددراین مقاله مدل جدیدی برای فیلترکردن خودکار هرزنامه ها براساس روشهای ترکیبی یادگیری ماشین ازجمله الگوریتم Ensemble ارایه شدها ست برای پیاده سازی ازنرم افزار RapidMinerاستفاده شدها ست این مدل شامل دوفاز پیش پردازش مجموعه داده و فاز دسته بندی ایمیل ها می باشد فاز پیش پردازششامل مراحل اماده ساز یمجموعه داده شاخص گذاری و وزندهی شاخصها می باشد مرحله اماده سازی شامل بخشهای یک شکل سازی متن تقسیم متن به واحدهای با معنی مثل کلمه حذف کلمات متوقف کننده و علائم نگارشی می باشد مادرمدل پیشنهادی برای شاخص گذاری درفاز پیش پردازش ازروش N-gramوبرای وزن دهی به شاخصها ازفیلتر TF.IDF استفاده کرده ایم

کلیدواژه ها:

هرزنامه ، فیلترکردن ، دسته بندی ایمیل ، الگوریتم های ترکیبی یادگیری ماشین

نویسندگان

فاطمه حیدری

کارشناسی ارشدنرم افزارجهاد دانشگاهی خوزستان اهواز ایران

علیرضا عصاره

دانشیارگروه کامپیوتر دانشگاه شهیدچمران اهواز ایران

بیتا شادگار

استادیارگروه کامپیوتر دانشگاه شهیدچمران اهواز ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • م. صنیعی، س. محمودی و م. طاهرپور، داده کاوی کاربردی: ...
  • S. Mohammed, O. Mohammed, ]. Fiaidhi, S. Fong and T. ...
  • V. Christina, S. Karpagavalli and G. Suganya, Email Spam Filtering ...
  • E. P. Jiang, Content-based Spam Email Classification using Mach ine-Learning ...
  • W. A. Awad and S. M. Elseuofi, Machine Learning Methods ...
  • Alpaydn, E., Introduction _ Machine Learning, The MIT Press Cambridge, ...
  • ]. N. Shriva stavaand M. H. Bindu, E-mail Spam Filtering ...
  • _ Clark, _ Koprinska and]. Poon, A Neural Network Based ...
  • N. Vapnik, Support Vector ب [8]H. Drucker, D. Wu and ...
  • D. Vira, P. Raja and S. Gada, An Approach to ...
  • F. Temitayo, O. Stephen and A. Abimbola, Hybrid GA- SVM ...
  • K. Singhai, Artificial ک [11] H. S. Hota, A. K. ...
  • K. C. Ying, S. W. Lin, Z. J. Lee and ...
  • I. Kanaris, K. Kanaris, I. Houvardasand E. Stamatatos, Words Versus ...
  • A. Beiranvand, A. Osarehand B. SHadgar, Spam Filtering By Using ...
  • S. M. Pourhashemi, A. Osarehand B. SHadgar, Presenting _ Hybrid ...
  • M. Junker and A. Abecker, Exploiting Thesaurus Knowledge in Rule ...
  • S. Eyheramendy, A. Genkin, W.-H.]u, D. D. Lewis and D. ...
  • W. B. Cavnar, Using an n-gram-based Document Representation with _ ...
  • W. SHang, H. Huang, H. Zhu, Y. Lin, Y. Quand ...
  • H. Bhavsar and A. Ganatra, A Comparative Study of Training ...
  • _ C. Platt, Fast training of support vector machines using ...
  • F. Sebastiani, Machine Learning in Automated Text Categorization, ACM Computing ...
  • نمایش کامل مراجع