فیلترکردن هرزنامه ها با استفاده از ترکیب الگوریتم های AdaBoost ونایوبیز با رویکرد مبتنی برکاهش بعد، تحلیل الگوی متمایزخطی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 495

فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

FBFI01_045

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

امروزه ایمیل یا پست الکترونیکی یکی از رایج ترین ابزارهای ارتباطی در زندگی روزمره است. ایمیل روشی سریع و ارزان قیمت برای برقراری این ارتباط است متاسفانه همین عمومیت و سادگی استفاده ازایمیل باعث شده تا موردسوء استفاده هرزنامه نویسان و کلاهبرداران اینترنتی قرار بگیرد، استفاده از ابزار و روشهایی برای شناسایی و فیلترهرزنامه ها ضرورتی غیراقبل انکار است. هرزنامه یا اسپم نامه ای الکترونیکی ناخواسته است که به طور نامشخص، به طور مستقیم یا غیرمستقیم توسط فردی که نسبتی با گیرنده نامه ندارد فرستاده شده است. تاکنون فیلترهای ضدهرزنامه مختلفی عرضه شده اند که اکثر آنها براساس تطبیق قوانین ثابت عمل می کنند.قوانین این سامانه ها به صورت دستی توسط کاربر تعیین می شوند و شامل ویژگی ها و مشخصات ثابت نامه های الکترونیکی نامعتبر یا هرزنامه هستند و عمل حذف هرزنامه براساس آنها انجام می شود. در این مقاله برای فیلترکردن ایمیل ها از الگوریتم دسته بند نایوبیز والگوریتم کاهش بعد، تحلیل الگوی متمایزخطی و همچنین الگوریتم ترکیبی AdaBoost استفاده نموده ایم. روش پیشنهادی روی مجموعه داده های استاندارد، LingSpam و Enron5 ارزیابی شده است. نتایج حاصل از ارزیابی روش پیشنهادی نشان می دهد که روش پیشنهادی باعث بالابردن معیارهای دقت، صحت، بازخوانی و کارایی فیلترکردن هرزنامه ها شده است.

نویسندگان

مرادعلی قادری

دانشجوی کارشناسی ارشد مهندسی نرم افزار، دانشگاه آزاد اسلامی واحد بروجرد،

محمد ابراهیم شیری

دانشگاه صنعتی امیرکبیر،دانشکده ریاضی و علوم کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ _ _ Academy of Sciences Azerbaijan, vol. 3, pp. ...
  • and S.M. Elseuofi W.A Awad, "Machine Learning Methods For Spam ...
  • H. Huang, H. Zhu, Y. Lin, Y. Qu, and Z. ...
  • Categorization" Expert Systems with Applications, vol. 33, no. 01, pp. ...
  • S. Nazirova, "Survey on Spam Filtering Techniques" Commun ications and ...
  • A. Osareh, and B. Shadgar A. Beiranvand, "Spam filtering by ...
  • Robert F. Erbache Vikas P. Deshpande, "An Evaluation of Naive ...
  • "Why Bayesian filtering is the most effective anti-spam technology" GFI ...
  • M. Puszta, F. Barcak, and P. Bednar K. Machova, "A ...
  • J. V. Hulse, and A. Napolitano T. M. Khoshgoftar, ...
  • and Imbalanced Dataon-568" Systems, Man and Cybernetics, Part A: Systems ...
  • K. Fodor, "A survey of dimension reduction techniques, " technical ...
  • C.L.T.Tan M.Lan, "Supervised and Traditional Term Weightings Metods for Automatic ...
  • Shabbir Ahmed and Farzana Mithun, "Word Stemming to Enhance Spam ...
  • S. H. Mustafa, "Character Contiguity in N-gram-based Word Matching: the ...
  • Qinqing Ren, "Feature-Fus ion Framework for Spam Filtering Based on ...
  • N. Goharian S. S. Mengle, "Ambiguity Measure Feature- Selection Algorithm" ...
  • Rapiminer. [Online]. _ _ iner.com/ ...
  • Csmining Group. [Online]. ...
  • نمایش کامل مراجع