فیلترکردن هرزنامه ها با استفاده از ترکیب الگوریتم های AdaBoost ونایوبیز با رویکرد مبتنی برکاهش بعد، تحلیل الگوی متمایزخطی
محل انتشار: نخستین کنفرانس بین المللی فناوری اطلاعات
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 495
فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FBFI01_045
تاریخ نمایه سازی: 9 مرداد 1395
چکیده مقاله:
امروزه ایمیل یا پست الکترونیکی یکی از رایج ترین ابزارهای ارتباطی در زندگی روزمره است. ایمیل روشی سریع و ارزان قیمت برای برقراری این ارتباط است متاسفانه همین عمومیت و سادگی استفاده ازایمیل باعث شده تا موردسوء استفاده هرزنامه نویسان و کلاهبرداران اینترنتی قرار بگیرد، استفاده از ابزار و روشهایی برای شناسایی و فیلترهرزنامه ها ضرورتی غیراقبل انکار است. هرزنامه یا اسپم نامه ای الکترونیکی ناخواسته است که به طور نامشخص، به طور مستقیم یا غیرمستقیم توسط فردی که نسبتی با گیرنده نامه ندارد فرستاده شده است. تاکنون فیلترهای ضدهرزنامه مختلفی عرضه شده اند که اکثر آنها براساس تطبیق قوانین ثابت عمل می کنند.قوانین این سامانه ها به صورت دستی توسط کاربر تعیین می شوند و شامل ویژگی ها و مشخصات ثابت نامه های الکترونیکی نامعتبر یا هرزنامه هستند و عمل حذف هرزنامه براساس آنها انجام می شود. در این مقاله برای فیلترکردن ایمیل ها از الگوریتم دسته بند نایوبیز والگوریتم کاهش بعد، تحلیل الگوی متمایزخطی و همچنین الگوریتم ترکیبی AdaBoost استفاده نموده ایم. روش پیشنهادی روی مجموعه داده های استاندارد، LingSpam و Enron5 ارزیابی شده است. نتایج حاصل از ارزیابی روش پیشنهادی نشان می دهد که روش پیشنهادی باعث بالابردن معیارهای دقت، صحت، بازخوانی و کارایی فیلترکردن هرزنامه ها شده است.
کلیدواژه ها:
نویسندگان
مرادعلی قادری
دانشجوی کارشناسی ارشد مهندسی نرم افزار، دانشگاه آزاد اسلامی واحد بروجرد،
محمد ابراهیم شیری
دانشگاه صنعتی امیرکبیر،دانشکده ریاضی و علوم کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :