فیلتر کردن هرزنامه های پست الکترونیکی با روشهای ترکیبی یادگیری ماشین

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 470

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITECH01_037

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

افزایش حجم هرزنامه ها، نیاز به یک سیستم دقیق و کارای فیلترینگ هرزنامه در پست الکترونیکی را نتیجه خواهد داد.هدف این تحقیق، ارایهی یک روش یادگیری ماشین ترکیبی برای بالابردن کارایی در تشخیص و فیلتر کردن خودکار اینهرزنامه ها و تفکیک آنها از پیام های قانونی می باشد. استفاده از تلفیق روشهای ترکیبی یادگیری ماشین و پردازش هایپست الکترونیک متن- گرا، خصوصا در بخش فیلترهای انتخاب ویژگی تا کنون بسیار محدود انجام پذیرفته و روشهایترکیبی پیشین خطای نسبتا بالایی در تشخیص هرزنامه ها داشته اند. در این مقاله، از یک روش ترکیبی جدید در فازانتخاب ویژگی استفاده شده است. در این روش، ابتدا عملیات پیش پردازش بر روی متون پیام ها انجام پذیرفته، پس از آنویژگی های استخراج شده به دو فیلتر پشت سر هم داده شده و بهترین ویژگیها بعنوان ویژگی های نهایی، انتخاب شده و بادسته بندهای مختلف (با تنظیم پارامترهای مربوطه)، مورد تست قرار می گیرند. نتایج نشان می دهد که کارایی این روشبالای 99 % می باشد.

نویسندگان

مرضیه مبارکی

گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد مرودشت، مرودشت، ایران

منصور امینی لاری

گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد مرودشت، مرودشت، ایران