ارائه راهکاری به منظور افزایش دقت متعادل سازی ایمیل مخرب و غلبه بر مشکل عدم تشخیص

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 511

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF04_007

تاریخ نمایه سازی: 30 شهریور 1398

چکیده مقاله:

هرچند که روشهای مختلفی برای پیش پردازش ایمیل مخرب ها موجود است ولی عملکرد و دقت این روش ها متفاوت است و تلاش در جهت ارائه روشی کارامد امری ضروری است.با توجه به اهمیت ایمیل مخرب ها در جهان کنونی و افزایش حجم ایمیل مخرب ها مساله پیش پردازش مناسب ایمیل مخرب ها بخصوص ایمیل ایمیل های مخرب یک چالش به نظر میرسد.اغلب روش های موجود در پیش پردازش ایمیل مخرب های ناتوازن به سمت کلاس اکثریت تمایل دارند و این امر باعث می شود که ایمیل مخرب های کلاس اقلیت به صورت نویز در نظر گرفته شود. همانطور که پیش از این نیز گفته شد برای دست یابی به نتایج مطلوب در ایمیل مخرب کاوی نیاز به پیشپردازش ایمیل مخرب ها داریم.میتوان ادعا کرد که اگر مرحله آماده سازی ایمیل مخرب ها به خوبی صورت نپذیرد، نتایجی بدست می آید که نمیتواند مورد استفاده قرار گیرد و ممکن است که هزینه و زمان به کار رفته برای دست یابی به نتیجه موثر هدر رود و نتایج حاصل به دلیل عدم پیش پردازش مناسب ایمیل مخرب غیر قابل استفاده و نادرست باشد. اخیرا مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی ایمیل مخربکاوی قرار گرفته است. در موارد متعددی کلاسی که از نقطه نظر دامنه ی کاربردی اهمیت زیادی دارد)کلاس اصلی( شامل تعداد حالات کمتری نسبت به کلاسی است که کلاس اکثریت می باشد. این مجموعه ی ایمیل مخربها نامتوازن نامیده میشود. رویکرد سنتی ایمیل مخرب کاوی توانایی خوبی برای پیشبینی نمونه های اقلیت که مورد توجه است ندارند. متاسفانه در اکثر موارد ایمیل مخربهای واقعی دارای این خصوصیت هستند. به عنوان مثال در تشخیص بیماریهای نادر، حملات شبکه، متن کاوی و ... معمولا توزیع ایمیل مخربها نامتوازن می باشد. در واقع مساله این است که چگونه میتوان ایمیل ایمیل های مخرب را به گونه ای پیش پردازش کرد که در خوشه های مناسب و درست طبقه بندی شوند.بنابراین مساله این تحقیق ارائه روشی جهت پیش پردازش ایمیل مخرب های نا متوازن است به گونه ای که کارایی و دقت آن در مقایسه با روش های دیگر بیشتر باشد.در روش ارائه شده در این تحقیق برای ارتقای روش ماشین بردار پشتیبان از تکنیک حداقل مربعات با متراقلیدسی استفاده نمودیم.این روش بهبود یافته را M-SVM مینامیم.بنابراین مساله را بدین شکل طرح می نماییم، چگونه میتوان در روش پیش پردازش ایمیل ایمیل های مخرب به دقت بالاتری دست یافت و ازپیش پردازش صحیح ایمیل مخرب برای دست یابی به نتایج صحیح در حوزه کاربردی استفاده نمود.از انجاکه ایمیل مخرب های متفاوتی وجود دارد ما پیش پردازش بر روی مجموعه ایمیل ایمیل های مخرب راانتحاب کردیم

نویسندگان

حسین شهبازی

دانشجو کارشناسی ارشددانشگاه مهر آستان