فیلتر کردن ایمیل های اسپم با استفاده از یک الگوریتم منفرد و روش وزن دهی TF-IDF

سیدمجتبی غرابی; حمید پایگذار

فیلتر کردن ایمیل های اسپم با استفاده از یک الگوریتم منفرد و روش وزن دهی TF-IDF

محل انتشار: اولین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 497

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/668538

شناسه ملی سند علمی:

CEITECH01_018

تاریخ نمایه سازی: 17 آبان 1396

چکیده مقاله:

امروزه هرزنامه ها مانند سیلی عظیم، و با کپی های فراوان از پیامهای مشابه اینترنت را فرا گرفته اند. و تلاش دارند که پیام خود رابه مردمی که به هیچ طریق دیگری حاضر به دریافت آن پیامها نیستند تحمیل کنند. بیشتر اسپم ها حاوی تبلیغات تجاری هستند کهاین تبلیغات بیشتر به تبلیغ محصولات شبهه برانگیز یا سرویس های شبه قانونی می پردازند و یا ادعاهایی را مبنی بر پولدار کردن شمامطرح می سازند. هزینه ارسال هرزنامه ها برای فرستنده بسیار ناچیز است و بیشتر هزینه ها توسط دریافت کنندگان اسپم یا واسطه هاپرداخت می شود. اسپم اثری بیش از مزاحمت برای استفاده کنندگان اینترنت دارد و بطور جدی بازدهی شبکه و سرویس دهندگانایمیل را تحت تاثیر قرار می دهد. و این به این دلیل است که فرستندگان اسپم از هزینه بسیار پایین ایمیل استفاده می کنند و صدهاهزار یا حتی میلیون ها ایمیل را در یک زمان ارسال می کنند. حمل ههای اسپم پهنای باند زیادی را می گیرد، صندوق های پستی را پرمی کند و زمان خوانندگان ایمیل را تلف می کند. امروزه دیدگاه تکنولوژیکی و فناوری موضوع بسیار مهمی بنام هرزنامه را مطرح نمودهکه از نظر قانونی باید نسبت به آن جلوگیری شود. اگر چه سال های اخیر معرفی تعداد زیادی از الگوریتم های دسته بندی متنیمطرح شده است ولی متن کاوی نیازمند یک سری مراحل پیش پردازش، الگوریتم موثرکارآمد و یادگیرنده سریع می باشند. در اینمقاله با آزمایش های که بر روی مجموعه داده اسپم انجام شده یک روش با قابلیت اعتماد بالا و نرخ خطای پایین را ارایه نموده ایم.

کلیدواژه ها:

اسپم ، هرزنامه ، تشخیص هرزنامه ، یادگیری ماشین ، داده کاوی

نویسندگان

سیدمجتبی غرابی

دانشجو کارشناسی ارشد، گروه مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد خمین

حمید پایگذار

عضو هییت علمی دانشکده فنی مهندسی، گروه مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد خمین