شناسایی هرزنامه ها با استفاده از الگوریتم دسته بندی درخت تصمیم با یک رویکرد مبتنی برکاهش بعد، تحلیل مولفه های اساسی

مرادعلی قادری; محمد ابراهیم شیری

شناسایی هرزنامه ها با استفاده از الگوریتم دسته بندی درخت تصمیم با یک رویکرد مبتنی برکاهش بعد، تحلیل مولفه های اساسی

محل انتشار: نخستین کنفرانس بین المللی فناوری اطلاعات

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,090

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/478082

شناسه ملی سند علمی:

FBFI01_114

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

محبوبیت روزافزون و کم بودن هزینه پست الکترونیکی این زمینه را فراهم کرده است تا بسیاری اقدام به ارسال نامه های الکترونیکی ناخواسته درحجم انبوه کنند. این نامه ها به اصطلاح هرزنامه نامیده می شوند. هرزنامه ها یکی از بزرگترین مشکلات کاربران پست الکترونیکی هستند که سبب اتلاف وقت، کاهش امنیتو کاهش کارایی کامپیوتر می شوند. برای غلبه بر این مشکل روشهای مختلفی ارائه شده است. در این مقاله یک روش برای شناسایی و دسته بندی ایمیل ها به دو دسته هرزنامه یا اسپم و نامه معتبر با غیر اسپم براساس الگوریتم درخت تصمیم ارائه نموده ایم.در روش پیشنهادی از الگوریتم کاهش بعد، تحلیل مولفه های اساسی(PCA) برای کاهش بعد فضای ویژگی ها استفاده نموده ایم و همچنین الگوریتم ترکیبیBagging را روی الگوریتم درخت تصمیم اعمال نموده ایم. روش پیشنهادی روی مجموعه داده استاندارد، Lingspam ارزیابی شده است. تاکنون الگوریتم های زیادی برای شناسایی هرزنامه ها توسط الگوریتم های یادگیری ماشین در مقالات ارائه شده که نتایج حاصل از ارزیابی روش پیشنهادی نشان می دهد که روش پیشنهادی باعث بالابردن معیارهای دقت، صحت ،بازخوانی و کارایی دسته بندی هرزنامه ها شده است.

کلیدواژه ها:

پست الکترونیکی ، هرزنامه ، یادگیری ماشین ، دسته بندی ، کاهش بعد ، درخت تصمیم ، الگوریتم ترکیبی

نویسندگان

مرادعلی قادری

دانشجوی کارشناسی ارشد مهندسی نرم افزار، دانشگاه آزاد اسلامی واحد بروجرد،

محمد ابراهیم شیری

دانشگاه صنعتی امیرکبیر،دانشکده ریاضی و علوم کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

S. Nazirova, "Survey on Spam Filtering Techniques, " Commun ications ...
C.L.T.Tan M.Lan, "Supervised and Traditional Term Weightings Metods for Automatic ...
S. Karpagavalli, and G. Suganya V. Christina, "Email Spam Filtering ...
M. Puszta, F. Barcak, and P. Bednar K. Machova, "A ...
S. W. Lin, Z. J. Lee, and Y. T. Lin ...
J. V. Hulse, and A. Napolitano T. M. Khoshgoftaar, ...
"Comparing Boosting and Bagging Techniques with Noisy and Imbalanced Dataon-568, ...
K. Fodor, "A Survey of dimension reduction techniques, " ...
technical report, Lawrence Livemore National Laboratory, june 2002. ...
Lindsay I Smith, "A tutorial on Principal Components Analysis, " ...
and N. Goharian S. S. Mengle, "Ambiguity Measure Feature -Selection ...
F. Sebastiani, "Machine Learning in Automated Text Categorization, _ ACM ...
A. Osareh, and B. Shadgar A. Beiranvand, "Spam filtering by ...
S.M. Elseuofi W.A Awad, "Machine Learning Methods ...
vol. 3, No 1, pp. 23-28, 2011. ...
_ _ _ _ _ W. Shang, ategorization, " Expert ...
S. M. Pourhashem, "E-mail Spam Filtering By a New Hybrid ...
M. Besavaraju and R. Prabhakar, "A novel method of spam ...
Y. Zhu and Y. Tan, "A local- concentrat ion-based featu ...

نمایش کامل مراجع