بررسی تاثیر سایز ویژگی ها به کمک دو الگوریتم IG و Relief ، بر روی طبقه بندی ایمیلبا استفاده از درخت های تصمیم

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,031

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCEB01_068

تاریخ نمایه سازی: 18 خرداد 1393

چکیده مقاله:

اینترنت به طور چشمگیری ارتباط مردم و ارتباط با دیگران را تغییر داده است، ایمیل یکی از سرویس هایی که امروزه اینترنت برای کاربرانش فراهم میآورد، این سرویس به علت هزینه کم مورد توجه بسیاری از کاربران قرار گرفته است. در کنار مزایای زیاد پست الکترونیکی، یکی از ضعف های این سرویس این است که دائما بر تعداد ایمیل هایی که دریافت میگردد افزوده میشود. گسترش سریع این سرویس در میان کاربران اینترنت باعث شده عدهای در صدد سوءاستفاده از آن برآیند که نتیجه آن گسترش هرزنامه ها شده است،در واقع فیلتر هرزنامه ها، یک برنامه کامپیوتری است که توانایی دسته بندی نامه های الکترونیکی را دارا میباشد، بیشتر این فیلترها از ترکیبی از چندین روش مانند فهرست های سیاه یا سفید، استفاده از واژه های کلیدی، فیلترهایی بر پایه قانون و غیره برای شناسایی دقیقتر هرزنامه ها بهره میبرند. این روشها خود میتوانند به تنهایی فیلتری موثر باشند، ولی در کاربردهای تجاری از ترکیب اینروشها استفاده میشود. در این تحقیق ما از درختهای تصمیم برای طبقه بندی ایمیل ها استفاده کرده و نتایج حاصل از کاهش ویژگی توسط دو الگوریتم Relief و InformationGain با استفاده از طبقه بندهای درختی را مقایسه کرده ایم.

نویسندگان

فروزان کیامرزپور

کارشناس ارشد مهندسی کامپیوتر مدرس دانشگاه آزاد اسلامی واحد دلوار

عنایت اله بیاتی

کارشناس ارشد مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد علوم و تحقیقات اصفهان

زینب حبیبی دهنه سیری

دانشجوی کارشناسی مهندسی تکنولوژی نرم افزار کامپیوتر دانشگاه آزاد اسلامی واحد دلوار

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ _ _ _ metrics _ _ _ WGMetric 2006 ...
  • spambase dadaset available in: ...
  • J. Goodman, "IP Address in Email Clients, Conf on Email ...
  • A. Ciltik, T. Gungor, "Timeefficient spam email filtering using ngram ...
  • M. Chang, C. K. Poon, "Using Phrases as Features in ...
  • H. Hu, B. Yu, "Automatic Thesaurus Construction for Spam Filtering ...
  • Text Categorization ", computers and Mathematics with Application, _ _ ...
  • نمایش کامل مراجع