بهینه سازی تشخیص هرز صفحات وبی بر اساس الگوریتم بهینه سازحرکت دسته جمعی ذرات

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 511

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CRSTCONF02_025

تاریخ نمایه سازی: 21 شهریور 1395

چکیده مقاله:

هرز صفحات وبی یکی از چالش های اساسی دنیای موتورهای جستجو می باشد که از ابتدای پیدایش موتورهایجستجو با آن همراه بوده است. با توجه به اینکه عملکرد سیستم های بهینهساز جستجو و سیستم های ایجاد هرز صفحه وبی بسیار مشابه می-باشد در نتیجه تشخیص هرز صفحات کار بسیار دشواری بوده و تاکنون هیچ روش مطمئنی برای این موضوع ارائه نشده است. به هر حال معمولاً تکنیک های هرز صفحات وبی برای مغشوشکردن موتور جستجو پیادهسازی خواهند شد بنابراین مطالعه اینکه چگونه به صورت خودکار بر اساس روش های یادگیری ماشین، هرز صفحات وبی را آشکارکنیم، مفید است. در اغلبالگوریتم های آشکارسازی هرز صفحات، تشخیص بر اساس الگوریتم های یادگیری میباشد، یعنی شناسایی هرز صفحات به عنوان یک مسئله طبقهبندی باینری مورد بحث قرار گرفته می شود، به طوریکه هرز صفحات، )هرزنامه یا نرمال( برچسب می- خوردند. دراین مقاله در مورد چگونگی آشکارشدن هرز صفحات وبی توسط الگوریتم بهینهساز مجموعه ذرات بحث میکنیم. درالگوریتم بهینهساز مجموعه ذرات راه حلی برای یک مشکل )یعنی یک تابع تشخیص( به عنوان یک ذره در یک جمعیت ارائه شده است نتایج آزمایشات نشان می دهد که الگوریتم پیشنهادی نسبت به کارهای گذشته مخصوصاً الگوریتم ژنتیک دارای دقت بیشتری بوده و در زمان کمتر به نتیجه خواهد رسید. همچنین این روش پارامترهای کمی برای تنظیم احتیاج دارد

کلیدواژه ها:

هرز صفحات وبی ، الگوریتم بهینه ساز مجموعه ذرات ، رتبه بندی ، الگوریتم های یادگیری

نویسندگان

مرتضی پولادخای

کارشناسی ارشد مهندسی نرم افزار، مدرس دانشگاه آزاد اسلامی واحد جیرفت

ندا پاینده

کارشناسی ارشد مهندسی نرم افزار، موسسه آموزش عالی جاوید جیرفت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • B. Wu, V. Goel, and B. Davidson, Topical trustrank: Using ...
  • B. Zhou, J. Pei, OSD: An online WebSpam Detection System, ...
  • Hynek, J.: An Improved Genetic Algorithm for the web spam ...
  • J. Kleinberg, Authoriative SOurces in a hyperlinked environment, Jourmal of ...
  • J. Piskorski, M. Sydow, D. Weiss, Exploring Linguistic Features for ...
  • M.Goodstein, v. Vassilevska, A Two Player Game To Combat Web ...
  • Marcio Carvalho, Teresa B. Ludermir., An Analysis of PSO Hybrid ...
  • P. Metaxas, J. DeStephano, WebSpam, Propaganda and Trust, AIRWeb05, Chiba, ...
  • Y. Tan and Z. Xiao, "Clonal particle SWaTm optimization and ...
  • Z. Gyongyi, H. Garcia Molina, Web Spam Taxonomy, 14th International ...
  • نمایش کامل مراجع