الگوریتم جدیدی برای نمره دهی به محتوای آنلاین پیش از انتشار

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 411

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CARSE04_069

تاریخ نمایه سازی: 17 اسفند 1398

چکیده مقاله:

در دو دهه اخیرحجم اطلاعات مختلف در بستر شبکه اینترنت رشد چشمگیری داشته است. با مطرح شدن تجارت الکترونیک، تبلیغات اینترنتی و همچنین زیاد شدن تعداد وبسایتها، موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کمترین زمان ایجاد شدند. کاربران برای یافتن اطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایش میدهد را مورد بررسی قرار میدهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برای صاحبان وبسایتها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادن صفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشتهاند. این تلاشها منجر به افزایش میزان اهمیت روشهای رتبه بندی در موتورهای جستجو گردید. تاکنون پژوهشهای زیادی برای تشخیص صفحات مرتبط با نیاز کاربر صورت گرفته است. با این حال این حوزه پژوهش هنوز هم دارای چالشهای زیادی میباشد که پژوهشگران روشهایی را برای مقابله با آنها ارائه میکنند. در این پایان نامه با ارائه یک الگوریتم ترکیبی مبتنی بر مدل فضای برداری، تلاش میشود صفحات با محتوای مناسب از سایر صفحات موجود در بستر وب، با کارایی بالا تمیز داده شود. استفاده از نتایج موتور جستجوی گوگل و محاسبه شباهت هر صفحه با صفحه های معیار گوگل، منجر به بهبود عملکرد روش پیشنهادی شده است. نتایج ارزیابیهای صورت گرفته و مقایسه آن با نتایج موتور جستجوی های مطرح بومی (یوز و پارسیجو) نشان دهنده کارایی بالای روش پیشنهادی میباشد.

نویسندگان

بهراد کیانی

دانشجوی کارشناسی ارشد دانشگاه رازی