CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

الگوریتم جدیدی برای نمره دهی به محتوای آنلاین پیش از انتشار

عنوان مقاله: الگوریتم جدیدی برای نمره دهی به محتوای آنلاین پیش از انتشار
شناسه ملی مقاله: CARSE04_069
منتشر شده در چهارمین کنفرانس بین المللی پژوهش های کاربردی در علوم و مهندسی در سال 1398
مشخصات نویسندگان مقاله:

بهراد کیانی - دانشجوی کارشناسی ارشد دانشگاه رازی

خلاصه مقاله:
در دو دهه اخیرحجم اطلاعات مختلف در بستر شبکه اینترنت رشد چشمگیری داشته است. با مطرح شدن تجارت الکترونیک، تبلیغات اینترنتی و همچنین زیاد شدن تعداد وبسایتها، موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کمترین زمان ایجاد شدند. کاربران برای یافتن اطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایش میدهد را مورد بررسی قرار میدهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برای صاحبان وبسایتها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادن صفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشتهاند. این تلاشها منجر به افزایش میزان اهمیت روشهای رتبه بندی در موتورهای جستجو گردید. تاکنون پژوهشهای زیادی برای تشخیص صفحات مرتبط با نیاز کاربر صورت گرفته است. با این حال این حوزه پژوهش هنوز هم دارای چالشهای زیادی میباشد که پژوهشگران روشهایی را برای مقابله با آنها ارائه میکنند. در این پایان نامه با ارائه یک الگوریتم ترکیبی مبتنی بر مدل فضای برداری، تلاش میشود صفحات با محتوای مناسب از سایر صفحات موجود در بستر وب، با کارایی بالا تمیز داده شود. استفاده از نتایج موتور جستجوی گوگل و محاسبه شباهت هر صفحه با صفحه های معیار گوگل، منجر به بهبود عملکرد روش پیشنهادی شده است. نتایج ارزیابیهای صورت گرفته و مقایسه آن با نتایج موتور جستجوی های مطرح بومی (یوز و پارسیجو) نشان دهنده کارایی بالای روش پیشنهادی میباشد.

کلمات کلیدی:
موتور جستجو، رتبه بندی، گوگل، مدل فضای برداری، یوز، پارسی جو

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1000593/