ترکیب خطی ویژگیهای اسناد وب با استفاده از کمینه کردن گرادیان

سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,124

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC15_228

تاریخ نمایه سازی: 26 مهر 1388

چکیده مقاله:

امروزه به دلیل وجود حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهمترین چالش در بازیابی اطلا عات وب، خصوصاً موتور های جستجو، رتبه بندی نتایج در پاسخ به پرس وجوی کاربرمیباشد. تاکنون الگوریتم های متنوعی که مبتنی بر محتو ا و اتصال می باشند، ارائه شده اند. در روش ارائه شده در این مقاله ما رابطه ی نسبی جفت اسناد و ویژگی هایشان را جهت ترکیب خطی ویژگی های ساختاری و محتوایی استفاده کرده ایم. این روش ۴۴ ویژگی یک صفحه شامل ویژگیهای پیچیده مانند روشهای رتبه بندی BM25 و PageRank و یا ساده مانند تکرار واژه ها و طول سند را به صورت خطی با هم ترکیب می کن د. فرآیند یادگیری جهت ترکیب ویژگیهای مختلف با توجه به کاربران یا نظر افراد خبره در مورد درجه ی ارتباط پرس وجو و سند انجام می شود. روش مینیمم نمودن گرادیان جهت کمینه کردن تابع هزینه و در نهایت پیدا کردن بردار وز ن دار مناسب استفاده شده است . پیاده سازی روش ارائه شده ساده میباشد و با استفاده از داده ی محک LETOR ارزیابی شده است.

کلیدواژه ها:

الگوریتم های رتبه بندی وب ، رتبه بندی ترکیبی ، یادگیری جهت رتبه بندی

نویسندگان

علی محمد زارع بیدکی

دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد