ترکیب خطی ویژگیهای اسناد وب با استفاده از کمینه کردن گرادیان
سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,124
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSICC15_228
تاریخ نمایه سازی: 26 مهر 1388
چکیده مقاله:
امروزه به دلیل وجود حجم عظیم اطلاعات در وب و همچنین پویا بودن اطلاعات، مهمترین چالش در بازیابی اطلا عات وب، خصوصاً موتور های جستجو، رتبه بندی نتایج در پاسخ به پرس وجوی کاربرمیباشد. تاکنون الگوریتم های متنوعی که مبتنی بر محتو ا و اتصال می باشند، ارائه شده اند. در روش ارائه شده در این مقاله ما رابطه ی نسبی جفت اسناد و ویژگی هایشان را جهت ترکیب خطی ویژگی های ساختاری و محتوایی استفاده کرده ایم. این روش ۴۴ ویژگی یک صفحه شامل ویژگیهای پیچیده مانند روشهای رتبه بندی BM25 و PageRank و یا ساده مانند تکرار واژه ها و طول سند را به صورت خطی با هم ترکیب می کن د. فرآیند یادگیری جهت ترکیب ویژگیهای مختلف با توجه به کاربران یا نظر افراد خبره در مورد درجه ی ارتباط پرس وجو و سند انجام می شود. روش مینیمم نمودن گرادیان جهت کمینه کردن تابع هزینه و در نهایت پیدا کردن بردار وز ن دار مناسب استفاده شده است . پیاده سازی روش ارائه شده ساده میباشد و با استفاده از داده ی محک LETOR ارزیابی شده است.
کلیدواژه ها:
نویسندگان
علی محمد زارع بیدکی
دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد