بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو
محل انتشار: فصلنامه مدل سازی در مهندسی، دوره: 14، شماره: 47
سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 367
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JME-14-47_018
تاریخ نمایه سازی: 20 آبان 1397
چکیده مقاله:
بسط پرس و جو به عنوان یکی از روشهای انطباق پرس وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس و جو است که فرض می کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس و جو هستند و کلمات بسط را از این اسناد انتخاب می کند. در حالی که ممکن است اسناد نامرتبط به پرس و جو در اسناد رتبه بالا وجود داشته باشد. روش هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه بالا ارایه شده است که از خوشه بندی و یا طبقه بندی اسناد استفاده کرده اند. مهم ترین موضوع در بسط پرس وجو، انتخاب کلمات بسط از مرتبط ترین استاد است. در این مقاله ما خوشه بندی اسناد شبه بازخورد را براساس شباهت حساس به پرس وجو ارایه می کنیم که در قرار دادن شبیه ترین اسناد در کنار هم موثر است. شباهت حساس به پرس وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه ها را مطابق با شباهت درونی شان رتبه بندی کرده و تعدادی از خوشه های رتبه بالا را برای بسط انتخاب می کنیم. کلمات بسط را از اسناد خوشه های انتخاب شده، براساس تابع رتبه بندیTF- IDF استخراج می کنیم. آزمایش های انجام شده روی مجموعه داده ی پزشکی MED نشان میدهد که نتایج جستجو برای پرس و جوهای بسط داده شده با اسناد انتخاب شده از خوشه ها، نسبت به روش بازخورد شبه مرتبط (PRF) و بازیابی اولیه (VSM) بهتر است و اثربخشی جستجو را افزایش میدهد.
کلیدواژه ها:
نویسندگان
رضا خدایی
کارشناس ارشد مهندسی کامپیوتر (نرم افزار)، دانشگاه تبریز
محمدعلی بالافر
استادیار، دانشکده برق و کامپیوتر، دانشگاه تبریز
سیدناصر رضوی
استادیار، دانشکده برق و کامپیوتر، دانشگاه تبریز