بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو

سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 367

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JME-14-47_018

تاریخ نمایه سازی: 20 آبان 1397

چکیده مقاله:

بسط پرس و جو به عنوان یکی از روشهای انطباق پرس وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس و جو است که فرض می کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس و جو هستند و کلمات بسط را از این اسناد انتخاب می کند. در حالی که ممکن است اسناد نامرتبط به پرس و جو در اسناد رتبه بالا وجود داشته باشد. روش هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه بالا ارایه شده است که از خوشه بندی و یا طبقه بندی اسناد استفاده کرده اند. مهم ترین موضوع در بسط پرس وجو، انتخاب کلمات بسط از مرتبط ترین استاد است. در این مقاله ما خوشه بندی اسناد شبه بازخورد را براساس شباهت حساس به پرس وجو ارایه می کنیم که در قرار دادن شبیه ترین اسناد در کنار هم موثر است. شباهت حساس به پرس وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه ها را مطابق با شباهت درونی شان رتبه بندی کرده و تعدادی از خوشه های رتبه بالا را برای بسط انتخاب می کنیم. کلمات بسط را از اسناد خوشه های انتخاب شده، براساس تابع رتبه بندیTF- IDF استخراج می کنیم. آزمایش های انجام شده روی مجموعه داده ی پزشکی MED نشان میدهد که نتایج جستجو برای پرس و جوهای بسط داده شده با اسناد انتخاب شده از خوشه ها، نسبت به روش بازخورد شبه مرتبط (PRF) و بازیابی اولیه (VSM) بهتر است و اثربخشی جستجو را افزایش میدهد.

کلیدواژه ها:

بازیابی اطلاعات ، بسط پرس و جو ، شباهت حساس به پرس وجو ، بازخورد شبه مرتبط

نویسندگان

رضا خدایی

کارشناس ارشد مهندسی کامپیوتر (نرم افزار)، دانشگاه تبریز

محمدعلی بالافر

استادیار، دانشکده برق و کامپیوتر، دانشگاه تبریز

سیدناصر رضوی

استادیار، دانشکده برق و کامپیوتر، دانشگاه تبریز