اثربخشی بسط پرسوجو مبتنی بر خوشه بندی اسناد شبه بازخورد با الگوریتم K-NN

سال انتشار: 1395
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 369

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-46-1_010

تاریخ نمایه سازی: 10 تیر 1396

چکیده مقاله:

بسط پرسوجو یکی از روشهای موثر در بهبود اثربخشی نتایج بازیابی اطلاعات است. روش بازخورد شبه مرتبط (PRF) فرض می کند کهاسناد رتبه بالا از نتایج اولیه بازیابی شده مرتبط به پرسوجو است و تعدادی کلمه مرتبط را از اسناد رتبه بالا برای بسط انتخاب می کند. وجود اسنادنامرتبط در بین اسناد رتبه بالا محققان را به ارایه روش هایی برای انتخاب بهترین اسناد به عنوان منبع برای انتخاب کلمه بسط سوق می دهد کهانتخاب بهترین اسناد برای استخراج کلمات مرتبط برای بسط، موضوع مهمی در روشهای بسط پرسوجو هست. در این مقاله، از خوشه بندی اسنادشبه بازخورد (CPRF) حاصل از نتایج اولیه، بر اساس شباهت مبتنی بر کلمه برای قرار دادن شبیه ترین اسناد کنار هم استفاده می شود. تعدادی از خوشهها طبق محتوایشان به عنوان خوشه های بازخورد انتخاب می شوند و از خوشه های بازخورد، اسناد رتبه بالا به عنوان اسناد بازخورد انتخابمی شوند. سپس، یک سند ترکیبی از روی اسناد انتخابی تشکیل می شود و کلمات سند ترکیبی بر اساس تابع رتبه بندی TF-IDFمرتب می شوند. بعد، کلمات رتبه بالا برای بسط انتخاب می شوند. آزمایش های انجام گرفته روی مجموعه داده پزشکی MED نشان می دهد روش پیشنهادی معیار متوسط میانگین دقت (MAP) بالاتری نسبت به روش بازخورد شبه مرتبط (PRF) دارد.

نویسندگان

رضا خدایی

دانشجوی کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

محمدعلی بالافر

استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران

سیدناصر رضوی

استادیار، دانشکده مهندسی برق و کامپیوتر - دانشگاه تبریز - تبریز - ایران