شناسایی و رتبه بندی سوالات مشابه در سیستم های پرس و پاسخ جمعی مبتنی بر شباهت لغوی، معنایی و ساختاری سوالات

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 440

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ETECH04_083

تاریخ نمایه سازی: 27 بهمن 1398

چکیده مقاله:

سیستم های پرس و پاسخ جمعی (community question answering systems) همانند Yahoo! Answers ،Stack Exchange و Quora در سال های اخیر با رشد چشمگیری مواجه شده اند و کاربران زیادی را به خود جذب کرده اند. یکی از مسائل مهم در این سیستم ها شناسایی سوالات مشابه با یک سوال جدید است. به صورت معمول مجموعه ای از سوالات جدید وجود دارد و به ازای هر سوال جدید، تعدادی از سوالات قدیمی به عنوان کاندیدا وجود دارند که باید بر اساس میزان شباهتشان با سوال جدید برچسبگذاری و رتبه بندی شوند. در روش ارائه شده در این مقاله پس از پیشپردازش سوالات، به ازای هر جفت سوال مجموعه ای از ویژگی ها بر اساس شباهت لغوی، معنایی و ساختاری استخراج شده و در نهایت از یک الگوریتم طبقه بندی برای تشخیص اینکه سوالات مرتبط هستند یا خیر، استفاده می شود. برای ارزیابی روش ارائه شده از مجموعه داده سومین چالش مسابقات SemEval-2017 استفاده شده است. با به کار بردن این روش، هر دو معیار mAP و F1 در مقایسه با برنده تیم شرکت کننده در این چالش، بهبود یافته است.

کلیدواژه ها:

نویسندگان

سارا معینی

دانشکده مهندسی برق و کامپیوتر، دانشگاه شیراز شیراز، ایران

محمد رضا موسوی

دانشکده مهندسی برق و کامپیوتر، دانشگاه شیراز شیراز، ایران