شناسایی و رتبه بندی سوالات مشابه در سیستم های پرس و پاسخ جمعی مبتنی بر شباهت لغوی، معنایی و ساختاری سوالات

سارا معینی; محمد رضا موسوی

شناسایی و رتبه بندی سوالات مشابه در سیستم های پرس و پاسخ جمعی مبتنی بر شباهت لغوی، معنایی و ساختاری سوالات

محل انتشار: چهارمین کنفرانس ملی تکنولوژی در مهندسی برق و کامپیوتر

سال انتشار: 1398

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 440

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > متن کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/989098

شناسه ملی سند علمی:

ETECH04_083

تاریخ نمایه سازی: 27 بهمن 1398

چکیده مقاله:

سیستم های پرس و پاسخ جمعی (community question answering systems) همانند Yahoo! Answers ،Stack Exchange و Quora در سال های اخیر با رشد چشمگیری مواجه شده اند و کاربران زیادی را به خود جذب کرده اند. یکی از مسائل مهم در این سیستم ها شناسایی سوالات مشابه با یک سوال جدید است. به صورت معمول مجموعه ای از سوالات جدید وجود دارد و به ازای هر سوال جدید، تعدادی از سوالات قدیمی به عنوان کاندیدا وجود دارند که باید بر اساس میزان شباهتشان با سوال جدید برچسبگذاری و رتبه بندی شوند. در روش ارائه شده در این مقاله پس از پیشپردازش سوالات، به ازای هر جفت سوال مجموعه ای از ویژگی ها بر اساس شباهت لغوی، معنایی و ساختاری استخراج شده و در نهایت از یک الگوریتم طبقه بندی برای تشخیص اینکه سوالات مرتبط هستند یا خیر، استفاده می شود. برای ارزیابی روش ارائه شده از مجموعه داده سومین چالش مسابقات SemEval-2017 استفاده شده است. با به کار بردن این روش، هر دو معیار mAP و F1 در مقایسه با برنده تیم شرکت کننده در این چالش، بهبود یافته است.

کلیدواژه ها:

بازیابی پرسش ، سیستم های پرسش و پاسخ جمعی ، شباهت متن ، شناسایی سوالات مشابه ، متن کاوی

نویسندگان

سارا معینی

دانشکده مهندسی برق و کامپیوتر، دانشگاه شیراز شیراز، ایران

محمد رضا موسوی

دانشکده مهندسی برق و کامپیوتر، دانشگاه شیراز شیراز، ایران