بهبود دقت صحت پاسخ در سیستم پرسش و پاسخ بصری با استفاده از شبکه های عصبی عمیق و توجه نرم

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 102

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF20_028

تاریخ نمایه سازی: 18 شهریور 1402

چکیده مقاله:

افزایش دقت صحت پاسخ پیش بینی شده در سیستم های پرسش و پاسخ بصری همواره به عنوان یک چالش در نظر گرفتهمی شود. محققان و پژوهشگران در این حوزه همواره در تلاشند تا با استفاده از شبکه های عصبی جدید و کارآمد و ارائهمعماری ها و ساختارهای گوناگون، دقت صحت پاسخ پیش بینی شده در سیستم های پرسش و پاسخ بصری را افزایش دهند.از همین رو ما در این پژوهش با ارائه یک سیستم پرسش و پاسخ بصری با ساختاری جدید در تلاش برای افزایش دقتصحت پاسخ پیش بینی شده در این سیستم ها نسبت به کارهای پیشین هستیم. در مدل پیشنهادی این مقاله از شبکه هایعصبی پیچشی و بازگشتی و همچنین سازوکار توجه نرم استفاده شده است. برای آموزش مدل پیشنهادی نیز از هر دو نسخهمجموعه داده VQA استفاده کردیم. در نهایت نتایج بدست آمده نشان دهنده ی این موضوع است که مدل پیشنهادی در این پژوهش نسبت به مدل های موجود برای پرسش و پاسخ بصری که از مجموعه داده VQA۱.۵ استفاده کرده اند. دقت بیشتری را دارا می باشد.

نویسندگان

امیرحسین ساجدی

دانش آموخته کارشناسی ارشد هوش مصنوعی، دانشگاه سمنان