بهبود دقت صحت پاسخ در سیستم پرسش و پاسخ بصری با استفاده از شبکه های عصبی عمیق و توجه نرم
سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 102
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CECCONF20_028
تاریخ نمایه سازی: 18 شهریور 1402
چکیده مقاله:
افزایش دقت صحت پاسخ پیش بینی شده در سیستم های پرسش و پاسخ بصری همواره به عنوان یک چالش در نظر گرفتهمی شود. محققان و پژوهشگران در این حوزه همواره در تلاشند تا با استفاده از شبکه های عصبی جدید و کارآمد و ارائهمعماری ها و ساختارهای گوناگون، دقت صحت پاسخ پیش بینی شده در سیستم های پرسش و پاسخ بصری را افزایش دهند.از همین رو ما در این پژوهش با ارائه یک سیستم پرسش و پاسخ بصری با ساختاری جدید در تلاش برای افزایش دقتصحت پاسخ پیش بینی شده در این سیستم ها نسبت به کارهای پیشین هستیم. در مدل پیشنهادی این مقاله از شبکه هایعصبی پیچشی و بازگشتی و همچنین سازوکار توجه نرم استفاده شده است. برای آموزش مدل پیشنهادی نیز از هر دو نسخهمجموعه داده VQA استفاده کردیم. در نهایت نتایج بدست آمده نشان دهنده ی این موضوع است که مدل پیشنهادی در این پژوهش نسبت به مدل های موجود برای پرسش و پاسخ بصری که از مجموعه داده VQA۱.۵ استفاده کرده اند. دقت بیشتری را دارا می باشد.
کلیدواژه ها:
نویسندگان
امیرحسین ساجدی
دانش آموخته کارشناسی ارشد هوش مصنوعی، دانشگاه سمنان