بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 328

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JMVIP-6-2_004

تاریخ نمایه سازی: 23 اردیبهشت 1400

چکیده مقاله:

امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری ۱۰۱-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی ۳۶ شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد ۴۸/۳۸% و مدت زمان متوسط برای هر تصویر ۰/۱۳ را دارد، و نسبت به بهترین روش در این حوزه تقریبا ۲% در عملکرد و ۰/۴ ثانیه در زمان بهتر عمل کرده است.

کلیدواژه ها:

آشکارسازی و شناسایی اشیاء ، یادگیری عمیق ، R-FCN ، ماشین بردار پشتیبان دودویی فازی ، اختلاف کوشی-شوارتز

نویسندگان

علی قنبری سرخی

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

حمید حسن پور

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

منصور فاتح

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود