بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء
محل انتشار: ماشین بینایی و پردازش تصویر، دوره: 6، شماره: 2
سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 328
فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JMVIP-6-2_004
تاریخ نمایه سازی: 23 اردیبهشت 1400
چکیده مقاله:
امروزه آشکارسازی و برچسبزنی اشیاء در تصاویر یکی از چالشهای اساسی در برخی از کاربردهای بیناییماشین میباشد. در سالهای اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکههای عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می شود. در ادامه شبکهای بهبود یافته از شبکه R-FCN ارائه میشود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسبزنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری ۱۰۱-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسبزنی ۳۶ شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد ۴۸/۳۸% و مدت زمان متوسط برای هر تصویر ۰/۱۳ را دارد، و نسبت به بهترین روش در این حوزه تقریبا ۲% در عملکرد و ۰/۴ ثانیه در زمان بهتر عمل کرده است.
کلیدواژه ها:
آشکارسازی و شناسایی اشیاء ، یادگیری عمیق ، R-FCN ، ماشین بردار پشتیبان دودویی فازی ، اختلاف کوشی-شوارتز
نویسندگان
علی قنبری سرخی
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
حمید حسن پور
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
منصور فاتح
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود