بازیابی تصویر مبتنی بر محتوا بر پایه شبکه های عصبی VGG-۱۶,LSTM

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 242

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITCONF05_048

تاریخ نمایه سازی: 27 فروردین 1401

چکیده مقاله:

پیشرفت های اخیر در حوزه فناوری های چند رسانه ای وافزایش حجم پایگاه داده های تصویری، موضوع سیستم های بازیابی تصویر را مورد توجه قرارداده است. رویکردهای سنتی بازیابی تصویر مبتنی بر محتوا، بر استخراج ویژگی های سطح پایین تصویرمانند رنگ، بافت وشکل تمرکز دارند، عملکرد این روش ها در بازیابی دامنه خاصی از تصاویرمناسب است. پیشرفت هاتی اخیر در حوزه بازیابی تصویرمبتنی بر محتوا بر استخراج ویژگی های تمرکزدارند که مستقل از دامنه است. رویکردهای مبتنی بر شبکه های عصبی وروش های یادگیری ماشین، امکان استخراج ویژگی های سطح بالا از تصویررا نیز فراهم می کند. در رویکرد پیشنهادی ویژگی های تصویر با استفاده از شبکه از پیش اموزش دیده VGG-۱۶ استخراج می شود و پس از آن با استفاده از شبکه عصبی بازگشتی LSTM و یادگیری ویژگی های استخرا شده از شبکه VGG-۱۶ دسته دوم ویژگی ها به دست می اید. ترکیب دودسته ویژگی استخراج شده امکان توصیف جزئیات دقیق تری از تصویر را فراهم می کند. روش پیشنهادی بر روی پایگاه داده های کرل ۱K وتصاویر حیوانات ارزیابی شده است. نتایج به دست آمده نشان می دهد دقت روش پیشنهادی بر روی پایگاه داده های ذکر شده به ترتیب ۹۶.۷% و ۹۸.۷۸% است.

کلیدواژه ها:

بازیابی تصویر مبتنی بر محتوا ، شبکه VGG-۱۶ ، شبکه LSTM

نویسندگان

محمدرضا مینایی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر دانشکده فنی و مهندسی، واحدتهران جنوب دانشگاه آزاد اسلامی تهران ایران

فاطمه طاهری

دانشجوی دکتری مهندسی کامپیوتر دانشکده فنی و مهندسی، واحدتهران جنوب دانشگاه آزاد اسلامی تهران ایران

کامبیز رهبر

استادیار گروه مهندسی کامپیوتر دانشکده فنی و مهندسی، واحدتهران جنوب دانشگاه آزاد اسلامی تهران ایران