روش پیش تعلیم لایه به لایه دوسویه برای تعلیم شبکه های عصبی عمیق

سیده زهره سیدصالحی; سید علی سیدصالحی

روش پیش تعلیم لایه به لایه دوسویه برای تعلیم شبکه های عصبی عمیق

محل انتشار: مجله هوش محاسباتی در مهندسی برق، دوره: 6، شماره: 2

سال انتشار: 1394

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 161

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1359975

شناسه ملی سند علمی:

JR_ISEE-6-2_001

تاریخ نمایه سازی: 6 دی 1400

چکیده مقاله:

در این مقاله، یک روش پیش تعلیم دوسویه برای همگرا نمودن تعلیم شبکه های عصبی عمیق با یادگیری دیگرانجمنی ارائه شده است. تعلیم این شبکه ها به دلیل مواجه بودن با تعداد بالای کمینه های موضعی اغلب همگرا نمی گردد. این در حالی است که با مقداردهی اولیه مناسب وزن های شبکه، می توان از بسیاری از کمینه های موضعی اجتناب نمود. روش پیش تعلیم لایه به لایه دوسویه روشی سریع و کارا می باشد که در یک مسیر دوسویه به طور جلوسو و عقب سو با استفاده از ورودی ها و خروجی های مطلوب شبکه، به تنظیم مقادیر اولیه وزن های آن می پردازد. برای این منظور از تعلیم شبکه های کمکی یک لایه پنهان مبتنی بر وزن های لایه تحت پیش تعلیم از شبکه عمیق و وزن های کمکی استفاده می شود. سپس مقادیر وزن حاصل از تعلیم اینها در ساختار اصلی شبکه تحت پیش تعلیم قرار داده می شوند و برای تنظیم دقیق وزن ها، تعلیم یکپارچه صورت می گیرد. این روش برای پیش تعلیم وزن های سه شبکه عصبی عمیق بازشناس فرد، حالت های احساسی و ارقام دستنوشتار مورد استفاده قرار گرفت و نشان داده شد که با به کارگیری این روش پیش تعلیم، سرعت همگرایی تعلیم به طور چشمگیری افزایش می یابد. همچنین میزان بازشناسی ها در پایگاه داده های چهره به میزان قابل توجهی بهبود می یابد که حاکی از افزایش قدرت تعمیم شبکه با استفاده از این روش می باشد.

کلیدواژه ها:

پیش تعلیم ، دوسویه ، دیگرانجمنی ، ساختار عمیق ، شبکه های عصبی چند لایه ، همگرایی تعلیم

نویسندگان

سیده زهره سیدصالحی

دانشجوی دکتری، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر، تهران، ایران

سید علی سیدصالحی

- دانشیار، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Serre, T., Kreiman, G., Kouh, M., Cadieu, C., Knoblich, U., ...
Erhan, D., Manzagol, P.A. Bengio, Y. Bengio, S. Vincent, P. ...
Bengio, Y., "Learning deep architectures for AI", Foundations and Trends® ...
Erhan, D., "Understanding deep architectures and the effect of unsupervised ...
Bengio, Y., "Evolving culture vs local minima", arXiv preprint ...
Plath, N., "Extracting low-dimensional features by means of deep network ...
Seyyedsalehi S.Z. and Seyyedsalehi S.A., "Simultaneous learning of nonlinear manifolds ...
Seyyedsalehi S.Z. and Seyyedsalehi S.A., "New fast pre-training method for ...
Seyyedsalehi S.Z. and Seyyedsalehi S.A., "New fast pre-training method for ...
Bengio, Y., Lamblin, P., Popovici, D., and Larochelle, H., "Greedy ...
Erhan, D., Bengio, Y., Courville, A., Manzagol, P.A., Vincent, P., ...
Nejadgholi I., Seyyedsalehi S.A., "Experiments towards bidirectional neural networks", Technical ...
Ghasemi M., "Nonlinear independent component analysis of Speech signal", M.S. ...
Nejadgholi I., "A brain-inspired model of feature extraction and binding ...
Hinton, G.E. and Salakhutdinov, R.R., "Reducing the dimensionality of data ...
Savran, A., Alyüz, N., Dibeklioğlu, H., Çeliktutan, O., Gökberk, B., ...
Lucey, P., et al. "The Extended Cohn-Kanade Dataset (CK+): A ...
LeCun, Y. and Cortes, C., "The MNIST database of handwritten ...

نمایش کامل مراجع