بررسی کاربردهای شبکه عصبی در پردازش گفتار

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,647

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCONF02_153

تاریخ نمایه سازی: 19 اردیبهشت 1395

چکیده مقاله:

در این مقاله شبکه های عصبی مختلف از قبیل: شبکه های عصبی مصنوعی، عمیق، عمیق تانسور، بازگشتی و کانولوشن در روز پردازش گفتار بررسی شده و کاربردهای آن در حوزه های مختلف تشخیص گفتار در موارد مختلف از قبیل نویز بالا، منابع کم، اختلال تکلم، برآورد ضریب ماسک ایده آل برای تشخیص گفتار دوید، نمایش ساختار کوواریانس داد در فضای مهدی، تنوع گفتار بالا، افزایش دقت طبقه بندی واحد گفتارهای اساسی، مدل کردن ویژگی های هاوایی، آموزش برای چند زبان با آموزش برای یک زبان و تغییر برای زبانی دیگر و مقاوم بودن در برابر تنوع سخنرانان مورد تحلیل قرار می گیرد.

کلیدواژه ها:

پردازش گفتار ، شبکه عصبی ، کاربردهای تشخیص گفتار ، کاربرد شبکه عصبی در پردازش گفتار

نویسندگان

اکرم ملک پورآذر

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران، ایران

مهدی خلیلی

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Siniscalchi, S.M., Svendsen, t. and Lee, Ch.H. (2014), :An Artificial ...
  • Shahamiri, S.R. and Salim, S.S.B. (20 14), :Artificial Neural Networks ...
  • Siniscalchi, S.M., Yu, D., Deng, L. and Lee, Ch..H. (20 ...
  • Narayanan, A. and wang, D. (2013), "Ideal Ratio Mask Estimaton ...
  • Thomas, S., Seltzer, M.L., Church, K. and Hermansky, H. (2013), ...
  • Deng, L., Hinton, G. and Kingsbury, B. (2013), ;New Types ...
  • Yu, D., Deng, L. and Seide, F. (2013), *The Deep ...
  • Graves, A.. Mohamed, and G.Hinton, A.R. (2013) , "Speech Recognition ...
  • Shahamiri, S.R. and Salim, S.S.B. (20 14), :Real-time Frequenc y-based ...
  • Adel-Hamid, O., Deng, L. and Yu, D. (20 13), "Exploring ...
  • نمایش کامل مراجع