ارایه روشی جهت بازشناسی گفتار با استفاده از شبکه های عصبی مصنوعی پس انتشار

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,238

فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CITCOMP02_339

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

رابط گفتار برای کامپیوتر، یک تکنولوژی عمومی برای کاربران است. برنامه های کاربردی متعددی جهت تشخیص خودکار گفتار در سیستم هواپیمایی، ورود داده ها، پردازش متن، رابط های شماره گیری صوتی و حوزه های مختلف صنعتی استفاده می شود. پردازش گفتار می تواند یک رابط مفید برای تعامل با ماشین باشد. در واقع تشخیص گفتار یک پدیده ذهنی است و در این حوزه تحقیقات زیادی صورت گرفته است. سیستم های تشخیص گفتار به دو بخش مختلف یعنی استخراج ویژگی ها و تشخیص ویژگی ها تقسیم می شود. در این تحقیق صدای افراد با سنین مختلف در یک محیط آرام و بدون نویز از طریق میکروفون ضبط شده است. افراد به طور یکسان 10 الی 12 ثانیه صحبت کرده اند. سپس جملات گفتاری با فرمت wave ذخیره شده است. برای استخراج ویژگی ها از ضرایب کپسترال فرکانس مل (MFCC) و از شبکه عصبی پس انتشار برای آموزش، تشخیص و طبقه بندی استفاده شده است

کلیدواژه ها:

تشخیص گفتار ، شبکه های عصبی مصنوعی پس انتشار ، MFCC ، طبقه بندی

نویسندگان

رضا بهرامی راد

فارغ التحصیل رشته مهندسی کامپیوتر، دانشگاه خوارزمی، تهران، ایران