ارایه روشی جهت بازشناسی گفتار با استفاده از شبکه های عصبی مصنوعی پس انتشار

رضا بهرامی راد

ارایه روشی جهت بازشناسی گفتار با استفاده از شبکه های عصبی مصنوعی پس انتشار

محل انتشار: دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,456

فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/696280

شناسه ملی سند علمی:

CITCOMP02_339

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

رابط گفتار برای کامپیوتر، یک تکنولوژی عمومی برای کاربران است. برنامه های کاربردی متعددی جهت تشخیص خودکار گفتار در سیستم هواپیمایی، ورود داده ها، پردازش متن، رابط های شماره گیری صوتی و حوزه های مختلف صنعتی استفاده می شود. پردازش گفتار می تواند یک رابط مفید برای تعامل با ماشین باشد. در واقع تشخیص گفتار یک پدیده ذهنی است و در این حوزه تحقیقات زیادی صورت گرفته است. سیستم های تشخیص گفتار به دو بخش مختلف یعنی استخراج ویژگی ها و تشخیص ویژگی ها تقسیم می شود. در این تحقیق صدای افراد با سنین مختلف در یک محیط آرام و بدون نویز از طریق میکروفون ضبط شده است. افراد به طور یکسان 10 الی 12 ثانیه صحبت کرده اند. سپس جملات گفتاری با فرمت wave ذخیره شده است. برای استخراج ویژگی ها از ضرایب کپسترال فرکانس مل (MFCC) و از شبکه عصبی پس انتشار برای آموزش، تشخیص و طبقه بندی استفاده شده است

کلیدواژه ها:

تشخیص گفتار ، شبکه های عصبی مصنوعی پس انتشار ، MFCC ، طبقه بندی

نویسندگان

رضا بهرامی راد

فارغ التحصیل رشته مهندسی کامپیوتر، دانشگاه خوارزمی، تهران، ایران