ارایه روشی جهت بازشناسی گفتار با استفاده از شبکه های عصبی مصنوعی پس انتشار
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,238
فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCOMP02_339
تاریخ نمایه سازی: 7 اسفند 1396
چکیده مقاله:
رابط گفتار برای کامپیوتر، یک تکنولوژی عمومی برای کاربران است. برنامه های کاربردی متعددی جهت تشخیص خودکار گفتار در سیستم هواپیمایی، ورود داده ها، پردازش متن، رابط های شماره گیری صوتی و حوزه های مختلف صنعتی استفاده می شود. پردازش گفتار می تواند یک رابط مفید برای تعامل با ماشین باشد. در واقع تشخیص گفتار یک پدیده ذهنی است و در این حوزه تحقیقات زیادی صورت گرفته است. سیستم های تشخیص گفتار به دو بخش مختلف یعنی استخراج ویژگی ها و تشخیص ویژگی ها تقسیم می شود. در این تحقیق صدای افراد با سنین مختلف در یک محیط آرام و بدون نویز از طریق میکروفون ضبط شده است. افراد به طور یکسان 10 الی 12 ثانیه صحبت کرده اند. سپس جملات گفتاری با فرمت wave ذخیره شده است. برای استخراج ویژگی ها از ضرایب کپسترال فرکانس مل (MFCC) و از شبکه عصبی پس انتشار برای آموزش، تشخیص و طبقه بندی استفاده شده است
کلیدواژه ها:
نویسندگان
رضا بهرامی راد
فارغ التحصیل رشته مهندسی کامپیوتر، دانشگاه خوارزمی، تهران، ایران