بهبود گفتار با استفاده از گفتار بازسازی شده

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 663

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TIAU01_157

تاریخ نمایه سازی: 14 شهریور 1393

چکیده مقاله:

در سالهای اخیر، بازشناسی گفتار به یکی از حوزه های مهم در تحقیقات تبدیل شده است، در سیستم های رایج برای استخراج ویژگی ها ازMFCCاستفاده شده است که اگر سیگنال توسط نویز تخریب شده باشد، نمی تواندسیستمی را با قابلیت بالای بازشناسی ایجاد کند. در این مقاله می خواهیم روشی را ارائه کنیم تا سیستم های بازشناسی گفتار بتوانند با قابلیت بالاتری عملیات بازشناسی را انجام دهند. برای رسیدن به این هدف سیگنال گفتاری را با استفاده از ترکیب روشMFCCو روشAMSایجاد کرده و آنرا در سیگنال نویزی ورودی، ضرب می کنیم. سه آزمایش مورد بررسی قرار گرفت، در آزمایش اول، زیرباندهای وزن شده و وزن نشده را مورد بررسی قراردادیم، در آزمایش دوم، سیگنال نویزی ورودی را با حاصلجمع زیرباندهای وزن شده مقایسه کردیم و در آزمایش سوم، کل سیگنال نویزی ورودی را با کل سیگنال نویزی ورودی که در سیگنال وزن بازسازی شده ضرب شده بود مورد مقایسه قرار دادیم.نتایج آزمایشات نشان داد که با ضرب کردن سیگنال وزن بازسازی شده در سیگنال ورودی می توان آنرا بهبود داد و همچنین حاصلجمع زیرباندهای وزن شده نسبت به زمانی که کل باند سیگنال ورودی درسیگنال وزن بازسازی شده ضرب می شد، دارایMSEکمتری بود.

کلیدواژه ها:

طیف فاز-طیف اندازه- زیرباند فرکانسی- بازسازی گفتار- بازشناسی گفتار

نویسندگان

سعید کریمی

معماری کامپیوتر، دانشجوی کارشناسی ارشد ، مدرس

مهدی صادق زاده

نرم افزار کامپیوتر، دکتری، عضو هیئت علمی

جواد میرعابدینی

نرم افزار کامپیوتر، دکتری، عضو هیئت علمی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Zhu, D., Nakamura, S., Paliwal, K., Wang, R. (2005): Maximum ...
  • Liu, L., He, J., Palm, G., (1997): Effects of phase ...
  • Picone, J.W., (1993): Signal modeling techniques in speech recognit ion.pro ...
  • Alsteris, Leigh D., Paliwal, Kuldip K., (2007): Iterative reconstructioh of ...
  • Paliwal, Kuldip. _ S chwerin, Belinda. _ Wojcicki, Kamil. , ...
  • Paliwal, K., Wo jcicki, K., Schwerin, B., (2010b): Single-channel speech ...
  • Loizou, P., (2007): _ Enhancemen: Theory and Practice. Taylor and ...
  • Huang, X., Acero, A., Hon, H., (2001): Spoken Language Processing: ...
  • Quatieri, T., (2002): Discrete-Time Speech Signal Processing: Principles and Practice. ...
  • Shien, W., Benedict, N., Schroeder, T, Kayser, C. (2012): A ...
  • Kerlin, Jess R., Shahin , Antoine J., Miller, Lee. (2010): ...
  • Jesen, ole. .gelfand, jack. , kounios, john. , lisman, john. ...
  • نمایش کامل مراجع