روش جدید بهینه سازی گفتار با استفاده از بازنمایی تنک و اسپکتروگرام شنیداری

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 195

فایل این مقاله در 13 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IEAMCONF02_055

تاریخ نمایه سازی: 15 تیر 1401

چکیده مقاله:

در این مقاله با استفاده از فضای اسپکتروگرام شنیداری (فضای دوبعدی STRF) و بازنمایی، تنک روش جدیدی برای بهبود کیفیت گفتار ارائه می شود. در این فضای طیفی- زمانی در مرحله اول، طیف نگاره گفتار حاصل شده و در مرحله بعد، طیف نگاره گفتار شنیداری، به دوبعد مقیاس و نرخ تجزیه می شود. در سالهای اخیر روش تنک جایگاه ویژه ای در روش های پردازش گفتار یافته است، ایده اصلی در این روش، بازسازی هر سیگنال گفتار با استفاده از تعداد محدودی اتم های پایه است. استفاده از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز، باعث جداساز بهتر قسمتهای گفتار و نویز و تخمین دقیق تر قسمت های گفتار می شود. در این الگوریتم با استفاده از اسپگتروگرام شنیداری و با کمک بازنمایی تنک، لغت نامه های با اندازه اتم های متفاوت و دو روش یادگیری KSVD و NMF ساخته شد و بطور مثال در SNR=-۱۰dB در نویز سفید PESQ=۲.۷۰۹ و در نویز همهمه PESQ=۲.۶۲۹ حاصل شد. با مقایسه پارامتر PESQ، حاصل از نتایج این روش با روش های دیگر، نشان می دهد که روش های پیشنهادی در نویزهای مختلف ، دقت لازم و کافی را دارد.

کلیدواژه ها:

نویسندگان

محدثه اسحاقی

گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی، نوشهر، ایران