یک کدینگ صحبت در حوزه شنوایی با استفاده از بانک فیلتر گاماتن مختلط و ویژگی های ادراکی انسان

سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,530

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NEEC02_221

تاریخ نمایه سازی: 7 بهمن 1388

چکیده مقاله:

اخیرا گروهی از کد کننده های صوتی با نرخ بیتی پایین و براساس زیرباندهای شنوایی ارائه شده اند که از مدلهای ادراکی جهت تشخیص و حذف اطلاعات اضافه استفاده می کنند دراین سیستم ها اغلب بمنظور استخراج ویژگی های زمان - فرکانس سیگنال، از یک مدل فیلترینگ شنوایی مانند حلزونی گوش استفاده میشود. یکی از مدلهای رایج دراین زمینه فیلترهای گاماتن حقیقی است نقطه ضعف این فیلترها شیب همواره پاسخ فرکانسی و عدم انطباق کامل با دامنه تند فیلترهای شنوایی است که منجر به کاهش دقت فرکانسی و ایجاد اعوجاج در سیگنال خروجی می شود دراین مقاله جهت بهبود کیفیت با تعمیم پاسخ ضربه فیلترهای گاماتن حقیقی، یک بانک فیلتری آنالیز مختلط بهمراه بانک فیلتری بهینه شده معکوس آن طراحی شده است. دراین سیستم حذف مولفه های اضافه و نارسا از طریق ماسکینگ کوتاه مدت و استانه گذاری وفقی، و کد کردن دامنه و محل پالسها نیز از طریق یک روش کوانتیزاسیون غیریکنواخت جدید و الگوریتم های کدینگ بدون تلفات صورت می پذیرد بررسی عملکرد سیستم از نظر میزان فشرده سازی و ارزیابی کیفیت توسط آزمون استاندارد MOS نشان میدهد که علیرغم کاهش قابل توجه نرخ بیتی تا حدود 14.6Kbps کیفیت صحبت سنتز شده حفظ شده و کاهش محسوسی نیافته است.

نویسندگان

سیدایمان ابطحی

دانشکده مهندسی برق دانشگاه آزاد اسلامی واحد نجف آباد

محمدرضا آشوری

آزمایشگاه تحقیقاتی پردازش سیگنالهای دیجیتال، دانشکده مهندسی برق و ک

رسول امیرفتاحی

آزمایشگاه تحقیقاتی پردازش سیگنالهای دیجیتال، دانشکده مهندسی برق و ک