پردازش غیرخطی و چندباند سیگنال گفتار با استفاده از روش‌های استخراج ویژگی الگوهای زمانی

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,207

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICBME14_017

تاریخ نمایه سازی: 3 تیر 1387

چکیده مقاله:

یکی از روش های مقاوم سازی بازشناسی گفتار نسبت به انواع نویز، استفاده از الگوهای زمانی موجود در ویژگی های استخراج شده می باشد. با الهام گرفتن از سیستم شنوایی انسان، می توان با استفاده از الگوهای زمانی به دست آمده از ویژگی های هر زیرباند و همچنین ترکیب غیرخطی این اطلاعات با استفاده از یک مدل چندباند، به بازشناسی مقاو متری در شرایط نویزی دست یافت. در این مقاله به بررسی انواع روش استخراج ویژگی های در برگیرنده الگوهای زمانی، با نگاه پردازش چندبانده می پردازیم و نشان می دهیم که چگونه این رویکرد می تواند باعث بهبود بازشناسی در شرایط نویزی گردد. نتایج به دست آمده در این تحقیق نشان می دهد که مدل چندباند تمام ترکیب "HATS"، با استفاده از روش ترکیب احتمال، باعث بهبود نتایج بازشناسی برای ویژگی های LHCB تخریب شده با نویز باند محدود می شود. از طرفی دیگر، برای بهبود بازشناسی ویژگی های تخریب شده با نویز باند پهن، استفاده از روش چندباند "TMLP" با روش ترکیب ویژگی، نتایج بهتری به همراه خواهد داشت. همچنین با بررسی و تحلیل رفتار مد لهای چندباند با ویژگی های MFCC، نشان می دهیم چگونه استفاده از این ویژگی ها که معادل با استفاده از تعداد باند کمتری است، منجر به بهبود بازشناسی تا 30,7 % در شرایط نویز شدید، نسبت به استفاده از ویژگی های LHCB می گردد.

نویسندگان

یاسر شکفته

آزمایشگاه پردازش گفتار، دانشکده مهندسی پزشکی، دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مهدی محمودزاده، بازشناسی مقاوم به نویز سیگنال گفتار با استفاده ...
  • یاسر شکفته و فرشاد الماس‌گنج، بهبود بازشناسی گفتار با استفاده ...
  • مهدی رحیمی‌نژاد و سیدعلی سیدصالحی، 'مقایسه و ارزیابی کارآیی انواع ...
  • یاسر شکفته و فرشاد الماس‌گنج، ستخراج ویژگی‌های مقاوم سیگنال گفتار ... [مقاله کنفرانسی]
  • Association (ESCA) Tutorial and Advanced Research Workshop on the Auditory ...
  • J. Allen, ،How do humans process and recognize speech?, IEEE ...
  • S. Sharma and H. Hermansky, *TempoRAl Patterns (TRAPs) in ASR ...
  • N. Mirghafori and N. Morgan, _، Trans missions and transitions: ...
  • Eurospeech, Geneva, Switzerland, September 2003. ...
  • Foundation?. Prentice Hall, New Jersey, 1998. ...
  • FARSDAT, Persian speech database. Available from: <httb : //www . ...
  • SPIB, 1995. SPIB noise data. Available from: <httb : //spib. ...
  • HTK, HMM Tool Kit. Availabel from: ...
  • نمایش کامل مراجع