تنظیم تفریق طیفی به منظور بهبود کارایی سیستم های بازشناسی گفتار

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,491

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI12_057

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

در این مقاله روشی جدید برای تنظیم یک فیلتر تفریق طیفی ارائه می گردد. به گونه ای که این فیلتر بیشترین تاثیر را بر بهبود نتایج یک سیستم بازشناسی گفتار داشته باشد. در حال حاضر واحدهای بازشناسی و بهسازی گفتار به صورت دو واحد مستقل عمل می کنند، بدین صورت که در ابتدا الگوریتم های بهسازی گفتار بر روی سیگنال گفتار اعمال می شوند و سپس سیگنال بهسازی شده به واحد بازشناسی خواهد شد، ولی بازشناسی گفتار یک مساله دسته بندی الگوهاست که از بردارهای ویژگی استخراجشده از سیگنال گفتار برای دسته بندی استفاده میکند. بنابراین تنها در صورتی نتایج بازشناسی افزایش خواهد یافت که این ویژگی ها درست نمایی دنباله آوایی صحیح را نسبت به سایر دنباله های اوایی رقیب افزایش دهد. در روش جدید ارائه شده ، فیلتر تفریق طیی بخ نحوی تنظیم می شود که درست نمایی ویژگی های استخراج شده از سیگنال خروجی این فیلتر بیشینه شود. با بکارگیری این روش دقت سیستم های بازشناسی گفتار بروی دادگان فارس دات نویزی شده به میزان 18% افزایش می یابد.

کلیدواژه ها:

نویسندگان

مهران صفایانی

دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر

حسین ثامتی

دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر

باقر باباعلی

دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر

محمدتقی منظوری شلمانی

دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • J. R. Deller, J. G. Proakis, H. L. Hansen, «Discrete ...
  • E. Polak, _ C omputational methods in optimizations, New York: ...
  • S.F. Boll, *Suppression of Acoustic Noise in Speech using Spectral ...
  • M. L. Seltzer, B. Raj, R. M. Stern, «Likelihood- Maximizing ...
  • M. L. Seltzer, R. M. Stern, "Subband parameter optimization of ...
  • M. Berouti, R. Schwartz, J. Makhoul, ،، En hancementof speech ...
  • M. Bijankhan, J. She ikhzadegan, «FARSD AT-The Farsi Spoken Language ...
  • نمایش کامل مراجع