بازشناسی مستقل از فرد گفتار پیوسته با استفاده از ویژگی های استخراج شده از لب

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 816

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEEE04_123

تاریخ نمایه سازی: 6 مهر 1391

چکیده مقاله:

بازشناسی گفتار با استفاده از ویژگی های تصویری به علت کاربردهای فراوان نظیر بهبود بازشناسی گفتار، لب خوانی و ارتباط رایانه و انسان یکی از موضوعات بدیع و مورد توجه است. برای این منظور در این مقاله ابتدا به پیدا کردن منحنی دور لب پرداخته و سپس با استخراج ویژگی های مطلوب به بازشناسی مستقل از فرد گفتار پیوسته مبادرت می شود. برای یافتن منحنی دور لب، پس از ایجاد فضای زنگی جدید، با استفاده از آستانه گذاری بهینه مرز کلی لب پیدا می شود. سپس با روش پیشنهادی به بهبود الگوریتم یافتن مرز دقیق لب پرداخته و مرزی منعطف و بدون داشتن شرط تقارن بدست می آید. پس از تعریف ویژگی های استخراج شده مطلوب از منحنی دور لب، برای بازشناسی از یک مدل شبکه عصبی که اطلاعات زمینه و نوعی نرمال سازی را به همراه دارد، استفاده شده است. نتایج آزمایشات موید کیفیت و دقت بهتر روش های پیشنهادی نسبت به روش های رایج دیگر است.

نویسندگان

کامران قاصدی

دانشجوی دانشگاه صنعتی امیرکبیر

نجمه صدوقی

دانشجوی دانشگاه صنعتی امیرکبیر

سید علی سید صالحی

استادیار دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • شالباف ر.، وفادوست م.، شالباف ا. _ بازشناسی دیداری گفتار ...
  • استخراج هوشمند و خودکارمنحنی دقیق دورلب [مقاله کنفرانسی]
  • th Iranian _ _ _ (ICEEE2012) _ ...
  • Borgstrom B.J., _ Low-Comp lexity Parabolic Lip Contour Model with ...
  • Chiou G.I., Hwang J.N., "Lipreading from color video", IEEEE Trans. ...
  • Cootes T.F., Taylor C.J., Cooper D.H., Graham J., "Active shape ...
  • Eveno N., Caplier A., and Coulon P. Y., ":Accurate and ...
  • Eveno N., Caplier A., Coulon P. Y., "Key Points Based ...
  • Fanelli G., Gall J., Romsdorfer H. Weise T., Gool L. ...
  • Commun ication", IEEE Trans. Multimedia, Vol. 12, No. 6, 2010. ...
  • Hazen T. J., "Visual model structures and synchrony constraints for ...
  • Hsu R. L., Abdel M., Jain A. K., _ Detection ...
  • Igawa S., Ogihara A., Shintani A., and S. Takamatsu, "Speech ...
  • Jiang Yu. K., Bunke X. H., "Lipreading Using Signal Analysis ...
  • Lucey S., Chen T., Sridharan S., and Chandran V., "Integration ...
  • Recognition, " IEEE Trans. Multimedia, Vol. 7, No. 3, pp. ...
  • Ooi W. C., Jeon C., Kim K., Han D. K. ...
  • threshold selection method from gray-level A"ه [15] Otsu N., histograms", ...
  • Putzara L, , Goerendta I., Heeda T., Richardb G., Bichelc ...
  • Savran A., Sankur B., Bilge M. T., "Facial action unit ...
  • Zhang B., Fukui Y., "Research on an Automated Speech Recognition ...
  • نمایش کامل مراجع