طبقه بندی آوادید واکه های زبان فارسی با به کار گیری روش جدید استخراج ویژگی بر اساس مدل مخفی مارکوف

سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,161

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IBBEC04_022

تاریخ نمایه سازی: 11 شهریور 1391

چکیده مقاله:

آوادید کوچک ترین واحد قابل تمایز گفتار تصویری است و تعیین کلاس های آوادیدی در هر زبان یکی از گام های اولیه در تحقیقات صورت گرفته بر روی بازشناسی گفتار تصویری، پویانمایی صورت و بهبود نرخ بازشناسی گفتار صوتی است. در این مقاله یک روش - مستقل از گوینده و قوی جهت حل مساله خوشه بندی آوادید واکه های زبان فارسی ارائه شده است. روش ارائه شده شامل سه فاز اصلی است: 1- پیش پردازش، 2- استخراج ویژگی، 3 - خوشه بندی سلسه مراتبی. در این روش، پس از آنکه ناحیه دهان در تمامی فریم ها قطعه بندی شد، بردار ویژگی با به کارگیری مدل مخفی مارکوف استخراج میشود. استفاده از مدل مخفی مارکوف به عنوان یک استخراج کننده ویژگی از جنبه های نوآوری این مقاله است. در نهایت با اعمال خوشه بندی سلسه مراتبی، آوادید واکه های زبان فارسی خوشه بندی می شوند. مهمترین مزیت این روش استقلال خوشه های آوادیدی از گوینده است. روش ارائه شده بر روی مجموعه دادگان آوا 2 اعمال شد.

نویسندگان

مائده مقدم

دانشگاه آزاد قزوین

اعظم باستان فرد

دانشگاه آزاد اسلامی واحد کرج

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مائده مقدم، اعظم باستان فرد، مریم فاضل، محمد آقا احمدی، ...
  • تشخیص 6 واژه گفتاری از روی حرکات لب و با استفاده از تصاویر رنگی [مقاله کنفرانسی]
  • H. McGurk and J. MacDonald, , "Hearing lips and seeing ...
  • Chen, T. 2001. Audiovisual speech processing, IEEE Signal Processing Mag., ...
  • C., Fisher, "Confusions among visuallly perceived consonants, " J. Speech ...
  • S. Werda, W. Mahdi, M. Tmar and A Benhamadou, "Lip ...
  • _ _ _ _ VRCAI, pp. 29-33, 2009. ...
  • _ Krhoul, P. Cisaf and J. Matousek, "Design, implementation and ...
  • G. Zoric, I.S. Pandzic. , "Real-time language independent lip synchronization ...
  • C., Binnie, A. Montgomery, and P., Jackson. "Auditory and Visual ...
  • E. Owens, and B., Blazek, "Visemes Observed by Hearing- Impaired ...
  • M. Caldognetto E. , Zmarich C. Cosi P., Ferrero F. ...
  • J. Melenchon, J. Simo, G. Cobo, E. Martinez, "Objective Viseme ...
  • _ _ _ in Proc. AVSP, pp. 154-159, 2010 ...
  • Wang AH, Bao HQ, Chen JY. "Primary research on the ...
  • M. Leszczynski and W. Skarbek, "Viseme Classification for Talking Head ...
  • M. Leszczynski , W. Skarbek and S. Badura, "Fast Viseme ...
  • N. Alothmany, R. Ching Li, S. Shaiman, J. Durrant, :Classification ...
  • A. Bastanfard, M. fazel, A. Abd kelisham. Aghaahmadi, M. ...
  • Multimedia, Accepted 2009. ...
  • A. Bastanfard, M. Aghaahmadi. A. Abdi M. Fazel, _ comprehensive ...
  • L. R., Rabiner, _ A tutorial _ Hidden Markov Models ...
  • نمایش کامل مراجع