کاربرد نرمال سازی اکوسیتکی برای بهبود بازشناسی گفتار کودکان

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,384

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE16_039

تاریخ نمایه سازی: 6 اسفند 1386

چکیده مقاله:

ایجاد مشکلاتی در بازشناسی خودکار گفتار کودکان می شود. تجربه نشان داده در صورتی که از داده صحبت کودکان به عنوان ورودی در مدل های اکوستیکی استفاده شود که با گفتار بزرگسالان آموزش یافته اند، کارایی به اندازه قابل توجهی کاهش می یابد. نرخ خطای کلمه برای شناسایی صحبت کودکان 2 تا 4 بار بیشتر از بزرگسالان است. میزان درستی شناسایی صحبت در کودکان به عواملی مثل سن، جنسیت، فرکانس مبنایی و قد بستگی دارد. در این مقاله برخی از روش های افزایش کارایی شناسایی صحبت کودکان شامل نرمال سازی طول محدوده صوتی (VTLN) آموزش تطبیقی گوینده (SAT) و نرمال سازی گوینده بر اساس رگرسیون خطی با بیشترین درست نمایی محدود شده (CMLSN) مطرح و مقایسه می شوند.

نویسندگان

قمرناز تدین تبریزی

دانشجوی دوره دکتری گروه مهندسی کامپیوتر (نرم افزار) دانشکده فنی مهندس

سعید ستایشی

دانشیار گروه مهندسی هسته ای( پرتوپزشکی) دانشکده مهندسی هسته ای و فیزیک

محمد مولوی کاخکی

دانشکده فنی و مهندسی دانشگاه فردوسی مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Gerosa, M., Giuliani, D. and Brugnara, F. "Speaker adaptive acoustic ...
  • Narayanan, _ and Potamianos, A. "Creating CO, versational interfaces for ...
  • Wilpon, J.G., Jacobsen, C.N. "A study of speech recognition for ...
  • Giuliani, D. and Gerosa, M. "Investigating recognition of children's speech", ...
  • Blomberg, M. and Elenius, D. "Collection and recognition of children's ...
  • Das S., Nix D., Picheny M. *Impro vements in children's ...
  • Gustafson, J and Sjilander, K. ?Voice transfo rmations for improving ...
  • Bell, L and Gustafson, J. "Child and Adult Speaker Adaptation ...
  • Elenius, D. and Blomberg, M. "Adaptation and normalization e.xperiments in ...
  • Lee, S., Potamianos, A. and Narayanan, S. (1998) "Acoustics of ...
  • Werker, J. and Yeung, H. (2005) "Infant speech perception bootstraps ...
  • Hazan, V. and Barrett, S. "The development of phonemic categorication ...
  • Halavati, R., Shouraki, S. B.. Tajik, H., Cholakian, A., and ...
  • Lee, L and Rose, R. "A Frequency Warping Approach to ...
  • Potamianos, A. and Rose, R. 4On combining frequency warping and ...
  • Potamianos , A. and Narayanan, S. "Robust Recognition of Children's ...
  • Elenius, D. and Blomberg, M. "Comparing speech recognition for adults ...
  • Stemmer, G. , Hacker, C. , Steidl, S. and Noth, ...
  • Wallhoff, F., Willett, D. and Rigoll, G., "Scaled Likelihood Linear ...
  • Gales, M., ،Maximum likelihood linear transforma tions for HMM-based speech ...
  • Giuliani, D., Gerosa, M. and Brugnara, F. *Speaker Cons trained ...
  • Transforms in Proc. of INTERS PEECH/ICS LP, Jeju Island, Korea., ...
  • Laroche, J. and Dolson, M. "New phase- vocoder techniques for ...
  • Dolson, M. *The phase 1ocoder: A tutoriae, Computer Music Journal, ...
  • Cabral, J and Oliveira, L. "Pi tc h-Sync hronous Time- ...
  • Tran sformations", Interspeech 2005. September, 4-8, Lisbon, Portugal. ...
  • نمایش کامل مراجع