مدلسازی اثر گفتار فارسی با استفاده از روش منحنی های قطعه ای برای سیستم های تبدیل متن به گفتار

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,477

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_109

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

کیفیت صدای سنتز شده از یک سیستم تبدل متن به گفتار، تا حد زیادی وابسته به طبیعی بوودن نوای آن می باشد. تا به امروز، بیشتر کنترل ها روی دیرش و فرکانس پایه متمرکز شده و به مدلسازی انرژی گفتار، اهمیت کمتری داده شده است. در این مقاله به مدلسازی انرژی برای تخمین منحنی انرژی گفتار فارسی پرداخته می شود. بدین منظور از روش منحنی های قطعه قطعه، استفاده می شود. در این روش، برای هر واج یک تکه منحنی تولید میشود و از اتصال کلیه این منحنی ها، منحنی انرژی برای کل گفتار بدست می آید. برای مدل کردن منحنی هر واج، چند جمله ای درجه دوم بکار گرفته می شود و از شبکه عصبی، ماشین پشتیبان بردار و مارس، برای تخمین ضرائب این چند جمله ای ها، استفاده میشود. به منظور ایجاد مدل ها، تعدادی ویژگی متنی مانند نوع جمله، نوع استرس هجا، نوع واج و ... به کار گرفته شد. برای بهبود تخمین کنتور انرژی ، دیرش واج و اطلاعات پیچ هجا نیز به عنوان ویژگی های غیر متنی به کار گرفته شدند. برای ارزیابی نتایج، معیارهای ضریب همبستگی و میانگین مربع خطا به کار گرفته شدند. که نتایج پیاده سازی ، بهتر وبدن ماشین پشتیبان بردار را نسبت به دیگر روش های بکار گرفت ه شده در این مقاله، نشان می دهد. به منظور کاهش مجموعه ویژگی ها، نتایج مارس استفاده شد. همچنین در این مقاله تعامل بین یکسری ویژگی و میزان انرژی واج مورد تحلیل واقع شد، نتایج حاکی از آن است که فرکانس پایه بیشترین تعامل را با انرژی گفتار دارا است.

کلیدواژه ها:

تبدیل متن به گفتار ، کنتور انرژی ، مارس ، منحنی های قطعه قطعه ، نوای گفتار

نویسندگان

معصومه بحرینی

کارشناسی ارشد، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

محمدمهدی همایون پور

عضو هیئت علمی، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Kyoun g-Joong Min, Un-Cheon Lim , "Korean prosody generation and ...
  • H. Mixdorff and O. Jokisch, *Evaluating the quality of an ...
  • Oliver Jokisch and Marco Kihne, ،0An Investigation of Intensity Patterns ...
  • Gh aemmaghami _ Sheikhan, Farrokhi, ،Estimation of prosodic information for ...
  • J. H. Friedman, "Multivariate Adaptive Regression Splines", Annals of Statistics, ...
  • J. H. Friedman, *Estimating functions of mixed ordinal and categorical ...
  • نمایش کامل مراجع