تخمین پارامترهای مدل تیلت با استفاده از شبکه عصبی، ماشین پشتیبان بردار و مارس، برای مدلسازی منحنی گام در سیستم های تبدیل متن به گفتار فارسی

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,631

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_047

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

یکی از روش های تولید منحنی گام، برای سیستم های تبدیل متن به گفتار، روش تیلت می باشدکه بر اساس نظریه واج شناسی لایه ای پایه گذاری شده است و در آن، رویدادهای آهنگین گفتار به صورت مستقل از هم در نظر گرفته می شوند. مدل تیلت با تولید رویدادهای کنتور گام و اتصال انها، به یکدیگر، کنتورگام را تولید می نماید. هر رویدداد دارای تعدادی پارامتر می باشد که باید تخمین زده شوند. این مقاله سه روش متفاوت شبکه عصبی، ماشین پشتیبان بردار و مارس را برای تخمین پارامترهای مدل تیلت، با هم مقایسه می کند. در هر سه روش، از دادگان یکسان برای مدلسازی استفاده شده است. در انتخاب ویژگی ها سعی شده است، ویژگی هایی بکار گرفته شوند که قادر به تخمین شکل ابتدا و انتهای کنتور گام و همچنین زیر و بمی های محلی آن، باشند. ویژگی های بکار گرفته شده ، تعدادی ویژگی متنی مانند نوع هجا، هجای تکیه بر، فاصله هجا تا انتهای گفتار و ... و همچنین میزان دیرش واج می باشند. به منظور مقایسه نتایج، میزان کورولیشن بین منحنی اصلی گام و منحنی های سنتز شده با استفاده از پارامترهای تخمینی، محاسبه شده که بهترین نتیجه را شبکه عصبی با مقدار کورولیشن 85/66 تولید نموده است. کلیه روش ها، در تخمین شکل انتهای کنتور گام یکسان عمل نموده اند و در بیش از 88 درصد موارد، آن را درست تخمین زده اند. به منظور ارزیابی بهتر نتایج، تست شنوایی MOS نیز روی گفتار تولید شده انجام گرفته است. همچنین از نتایج مدلسازی مارس، برای شناخت بهتر عوامل تاثیرگذار در تخمین کنتور گام، استفاده شده است.

کلیدواژه ها:

تبدیل متن به گفتار ، نوا ، منحنی گام ، واج شناسی لایه ای ، تیلت ، مارس

نویسندگان

محمدمهدی همایون پور

عضو هیات علمی دانشکده مهندسی کامپیوتر، و فناوری اطلاعات دانشگاه صنع

معصومه بحرینی

کارشناسی ارشد، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

سینا ایران نژاد

کارشناسی ارشد، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • سینا ایران‌نژاد و محمدمهدی همایون‌پور، مدلسازی منحنی گام در گفتار ...
  • مجید نم‌نبات و عباس کوچاری، تخمین منحنی گام در زبان ...
  • وحیدیان کامیار، تقی، نوای گفتار در فارسی، مشهد، 1379. ...
  • اسلامی، محرم، نحو و واج شناسی (یک سطح مشترک)، جشن ...
  • اسلامی، و بی‌جن‌خان. نظام آهنگ زبان فارسی، مجله زبانشناسی، سال ...
  • P ierrehumbert, J. B., The Phonology and Phonetics of English ...
  • Taylor, P., The Tilt Intonation Model, ICSLP, pp.827-830, 1998. ...
  • Dusterhoff, Kurt E., Black, Alan W., Taylor, P., Using Decision ...
  • Rojc, M., Daniel, P., Bonafonte, Training the Tilt Intonation Model ...
  • Paul Taylor, 4Analysis and Synthesis of intonation using the Tilt ...
  • Paul Taylor, «The rise/fall/c onnection model ofintonation?, Speech C ommunicati ...
  • Paul Taylor, Richard Caley, Aln W. Black, Simon King, System ...
  • J. H. Friedman, "Multivariate Adaptive Regression Splines", Annals of Statistics, ...
  • J. H. Friedman, "Estimating functions of mixed ordinal and categorical ...
  • Steinberg, D., Colla, P. L., and, K. Martin, "MARS User ...
  • Dusterhoff and Black, 00A generating F0 countours for speech synthesis ...
  • Gregor Mohler and Alistair Conkie. Parametric modeling of intonation using ...
  • نمایش کامل مراجع