CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تخمین درنگ با استفاده از درخت کلاس بندی در زبان فارسی

عنوان مقاله: تخمین درنگ با استفاده از درخت کلاس بندی در زبان فارسی
شناسه ملی مقاله: ICEE15_219
منتشر شده در پانزدهیمن کنفرانس مهندسی برق ایران در سال 1386
مشخصات نویسندگان مقاله:

مجید نم نبات - شرکت فناوری متن و گفتار
عباس کوچاری - شرکت فناوری متن و گفتار

خلاصه مقاله:
یکی از مراحل تخمین نوای گفتار در یک سیستم تبدیل متن به گفتار می تواند تخمین موقعیتهای وجود درنگ در میان کلمات متن ورودی باشد. تخمین رنگ بدلیل تعینی ساختار عبارتهای پرزودیک با استفاده از آن و تاثیر قابل توجه بر دیگر پارامترهای نوای گفتار اهمیت قابل توجهی دارد و تحقیقات زیادی در این باره در زبانهای خارجی انجام گرفته است. ما در این پژوهش به بررسی و تخمین درنگ برای زبان فارسی با استفاده از درخت های کلاس بندی پرداخته ایم. بدین منظور ویژگیهای ورودی مختلفی استخارج و برای مدل سازی مورد استفاده قرار گرفته اند. همچنین از تکنیکهایی همچون افزون سازی مدلها و یا گریتش ویژگیها برای بهبود کارایی استفاده کرده ایم. در نهایت برای درخت کلاس بندی بهینه میزان دقت 91/1% بدست می آید. همچنین دو معیار ارزیابی جدید بنامهای ضریب کاپا و F-Score معرفی گردیده اند که مقادیر مربوط به درخت کلاس بندی بهینه برای این دو معیار به ترتیب 0/667 و 81/6% بدست آمده است.

کلمات کلیدی:
نوای گفتار ، تخمین درنگ ، عبارات پروژودیک ، درختهای کلاس بندی ، زبان فارسی ، ضریب کاپا ، ضریب F-Score

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/25288/