بکارگیری روشهای تطبیق به گوینده سریع بر مبنای فارسیMLLRدر سیستم بازشناسی گفتارفارسی
محل انتشار: بیست و یکمین کنفرانس مهندسی برق ایران
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,177
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE21_003
تاریخ نمایه سازی: 27 مرداد 1392
چکیده مقاله:
روش رگرسیون خطی بیشینه درستنمایی ) MLLR ( یکی از متداولترین روشهای تطبیق به گوینده است که در داده تطبیقی کافی میتواند عملکرد خوبی را از خود به نمایش بگذارد. اما وقتی میزان داده تطبیقی کاهش مییابد، این روش نمیتواند به خوبی عمل کند. در این مقاله، دو روش تطبیق به گوینده MLLR بر مبنای آنالیز مؤلفههای اساسی ) PCA ( یا EMLLR و PCA احتمالاتی به منظور برطرف کردن اینمشکل بکار گرفته شدهاند. در روش دوم، مزایای سه روش تطبیق به گوینده متداول بیشینه پسینه ) MAP (، رگرسیون خطی بیشنیه درست نمایی ) MLLR ( و صدای ویژه ) EV ( با یگدیگر ترکیب شده است. در این روش، اطلاعات مربوط به تغییرات آوای یک گوینده که توسط ماتریس تبدیل MLLR مربوط به آن گوینده مشخص میشوند یک ابربردار را میسازند. با اعمال PCA احتمالاتی به فضای ابربردارهای تشکیل شده ازتغییرات آوای مربوط به تمامی گویندگان تعلیمی، یک مدل احتمالاتی برای تولید ماتریس تبدیل گوینده جدید بوجود میآید که با استفاده از تخمین MAP میتوان این ماتریس را محاسبه کرد. نتایج آزمایشات نشان میدهند که روش دوم در مقادیر مختلف از داده تطبیقی سرپرستیشده و بدون سرپرستی بخصوص در داده تطبیقی کوتاه عملکرد خوبی را نسبت به روش EMLLR و MLLR از خود نشان میدهد
کلیدواژه ها:
نویسندگان
زهره انصاری
دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار
سعید شیری قیداری
دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسی کامپیوتر
فرشاد الماس گنج
دانشگاه صنعتی امیرکبیر )پلیتکنیک تهران(، دانشکده مهندسیپزشکی، آزمایشگاه پردازش گفتار