بازشناسی گفتار هیجانی با استفاده از روش پتری نت فازی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 431

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ELCM02_160

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

بازشناسی گفتار هیجانی یکی از موثرترین روش ها، برای برقراری ارتباط بین انسان و ماشین می باشد. به همین دلیل امروزه تحقیقات زیادی در این زمینه صورت گرفته است. این مقاله جهت کشف نرخ بازشناسی هیجان گفتار از مدل ترکیبی قواعد فازی در پتری نت (FPN) و اتوماتای یادگیر استفاده کرده است. الگوریتم پیشنهادی روی سه حالت هیجانی شادی، غم و خشم اعمال شده است. سلسله مراتب الگوریتم پیشنهادی اینگونه است که نخست ویژگی های گفتار هیجانی توسط روش ضرایب کپسترال فرکانسی مل (MFCC) استخراج می گردند. سپس به منظور طبقه بندی ویژگی های استخراج شده از FPN استفاده می شود. خروجی مرحله دوم، بردارهای ویژگی های گفتار هیجانی است. توابع عضویت هر بردار توسط اتوماتای یادگیر محاسبه می شود. سپس قواعد فازی برای فازسازی پارامترهای ورودی اعمال می شود. در مرحله آخر نرخ بازشناسی گفتار هیجانی محاسبه خواهد شد. به منظور بررسی کارایی مدل پیشنهادی، الگوریتم پیشنهادی با مدل های مختلف طبقه بندی همچون طبقه بندهای HMM، KNN، SVM، MLP و NN مقایسه گردید. نتایج تجربی نشان دادند که ترکیب اتوماتای یادگیر و روش فازی در شبکه پتری نت، از عملکرد بهتری نسبت به سایر مدل ها برخوردار است.

کلیدواژه ها:

گفتار هیجانی ، قواعد فازی ، اتوماتای یادگیر ، ضرایب کپسترال فرکانسی مل (MFCC) ، فازی پتری نت

نویسندگان

اشکان فرجند

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد فومن و شفت

سارا معتمد

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد فومن و شفت