مقدمه ای بر شناسایی گوینده مبتنی بر ضرایب MFCC و مدل سازی آماری

محمود حسینی; مرتضی زاهدی

مقدمه ای بر شناسایی گوینده مبتنی بر ضرایب MFCC و مدل سازی آماری

محل انتشار: اولین همایش ملی مهندسی کامپیوتر و فناوری اطلاعات دانشگاه پیام نور

سال انتشار: 1393

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,284

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/337443

شناسه ملی سند علمی:

FNCEITPNU01_091

تاریخ نمایه سازی: 17 اسفند 1393

چکیده مقاله:

به کارگیری گفتار گویندگان برای شناسایی و تصدیق هویت افراد به دلیل سادگی استفاده از آن کاربرد فراوان دارد. هر سیستم شناسایی گوینده از دو فاز یادگیری و آزمایش تشکیل شده است. در بخش یادگیری، ویژگی های گفتار که مهم ترین آن ها ضرایب کپسترال اند با استفاده از روش MFCC استخراج می شوند. سپس با کمک روش های آماری مانند مدل پنهان مارکوف، مدل مخلوط گوسی و یا ماشین بردار پشتیبان، مدلی منحصر به فرد از صدای هر گوینده ایجاد، سطح آستانه ای برای مدل تعیین و در پایگاه داده ذخیره می گردد. در فاز آزمایش، گفتار نمونه، امتیاز بندی شده و با سطح آستانه هر کدام از مدل های ذخیره شده در فاز یادگیری مقایسه می شود. در صورتی که امتیاز گفتار نمونه از سطح آستانه آن مدل تجاوز نکند، گفتار به مدل مذکور تعلق خواهد داشت. به منظور تمایز بیشتر مدل ها از یکدیگر و در نتیجه تشخیص بهتر، از روش های هنجار سازی استفاده می شود. در این مقاله تلاش شده است تا با ترکیب هم زمان دو و یا چند روش هنجار سازی به بازدهی بالا تر جهت تشخیص هویت گوینده رسید.

کلیدواژه ها:

تشخیص هویت گوینده ، ضرایب کپسترال ، ضرایب MFCC ، سطح آستانه ، روش های هنجار سازی

نویسندگان

محمود حسینی

دانشجوی کارشناسی ارشد، دانشگاه صنعتی شاهرود

مرتضی زاهدی

عضو هیات علمی، دانشگاه صنعتی شاهرود

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Ayadi M. and Kamel S, Karray F.Speech emotion recognition using ...
Ayadi M. and Kamel M.S.، Karray, F. Survey on speech ...
Dunn, Robert B., Reynolds, Douglas A., and Quatieri, Thomas F., ...
Gharavian D and Sheikhan M, Pezhmanpour M. GMM-based emotion recognition ...
Hamidi M and Mansorizadeh M. Emotion recognition from Persian speech ...
He L. and Lech M., Maddage N.C., Allen N.B. Study ...
Petrushin V.A Emotion recognition in speech signal: experimental study, development, ...
Schuller B and Rigoll G, M. Lang. Speech emotion recognizing ...
Ververidis D and Kotropoulos C. Fast sequential floating forward selection ...
Yang M. L. Emotion recognition from speech single using new ...
Yu F and Chang E, Xu Y, Shum H. Emotion ...
Xuang, Lu, Jiawn, Dang, "An Investigation of Dependencies between Frequency ...

نمایش کامل مراجع