CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مقاومسازی سیستمهای بازشناسی گوینده در مقابل اعوجاج کانال و کاهش پهنای باند

عنوان مقاله: مقاومسازی سیستمهای بازشناسی گوینده در مقابل اعوجاج کانال و کاهش پهنای باند
شناسه ملی مقاله: FJCFIS02_334
منتشر شده در دومین کنگره مشترک سیستمهای فازی و هوشمند ایران در سال 1387
مشخصات نویسندگان مقاله:

امیرحسین حاج احمدی - آزمایشگاه سیستمهای هوشمند صوتی-گفتاری، دانشکده مهندسی کامپیوتر و فن
محمدمهدی همایون پور
سیدمحمد احدی - دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر، تهران، ایران

خلاصه مقاله:
با توجه به اهمیت مقاومسازی سیستمهای بازشناسی گوینده در مقابل انواع اعوجاح کانال و نویزهای ناشی از نوع میکروفونها در امکان استفاده عملی از آنها، در این مقاله روش استخراج پیکهای طیف دنباله خودهمبستگی که از روشهای مقاومسازیسیستمهای بازشناسی گفتار در مقابل نویزهای جمعشونده است، برای استفاده در سیستمهای تعیین هویت گوینده با ویژگیهای رایج MFCCمقایسه شدهاند. همچنین تأثیر روش پس پردازش حذف میانگین کپسترال نیز بر روی ویژگیهایMFCCو پیکهای طیف دنباله خودهمبستگی مورد ارزیابی قرار گرفته است. بدین منظور پنج نوع نویز کانال مختلف با دادگان تمیز کانولو شده و بازشناسی بر روی این دادگان نهایی انجام شده است. نتایج نهایی بدست آمده نشاندهنده مقاومت بیشتر پیکهای طیف دنباله خودهمبستگی در مقابل کاهش پنهای باند است و تأثیر نویزهای کانولوشنی بر پیکهای طیفدنباله خودهمبستگی بیشتر از ویژگیهایMFCCاست. همچنین از نتایج بدست آمده میتوان نتیجه گرفت که با استفاده از حذف میانگین کپسترال میتوان به میزان بسیار قابل توجهی بر مقاومت در مقابل تأثیرات کانالهای مختلف افزود.

کلمات کلیدی:
بازشناسی گوینده، استخراج ویژگی مقاوم، اعوجاج کانال، پیکهای طیف دنباله خودهمبستگی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/204043/