بهبود عملکرد سیستم مستقل از متن تصدیق هویت گوینده برای گفتار آلوده به نویز با ترکیب دو روش GMM-UBM I-Vector PLDA
محل انتشار: چهارمین کنفرانس پردازش سیگنال و سیستمهای هوشمند
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 770
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SPIS04_016
تاریخ نمایه سازی: 16 اردیبهشت 1398
چکیده مقاله:
بهره گیری از نمونه سیگنال گفتار برای تصدیق هزیوت افراد با وجود مزایای فراوان، محدودیت هایی را نیز به دنبال دارد که از آن جمله می توان به کاهش دقت این شیوه در محیط های واقعی به دلیل حضور نویزهای متفاوت عوارض کانال اشاره کرد. روش های گوناگونی تاکنون برای کاهش این مشکلات در بخش های مختلف سیستم تصدیق هویت گیرنده یعنی استخراج ویژگی، مدل سازی مقایسه امتیازدهی اریه شده اند. روش نسبتا جدید I-Vector PLDA که عملکرد بسیار موفقی به خصوص در جبران اثرات منفی کانال دارد، در شرایط عدم تطبیق بین داده های آموزش آزمون دچار افت کارایی شدیدی می شود. ترکیب روش های مختلف در مراحل گوناگون، راه حلی مرسوم برای بهبود کارایی سیستم های تشخیص هویت است. در این مقاله تاثیر ترکیب روش های متفاوت در مرحله امتیازدهی بر عملکرد سیستم تصدیق هویت گوینده، برای دو روش GMM-UBM I-Vector PLDA، در شرایط گفتار تمیز نویزی مورد ارزیابی مقایسه قرار گرفته است. در پیاده سازی آزمون ها دو بردار ویژگی MFCC PNCC به خدمت گرفته شده برای سیگنال گفتار نویز به ترتیب از دادگان های TIMIT NOISEX-92 استفاده گردیده است. نتایج آزمون ها نشان می دهد که ترکیب امتیازهای حاصل از روش های متفاوت خطای سیستم تصدیق هویت گوینده را در شرایط عدم تطبیق، یعنی داده های آموزشتمیز آزمون نویزی، کاهش می دهد این کاهش در برخی حالات بسیار چشمگیر است.
کلیدواژه ها:
نویسندگان
محسن محمدی
دانشجوی دکتری برق/مخابرات سیستم، گروه پژوهشی سنجش، پردازش کنترل، پژوهشکده برق
حمیدرضا صادق محمدی
دانشیار پژوهش، گروه پژوهشی سنجش، پردازش کنترل، پژوهشکده برق جهاد دانشگاهی، تهران