بهبود عملکرد سیستم مستقل از متن تصدیق هویت گوینده برای گفتار آلوده به نویز با ترکیب دو روش GMM-UBM I-Vector PLDA

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 770

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SPIS04_016

تاریخ نمایه سازی: 16 اردیبهشت 1398

چکیده مقاله:

بهره گیری از نمونه سیگنال گفتار برای تصدیق هزیوت افراد با وجود مزایای فراوان، محدودیت هایی را نیز به دنبال دارد که از آن جمله می توان به کاهش دقت این شیوه در محیط های واقعی به دلیل حضور نویزهای متفاوت عوارض کانال اشاره کرد. روش های گوناگونی تاکنون برای کاهش این مشکلات در بخش های مختلف سیستم تصدیق هویت گیرنده یعنی استخراج ویژگی، مدل سازی مقایسه امتیازدهی اریه شده اند. روش نسبتا جدید I-Vector PLDA که عملکرد بسیار موفقی به خصوص در جبران اثرات منفی کانال دارد، در شرایط عدم تطبیق بین داده های آموزش آزمون دچار افت کارایی شدیدی می شود. ترکیب روش های مختلف در مراحل گوناگون، راه حلی مرسوم برای بهبود کارایی سیستم های تشخیص هویت است. در این مقاله تاثیر ترکیب روش های متفاوت در مرحله امتیازدهی بر عملکرد سیستم تصدیق هویت گوینده، برای دو روش GMM-UBM I-Vector PLDA، در شرایط گفتار تمیز نویزی مورد ارزیابی مقایسه قرار گرفته است. در پیاده سازی آزمون ها دو بردار ویژگی MFCC PNCC به خدمت گرفته شده برای سیگنال گفتار نویز به ترتیب از دادگان های TIMIT NOISEX-92 استفاده گردیده است. نتایج آزمون ها نشان می دهد که ترکیب امتیازهای حاصل از روش های متفاوت خطای سیستم تصدیق هویت گوینده را در شرایط عدم تطبیق، یعنی داده های آموزشتمیز آزمون نویزی، کاهش می دهد این کاهش در برخی حالات بسیار چشمگیر است.

نویسندگان

محسن محمدی

دانشجوی دکتری برق/مخابرات سیستم، گروه پژوهشی سنجش، پردازش کنترل، پژوهشکده برق

حمیدرضا صادق محمدی

دانشیار پژوهش، گروه پژوهشی سنجش، پردازش کنترل، پژوهشکده برق جهاد دانشگاهی، تهران