بررسی تاثیر ترکیب امتیازات حاصل از بردارهای ویژگی متفاوت گفتار در فضای i-Vector برای سیستم تایید هویت گوینده مستقل از متن

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 599

فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI22_031

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

استفاده از گفتار برای تشخیص هویت افراد با وجود مزایای زیادی چون کاربرپسند بودن و پیچیدگی پیاده سازی کم، محدودیت هایی نیز دارد که از آن جمله می توان به کاهش دقت این روش در محیط های واقعی به دلیل حضور نویزهای مختلف اشاره کرد. تا کنون روش های گوناگونی برای حل این مشکل در مراحل مختلف سیستم تایید هویت گوینده یعنی استخراج ویژگی، مدل سازی و مقایسه و امتیازدهی ارایه شده است که البته هیچکدام مصون از خطا نیستند. ترکیب روش های مختلف در مراحل گوناگون یک راه حل مرسوم برای بهبود کارایی سیستم های تشخیص هویت است. در این مقاله تاثیر ترکیب ویژگی های مختلف در مرحله امتیازات بر کارایی سیستم تایید هویت گوینده، برای چهار بردار ویژگی MFCC، LFCC، IMFCC و PNCC، در شرایط گفتار تمیز و نویزی مورد ارزیابی و مقایسه قرار گرفته است. مدل سازی گوینده در فضای بردارهای هویت و بر مبنای الگوریتم i-Vector/PLDA انجام گرفته و در پیاده سازی آزمون ها برای سیگنال گفتار و نویز به ترتیب از دادگان های TIMIT و NOISEX-92 استفاده گردیده است. نتایج آزمون ها نشان می دهد ترکیب امتیازات حاصل از بردارهای متفاوت انرژی خطای سیستم تایید هویت گوینده را کاهش می دهد و این کاهش در برخی حالات بسیار چشمگیر است.

نویسندگان

محسن محمدی

دانشجوی دکتری برق/مخابرات سیستم، پژوهشکده برق جهاد دانشگاهی، تهران

حمیدرضا صادق محمدی

دانشیار پژوهش، پژوهشکده برق جهاد دانشگاهی، تهران