تصدیق هویت گوینده مبتنی بر برنامه نویسی ژنتیک و بهبود آن

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,577

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI14_226

تاریخ نمایه سازی: 26 مهر 1387

چکیده مقاله:

برنامه نویسی ژنتیک، از جمله الگوریتم های تکاملی است که توانایی زیادی، نسبت به اغلب روش های یادگیری ماشین دارا می باشد. مشکل این روش، زمان بر بودن اجرای آن است . در این مقاله، هدف استفاده از برنامه نویسی ژنتیک و تطبیق آن به منظور تصدیق هویت گوینده و بررسی هویت کاربران از طریق صدای آنهاست. ایده های متعددی را پیشنهاد نموده ایم تا به کمک آنها بتوانیم ضمن افزایش کارایی روش برنامه نویسی ژنتیک برای تصدیق هویت گوینده، سرعت آموزش مدل های گویندگان را که معمولا در روش برنامه نویسی ژنتیک بسیار زمانبر است را افزایش دهیم. برای این منظور سعی شده است تا با روشهایی چون خوشه بندی به کمک روشهای چندی سازی برداری و نیز با استفاده از توابع گوسی بدست آمده از روش مدل مخلوط گوسی GMM به جای بردارهای ویژگی داده های آموزشی ، حجم داده های آموزشی را کاهش دهیم و بدین ترتیب بر سرعت ساخت مدل های حاصل از برنامه نویسی ژنتیک بیافزائیم. نتایج بدست آمده نشان می دهند که استفاده از میانگین های مدل های مخلوط گوسی حاصل از داده های آموزشی گوینده خودی و گویندگان غیرخودی به جای استفاده مستقیم از داده های آموزشی و بطور مشابه استفاده از میانگین های مدل مخلوط گوسی حاصل از داده های آزمایشی، منجر به دقت خوبی در تصدیق هویت گویندگان و نیز افزایش سرعتی در حد 20 برابر (از 5 ساعت به 15 دقیقه) در آموزش مدل های گویندگان به کمک روش برنامه نویسی ژنتیک می گردد.

نویسندگان

سعیده سادات سدیدپور

آزمایشگاه سیستم های هوشمند صوتی گفتاری دانشکده مهندسی کامپیوتر دانش

محمد مهدی همایون پور

آزمایشگاه سیستم های هوشمند صوتی گفتاری دانشکده مهندسی کامپیوتر دانش