ارائه چند روش ترکیبی جهت تقویت پارامترها در برابر شرائط غیر متعارف در سیستم های تعیین هویت گوینده

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,316

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIKT02_048

تاریخ نمایه سازی: 12 دی 1386

چکیده مقاله:

در این مقاله به بررسی بعضی روشهای مقابله با نویز ، عوامل مزاحم روی خط تلفن، تاثیرات کانال و نوع میکروفن نظیر تکنیک وزندهی خطی، تکنیک لیفتر کردن میانگذر، تکنیک PFL و ضرائب دینامیکی دلتا کپسترال بتنهائی یا در ترکیب با یکدیگر در کارائی تعیین هویت گوینده پرداخته ایم. بدین جهت گفتار 50 گوینده برای اموزش مدلهای گویندگان و آزمایش سیستم، از دادگان گفتار فارسی دات تلفنی استفاده گردید. ابتدا سکوت از گفتارگویندگان حذف و سپس جهت اعمال شرائط متفاوت آموزش و آزمایش، نسبت سیگنال به نویر فایلهای صوتی به مقادیر 5، 10، 15 و 20 دسی بل تغییر داده شد. ویژگی مورد استفاده ضرائب کپسترال مبتنی بر معیار مل می باشد . اکثر روشهای فوق باعث بهبود عملکرد سیستم تعیین هویت شدند و روش وزندهی خطی از بین این روشها نسبت به روش استفاده از ضرائب کپسترال مبتنی بر معیار مل بتنهائی و بدون حذف ضریب اول کپستروم، بهترین روش مقاوم سازی در برابر نویز و تاثیرات کانال انتقال تشخیص داده شد. همچنین در این مقاله ترکیبهای جدیدی از روش های فوق ارائه گردیده است که با توجه به نتایج بدست آمده در افزایش مقاومت سیستم در برابر فاکتورهای محیطی بسیار موثر می باشند. بهترین نتیجه بدست امده ترکیب ضرائب کپسترال مبتنی بر معیار مل و اعمال روش وزندهی خطی در یک بردار ویژگی همراه با ضرائب دلتا می باشد که موجب افزایش 5/4% در میانگین راندمان سیستم بازاء داده های اموزشی و 2/39% بازاء داده های آزمایشی گردید.

نویسندگان

محمدمهدی همایونپور

استادیار ، آزمایشگاه سیستم های هوشمند صوتی و گفتاری، دانشکده مهندسی ک

ابراهیم شریف نبوی

کارشناسی ارشد مهندسی کامپیوتر، آزمایشگاه سیستم های هوشمند صوتی و گفت

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • R.J. Mammone, X. Zhang _، #Robust Speaker Recognition - A ...
  • B. H. Juang, L. R. Rabiner, and J. Wolpon, "On ...
  • of ADPCM Speech Coding with Enhancement؛ [3] V. Ramamoorthy, N. ...
  • L. R. Rabiner, , B. H. Juang, "Fundamentals of Speech ...
  • نمایش کامل مراجع