ارایه یک روش جدید برای جداسازی گفتار از پس زمینه موسیقی مبتنی بر ضرایب موجک گسسته و شبکه عصبی نگاشت خود سازمانده

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 417

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ELCM02_126

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

مساله جداسازی گفتار از پس زمینه موسیقی، یک مساله جذاب ولی مشکل و چالش برانگیز می باشد. بدلیل اینکه اطلاعات محدودی در سیگنال ترکیب شده از موسیقی و گفتار وجود دارد. در این مقاله، ما از تبدیل موجک گسسته برای نمایش اطلاعات زمان - فرکانس سیگنال ترکیبی استفاده کردیم. در روش پیشنهادی، بعد از بدست آوردن انرژی ضرایب موجک گسسته در سطوح تجزیه شده، با استفاده از شبکه عصبی SOM، به خوشه بندی آنها پرداختیم. توانایی پیشنهادی، با استفاده از نتایج MOS و SDR تایید می شود.

کلیدواژه ها:

جداسازی موسیقی و گفتار ، موجک ، شبکه عصبی

نویسندگان

مریم خاشعی ورنامخواستی

کارشناسی ارشد مهندسی کامپیوتر، دانشگاه پیام نور

سید سعید آیت

دانشیار گروه علمی مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور