ارایه یک روش جدید برای جداسازی گفتار از پس زمینه موسیقی مبتنی بر ضرایب موجک گسسته و شبکه عصبی نگاشت خود سازمانده
محل انتشار: دومین کنفرانس ملی مهندسی برق و کامپیوتر
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 417
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ELCM02_126
تاریخ نمایه سازی: 21 اردیبهشت 1397
چکیده مقاله:
مساله جداسازی گفتار از پس زمینه موسیقی، یک مساله جذاب ولی مشکل و چالش برانگیز می باشد. بدلیل اینکه اطلاعات محدودی در سیگنال ترکیب شده از موسیقی و گفتار وجود دارد. در این مقاله، ما از تبدیل موجک گسسته برای نمایش اطلاعات زمان - فرکانس سیگنال ترکیبی استفاده کردیم. در روش پیشنهادی، بعد از بدست آوردن انرژی ضرایب موجک گسسته در سطوح تجزیه شده، با استفاده از شبکه عصبی SOM، به خوشه بندی آنها پرداختیم. توانایی پیشنهادی، با استفاده از نتایج MOS و SDR تایید می شود.
نویسندگان
مریم خاشعی ورنامخواستی
کارشناسی ارشد مهندسی کامپیوتر، دانشگاه پیام نور
سید سعید آیت
دانشیار گروه علمی مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور