ارائه روسی در دسته بندی سیگنال های صوت مبتنی بر دو حالت با استفاده از شبکه عصبی پرسپترون چند لایه

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 726

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEECS01_045

تاریخ نمایه سازی: 8 آذر 1394

چکیده مقاله:

دسته بندی سیگنال های صوت به گروه هایی ازقبیل موسیقی و گفتاریکی ازموارد مهم درسیستم های بازیابی اسنادچندرسانه ای تلقی میشود تاکنون رویکردهای زیادی برای تمایز داده های صوتی به موسیقی و گفتارانجام شده است دراین مقاله تمایز این داده ها به صورت دسته بندی دوحالتی مورد ارزیابی قرارداده شده است حالت اول دسته بندی دوتایی BINARY سیگنالهای صوت به speech/music و حالت دوم دسته بندی سه تایی trinary سیگنالهای صوت به speech/music/mixture می باشد براین اساس بعدازبدستآوردن برخی ویژگیهای صوت ازشبکه عصبی MLP برای دسته بندی استفاده شد بعدازشبیه سازی های انجام شده روی شبکه دقت دسته بندی برای حالت اول و دوم به ترتیب 98.7درصد و93.3درصد بدست آمد نتایج نشان داده شده ازهرحالت حاکی ازامکان پذیربودن روش ارایه شده می باشد

کلیدواژه ها:

پردازش سیگنال صوت ، دسته بندی موسیقی و گفتار ، استخراج ویژگی ، شبکه عصبی

نویسندگان

مریم خاشعی ورنا مخواستی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر

سید سعید آیت

دانشیار گروه علمی مهندسی کامپیوتر و فناوری اطلاعات

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :