دسته بندی قطعات یک ثانیه صوت به صحبت و موزیک مبتنی بر ماشین بردار پشتیبان و شبکه عصبی پرسپترون چند لایه

عماد عباسی صید آباد; فواد رحیم زاده تبریزی; جلیل شیرازی; مجتبی روحانی

دسته بندی قطعات یک ثانیه صوت به صحبت و موزیک مبتنی بر ماشین بردار پشتیبان و شبکه عصبی پرسپترون چند لایه

محل انتشار: چهارمین کنفرانس مهندسی برق و الکترونیک ایران

سال انتشار: 1391

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 803

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/164118

شناسه ملی سند علمی:

ICEEE04_036

تاریخ نمایه سازی: 6 مهر 1391

چکیده مقاله:

در بسیاری از خبرگزاری ها، جداسازی صحبت و موزیک به منظور منحصر نمودن صحبت، جهت کاربردهای مربوط به صحبت انجام می شود. در این مقاله با هدف دسته بندی صوت به دو دسته صحبت و موزیک از مدل سازی تبدیل موجک برای صوت استفاده شده و به کمک دو روش ماشین بردار پشتیبان و شبکه عصبی پرسپترون چند لایه دسته بندی شده است. این دسته بندی بر مبنای فاصله زمانی 1 ثانیه انجام پذیرفته است. نتایج بدست آمده حاکی از کارایی بالا در استخراج ویژگی به کمک تبدیل موجک Bior5.5 همراه با دسته بندی ماشین بردار پشتیبان با میزان خطای 2/81% می باشد. میانگین خطای دسته بندی در شبکه عصبی پرسپترون چند لایه 5/31% بدست آمد.

کلیدواژه ها:

تبدیل موجک ، ماشین بردار پشتیبان ، موجک Bior5.5 ، شبکه عصبی پرسپترون چند لایه

نویسندگان

عماد عباسی صید آباد

دانشجوی کارشناسی ارشد برق- کنترل دانشگاه آزاد اسلامی واحد گناباد

فواد رحیم زاده تبریزی

دانشجوی کارشناسی ارشد برق- کنترل دانشگاه آزاد اسلامی واحد گناباد

جلیل شیرازی

استادیار دانشگاه آزاد اسلامی- گروه برق- واحد گناباد

مجتبی روحانی

استادیار دانشگاه آزاد اسلامی- گروه برق- واحد گناباد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

دانشگاه آزاد اسلامی گناباد- 7 و 8 و 9 شهر ...
دانشگاه آزاد اسلامی گناباد- 7 و 8 و 9 شهر ...
_ Lu, H-J. Zhang , "Content analysis for audio classification ...
S. Z. Li , "Content-based audio classification and retrieval using ...
G. Guo, S.Z. Li, "Content-based audio classification and retrieval by ...
X. Huang, A. Acero and l Hon, Spoken Language Processing: ...
O. _ Mubarak, E. Ambikairajah, and J. Epps, "Novel features ...
L. Tancerel, S. Ragot , V.T. Ruoppilaand, R. Lefebyre, "Combined ...
communic ations, WSES press pp. 174-178, 2001. ...
classification and segmentation, " IEEE Transactions on Speech and Audio ...
G. Senthil raja and S. Dandapat, "Sinusoidal model based Speaker ...
S. Ramamohan and S. Dandapat, "Sinusoidal model- based analysis and ...
McAulay R. J. and Quatieri T. F., "Speech analys is/synthesis ...
Processing, Vol. ASSP-34, No.4, pp. 744-754, August 1986. ...
th Iranian _ _ _ _ (ICEEE2012) _ ...
J. Jensen and J.H.L. Hansen, "Speech enhancement using a constrained ...
E. Scheirer and M Slaney, "Construction And Evaluation Of A ...
http:/cobweb _ ecn.purdue. edu/malc olm/interval/ 1 996- 0 8 5 ...
M. J. Carey, E. S. Parris and l L-Thomas, "A ...

نمایش کامل مراجع