دسته بندی قطعات یک ثانیه صوت به صحبت و موزیک مبتنی بر ماشین بردار پشتیبان و شبکه عصبی پرسپترون چند لایه

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 803

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEEE04_036

تاریخ نمایه سازی: 6 مهر 1391

چکیده مقاله:

در بسیاری از خبرگزاری ها، جداسازی صحبت و موزیک به منظور منحصر نمودن صحبت، جهت کاربردهای مربوط به صحبت انجام می شود. در این مقاله با هدف دسته بندی صوت به دو دسته صحبت و موزیک از مدل سازی تبدیل موجک برای صوت استفاده شده و به کمک دو روش ماشین بردار پشتیبان و شبکه عصبی پرسپترون چند لایه دسته بندی شده است. این دسته بندی بر مبنای فاصله زمانی 1 ثانیه انجام پذیرفته است. نتایج بدست آمده حاکی از کارایی بالا در استخراج ویژگی به کمک تبدیل موجک Bior5.5 همراه با دسته بندی ماشین بردار پشتیبان با میزان خطای 2/81% می باشد. میانگین خطای دسته بندی در شبکه عصبی پرسپترون چند لایه 5/31% بدست آمد.

کلیدواژه ها:

تبدیل موجک ، ماشین بردار پشتیبان ، موجک Bior5.5 ، شبکه عصبی پرسپترون چند لایه

نویسندگان

عماد عباسی صید آباد

دانشجوی کارشناسی ارشد برق- کنترل دانشگاه آزاد اسلامی واحد گناباد

فواد رحیم زاده تبریزی

دانشجوی کارشناسی ارشد برق- کنترل دانشگاه آزاد اسلامی واحد گناباد

جلیل شیرازی

استادیار دانشگاه آزاد اسلامی- گروه برق- واحد گناباد

مجتبی روحانی

استادیار دانشگاه آزاد اسلامی- گروه برق- واحد گناباد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • دانشگاه آزاد اسلامی گناباد- 7 و 8 و 9 شهر ...
  • دانشگاه آزاد اسلامی گناباد- 7 و 8 و 9 شهر ...
  • _ Lu, H-J. Zhang , "Content analysis for audio classification ...
  • S. Z. Li , "Content-based audio classification and retrieval using ...
  • G. Guo, S.Z. Li, "Content-based audio classification and retrieval by ...
  • X. Huang, A. Acero and l Hon, Spoken Language Processing: ...
  • O. _ Mubarak, E. Ambikairajah, and J. Epps, "Novel features ...
  • L. Tancerel, S. Ragot , V.T. Ruoppilaand, R. Lefebyre, "Combined ...
  • communic ations, WSES press pp. 174-178, 2001. ...
  • classification and segmentation, " IEEE Transactions on Speech and Audio ...
  • G. Senthil raja and S. Dandapat, "Sinusoidal model based Speaker ...
  • S. Ramamohan and S. Dandapat, "Sinusoidal model- based analysis and ...
  • McAulay R. J. and Quatieri T. F., "Speech analys is/synthesis ...
  • Processing, Vol. ASSP-34, No.4, pp. 744-754, August 1986. ...
  • th Iranian _ _ _ _ (ICEEE2012) _ ...
  • J. Jensen and J.H.L. Hansen, "Speech enhancement using a constrained ...
  • E. Scheirer and M Slaney, "Construction And Evaluation Of A ...
  • http:/cobweb _ ecn.purdue. edu/malc olm/interval/ 1 996- 0 8 5 ...
  • M. J. Carey, E. S. Parris and l L-Thomas, "A ...
  • نمایش کامل مراجع