تشخیص گفتار با استفاده از روش های هوشمند در پردازش صوت

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,865

فایل این مقاله در 29 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TDCONF01_018

تاریخ نمایه سازی: 19 تیر 1394

چکیده مقاله:

در این رساله،به بررسی روشهای هوشمند جهت تشخیص الفبای انگلیسی در پردازش صوت پرداخته شده است.روشهای هوشمند در استخراج ویژگی ،مانند تبدیل WAVELET ، ضرایب MFCC،تبدیل FFT روشهای هوشمند در دسته بندی سیگنال های صوتی،مانند روش ماشین بردار پشتیبان (SVM)، روش شبکه عصبی پرسپترون چند لایه (MLP)،روشهای هوشمند کاهش بعد ،مانند روش PCA و روشهای نرمالایز سازی مورد بررسی قرار گرفته است. نحوه عملکرد به این صورت است که در ابتدا به پیش پردازش داده ها می پردازیم یعنی حذف قسمتهای اضافی از داده ها را انجام می دهیم ،سپس توسط یکی از روشهای هووشمند استخراج ویژگی به استخراج ویژگی می پردازیم ،تا بتوانیم از این ویژگی ها در دسته بندی استفاده کنیم،حال دراین بین فرایند های دیگری از قبیل نرمالایز سازی و کاهش بعد نیز وجود دارند که نیز می توان از آنها استفاده کرد ، اینکه چه عملی و در کجا نتیجه بهتری دارد ،در این رساله تمام موارد بررسی شده است و ،بعد از این که ویژگی ها ی مناسب را استخراج کردیم نوبت به دسته بندی ویزگی ها میرسد که توسط روش ماشین بردار پشتیبان (SVM)و همچنین روش شبکه عصبی پرسپترون چند لایه (MLP)، مورد بررسی قرار گرفته است.البته روشهایی نیز برای بهبود این روشهای دسته بندی نیز صورت گرفته است مانند اینکه می توان پارامترهای روش ماشین بردار پشتیبان (SVM)را توسط الگوریتم بهینه سازی ژنتیک تعیین کرد. در نهایت از نتایج بدست امده به این نتیجه می رسیم که استفاده از روش ضرایب MFCC در استخراج ویژگی واستفاده از روش ماشین بردار پشتیبان (SVM)،در روش دسته بندی جواب مطلوب تری نسبت به سایر روشهای بررسی شده دارد.

کلیدواژه ها:

نویسندگان

سعید وندکی

دانشکده مهندسی برق - دانشگاه گناباد - گناباد - ایران

عماد عباسی صیدآباد

دانشکده مهندسی برق - دانشگاه گناباد - گناباد - ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • شماره1، سال 3، کشاورز، احمد و قاسمیان یزدی، حسن، بهار ...
  • G. Lu, "Indexing and retrieval of audio: A survey, " ...
  • S. Tsekeridou and I.Pitas, "Audio-visual content analysis for content-based video ...
  • S. K, S. Tsekeridou and I.Pitas, "Multimodal interactionfor scene boundary ...
  • S. Lefevre, B. Maillard and N. Vincent, " 3 classes ...
  • B. J. Pathari V, "Multimedia content segmentation based on speaker ...
  • L. Tancerel, S. Ragot , V.T. Ruoppilaand, R. Lefebyre, "Combined ...
  • R. Jarina, N. Murphy, N. Connor and . Marlow, "Speech-music ...
  • L. Lu, H-J. Zhang , "Content analysis for audio classification ...
  • S. Z. Li , "Content-based audio classification and retrieval using ...
  • G. Guo, S.Z. Li, "Content-based audio classification and retrieval by ...
  • Chang Lin C, Shi-Huang Chen, Trieu-Kien Truong and Yukon Chang ...
  • O. Sadjadi , S.M. Ahadi and O. Hazrati , "Unsupervised ...
  • J. Ajmera, L. McCowan and H. Bourlard, "Speech/music segmentation using ...
  • X. Huang, A. Acero and H. Hon, Spoken Language Processing: ...
  • N. Mesgarani, M. Slaney and S. A. Shamma, _ Discrimination ...
  • H-G Kim, N. Moreau and T Sikora, "Audio classification based ...
  • M. J. Carey, E. S. Parris and H. L-Thomas, "A ...
  • _ Lu and H.-J. Zhang, "Content analysis for audio classification ...
  • R. Huang and J. H. L. Hansen, "High-evel feature weighted ...
  • D. Li D, I.K. Sethi, N. Dimitrova and T. McGee ...
  • K. Umapathy, S. Krishnan and S. Jimaa, "Multigroup classification of ...
  • J. Marques and P. Moreno, "A study of musical instrument ...
  • M. Roach and J. Mason, " Classification of video gener ...
  • R. Glasberg, A. Samour, K. Elazouzi and T. Sikora, _ ...
  • Z. Liu, J. Huang and Y. Wang, "Classification of TV ...
  • R. Jarina, N. Ocorner, N. Murphy and S. Marlow, "An ...
  • Y. Nakajima, Y. Lu, M. Sugano, A. Yoneyama, H. Yanagihara ...
  • S. Kiranyaz, A. F. Qureshi and M. Gabbouj, "A generic ...
  • S. J. Rizvi, L. Chen and M. T. Ozsu, "MAD ...
  • J. A. Arias, J. Pinquier and R. A. Obrecht, "Evaluation ...
  • W. Chou and L. Gu, "Roobust singing detection in speech/music ...
  • E. Wold, T. Blum, D. Keislar and J Wheaton, _ ...
  • G. Guo and S. Z.Li, "Content-based audio classification and retrieval ...
  • G. Guo, _ Zhang and . S.Z. Li, "Boosting for ...
  • A. Al-Haj and A. Mohamad, _ Introduction o Wavelet Digital ...
  • Z. Fu, G. Lu, K.Ming Ting and D. Zhang "A ...
  • Stavros Ntalampiras and Nikos Fakotakis, "Speech/Music Discrimination Based _ Discrete ...
  • J. Yen, "Wavelet for acoustics" SIGMAP 2010, pp. 84-91, 2010. ...
  • E. Didiot, I. Illia, D. Fohr and O. Mella, "A ...
  • Didiot, E., Illina, I., Mella, O., Haton, J.-P., Fohr, D., ...
  • A. C. Gedik and B Bozkurt, _ P itch-requency histo ...
  • Audio Analysis using the Discrete Wavelet Transform " _ 35 ...
  • P. Mowlaee Begzadeh Mahale, A. Sayadiyan and K. Faez , ...
  • L. Regnier, G. Peeters G, "Singing voice detection in music ...
  • J. Garofolo, L. Lamel, W. Fisher, J. Fiscus, D. Pallette, ...
  • M. Holmes, J. Jones and A. Feldman, "Radio Ad Filtering ...
  • L. Lu, S.Z. Li and H-J. Zhang, "Content-based audio classification ...
  • E. Scheirer E, M. Slaney M, "Construction and evaluation of ...
  • A. R. Abu-E1-Quran, R. A. Goubran and A. D. C. ...
  • E. Cortizo, M. Zurer and F Ferreras, "Application of fisher ...
  • http : /labrosa. ee , columbia. edu/s ounds/musp/sc heis lan.html ...
  • http : //www. ee , columbia. _ du/-dp we/s ound ...
  • T. K. Moon, "The Expe ctation -maximization algorithm, " IEEE ...
  • Y. Tohkura, _ weighted cepstral distance measure for speech recognition", ...
  • B.H. Juang, L.R. Rabiner and J.G. Wilpon, "On the use ...
  • F. Itakura and T Umezaki, "Distance measure for speech recognition ...
  • RE COGNITION _ ISSPA 99, Brisbane, Australia, 22-25 August, 1999 ...
  • B.A. Hanson and H. Wakita, "Spectral slope distance measures with ...
  • Amane TALEB, "Speech Recognition by Fuzzy-Neuro ANFIS Network and Genetic ...
  • T.B. Adam and Md Salam, "Spoken English Alphabet Recognition with ...
  • Frequency Cepstral Coefficients and Back Propagation Neural Networks", International Journal ...
  • M.Zamalloa, _ Bordel, L.Javier Rodriguez, M .Peiagarikano, "Feature Selection Based ...
  • K.K. Paliwal, _ THE USE OF FILTER-B ANK ENERGIES AS ...
  • نمایش کامل مراجع