CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه الگوریتمی تعمیم یافته برای بازشناسایی گفتار توسط شبکه عصبی

عنوان مقاله: ارائه الگوریتمی تعمیم یافته برای بازشناسایی گفتار توسط شبکه عصبی
شناسه ملی مقاله: ISCEE11_180
منتشر شده در یازدهمین کنفرانس دانشجویی مهندسی برق ایران در سال 1387
مشخصات نویسندگان مقاله:

میثم محمدپور - واحد تحقیقات صدا و سیما
فرداد فرخی - هیات علمی دانشگاه آزاد اسلامی واحد تهران مرکزی

خلاصه مقاله:
در این مقاله با توجه به معایب هر یک از تکنیک های موجود برای بازشناسایی صوت، روشی ترکیبی ارائه خواهد شد که می تواند با صحت بالا (98%) به طبقه بندی صوت های دریافتی در زمان حداقل دست یابد. در این روش بعد از جمع اوری پایگاه داده database) ابتدا سیگنال صوت پیش پردازش شده که این بخش شامل حذف نویز توسط آنالیز Mels Frequency Capestral بدست اوردن ویژگی های لازم با استفاده از ضرایب تبدیل موجک گسسته wavelet) می باشد. سپس این ویژگی ها به یک شبکه چند لایه پرسپترون برای طبقه بندی اعمال می شود. در نهایت پس از آموزش شبکه با استفاده از الگوریتم UTA ویژگی های موثر در طبقه بندی استخراج می شوند، کلیه مراحل توسط Labview کد شده که بعلت دارا بودن قابلیت پردازش موازی، تاثیر چشمگیری در سرعت یادگیری و تشخیص سیستم داشته است.

کلمات کلیدی:
شبکه عصبی MLP ، تبدیل Wavelet ، استخراج ویژگی های مفید

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/48853/