کاربرد شبکه عصبی دوسویه در اصلاح بردارهای بازنمایی گفتار تلفنی و میکروفونی

منصور ولی; ایمان اسمعیلی; سیدعلی سیدصالحی

کاربرد شبکه عصبی دوسویه در اصلاح بردارهای بازنمایی گفتار تلفنی و میکروفونی

محل انتشار: پانزدهمین کنفرانس کامپیوتر سالانه انجمن کامپیوتر ایران

سال انتشار: 1388

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,293

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/79105

شناسه ملی سند علمی:

CSICC15_172

تاریخ نمایه سازی: 26 مهر 1388

چکیده مقاله:

شبکه عصبی دوسویه در بررسیهای گذشته نشان داده است که توانایی اصلاح بردارهای تخریب شده توسط نویز محیط و کانال انتقال در گفتارهای تلفنی و میکروفونی را دارد. در این مقاله ما تلاشیدوباره برای افزایش صحت بازشناسی گفتار میکروفونی و تلفنی با دو باراصلاح بردارهای بازنمایی توسط شبکه عصبی دوسویه انجام داده ایم.برای این منظور شبکه عصبی دو سویه یک بار توسط بردارهای بازنمایی لگاریتم انرژی بانک های فیلتر (LFBE) تعلیم داده شده و پس از تعلیم، کلیه بردارهای بازنمایی توسط آن اصلاح می شوند . سپس این بردارهای اصلاح شده به یک شبکه دوسویه دیگر تعلیم داده شده و مثل قبل اصلاح می شوند. برای ارزیابی کیفیت بردارهای بازنمایی از مدلهای مخفی مارکوف استفاده شده است. برای این منظور مدلهای مخفی مارکوف توسط بردارهای بازنمایی LFBE,MFCC تلفنی و میکروفونهی حاصل از دو مرحله اصلاح تعلیم داده شده اند. بردارهای بازنمایی LFBE بدست آمده اند. بااعمال این تکنیکهای جدید دررصد بازناشی آوا برای گفتار میکروفونی و تلفنی به ترتیب 4/7 درصد و 9/3 درصد افزایش یافته است علاوه بر این با تعلیم یک سیستم بازشناسی گفتار توسط دادگان میکروفونی اصلاح شده و آزمون آن بر روی دادگان تلفنی اصلاح شده ، 25/6 درصد افزایش صحت بازشناسی درمقایسه با سیستم بازشناسی مشابه مبتنی بر دادگان اصلاح نشده،بدست آمده است که این خود توانایی سیستم پیشنهادی را در اصلاح بردارهای بازنمایی نشان می دهد.

کلیدواژه ها:

اصلاح بردار بازنمایی ، بازشناسی مقاوم گفتار ، شبکه عصبی دوسویه ، مدل مخفی مارکوف

نویسندگان

منصور ولی

دانشگاه شاهد

ایمان اسمعیلی

دانشگاه شاهد

سیدعلی سیدصالحی

دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

B. Kotnik, D. Vlaj B. Horvat, "Efficient Noise Robust Feature ...
N. Morales, D.T. Toledano, J.H.L. Hansen, J. Colas, J. Garrido, ...
H.G. Hirsch, "HMM Adaptation for Applications in Telec ommunicatiot _ ...
M.L. Seltzer, A. Acero, "Training Wideband Acoustic Models Using Mixed-B ...
Missing Features for Robust Speech Recognition", Speech Comm unication. , ...
W. Kim, R.M. Stern, "B and -Independent Mask Estimation for ...
M. Vali. , S.A. Seyyed Salehi. _ Karimi, "Robust Speech ...
L.R. Rabiner, B.-H Juang, Fundamentas of Speech Recognition, Prentice-Hall, Englewood ...
N. Morales, D.T. Toledano, J.H.L. Hansen, J. Garrido, "Feature Compensation ...
M. Bijankhan, J. Sheikhzadegan, M.R. Roohani, Y. Samareh, C. Lucas, ...
M. Bijankhan, J. S heykhzadegan, M.R. Roohani, R. Zarrintare, S.Z. ...

نمایش کامل مراجع