تخمین فعالیت های صوتی با استفاده از روش یادگیری میدان تصادفی شرطی و مقایسه با روش ماشین بردار پشتیبان

زینب تهجدی; محمد مهدی همایون فر

تخمین فعالیت های صوتی با استفاده از روش یادگیری میدان تصادفی شرطی و مقایسه با روش ماشین بردار پشتیبان

محل انتشار: شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1389

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 936

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/133791

شناسه ملی سند علمی:

CSICC16_047

تاریخ نمایه سازی: 28 بهمن 1390

چکیده مقاله:

تخمین فعالیت های صوتی عبارت است از فرایند دسته بندی سیگنال گفتار به قسمت های گفتار و غیرگفتار با توجه به کاربرد گسترده ی چنین الگوریتم هایی در شاخه های مختلف پردازش گفتار ارایه روشهایی که باعث بهبود این فرایند شوند همواره مد نظر پژوهشگران بودهاست دراین مقاله با استفاده از روش یادگیری میدان تصادفی شرطی و ویژگی های انرژی و اندازه ی همواری طیف مدلی برای تشخیص و جداسازی قسمتهای گفتاری و غیرگفتاری سیگنال صوت ارایه شده است برای بدست آوردن مقادیر بهینه ی پارامترهای روش یادگیری میدان تصادفی شرطی از مجموعه ی دادگان صوتی Aurora استفاده شده و با درنظر گرفتن این مقادیر بهینه و با استفاده از دادگان Timit مدل نهایی ساخته شد و کارایی آن روی دادگان بدون نویز 90/78% برآورد شده است مهمترین مزیت استفاده از روش یادگیری میدان تصادفی شرطی حجم کم دادگان مورد نیاز برای ساخت مدل است مقایسه ی این روش و روش ماشین بردار پشتیبان روی حجم یکسانی از دادگان آموزشی و آزمایشی نشان میدهد که میدان تصادفی شرطی 14/22% بهتر از ماشین بردار پشتیبان عمل کرده و درمقابل نویز نیز پایدارتر است

کلیدواژه ها:

تخمین فعالیت های صوتی ، میدان تصادفی شرطی ، ماشین بردار پشتیبان

نویسندگان

زینب تهجدی

دانشجوی کارشناسی ارشد،گروه مهندسی کامپیوتر و فناوری اطلاعات دانشگاه

محمد مهدی همایون فر

عضو هیات علمی،گروه مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی ا

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، تهران، 17 تا 19 ...
برای مقایسه‌ی روش پیشنهادی و سایر روش‌های یادگیری که در ...
Gauci, O., Debono, C., Micallef, P., "A maximum log- likelihood ...
and Signal Processing, ISCCSP, pp. 383-387, 200. ...
Enqing, D..Guizhong, L, Yatong, Z., Xiaodi, Z., "Applying support vector ...
Estevez, P., B ecerra-Yoma, N., Boric, N., Ramirez, J., "Genetic ...
_ _ based o SOM & LVQ", International Journal of ...
Jo, Q. H., Park, Y. S., Lee, K. H., Song, ...
Soleimani, S. A., Ahadi, S. M., "Voice Activity Detection based ...
Durbin, R., Eddy, S., Krogh, A., Mitchison, G., "Biological Sequence ...
A. McCallum, D. Freitag, and F. Pereir, "Maximum entropy Markov ...
Rabiner, L., Juang, B. H., "Fundamental of Speech Recognition", Prentice ...
Rabiner, L. R.، A tutorial on hidden Markov models and ...
M. Wallach, Hanna, "Conditional Random Fields An Introduction", February 2004. ...

نمایش کامل مراجع