تشخیصمحدودهی گفتاری در سیگنال صوتی مبتنی بر دسته بندی گروهی دادگان

رضا وفاشعار; سعید شیری

تشخیصمحدودهی گفتاری در سیگنال صوتی مبتنی بر دسته بندی گروهی دادگان

محل انتشار: دوازدهمین کنفرانس ملی سیستم های هوشمند ایران

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 554

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/276158

شناسه ملی سند علمی:

ICS12_078

تاریخ نمایه سازی: 11 مرداد 1393

چکیده مقاله:

جداسازی گفتار از نویز ضمینه یکی از پیشپردازشهای مهم در اغلب کابردهای گفتاری میباشد که روشهای مختلف آماری،یادگیری ماشین و مکاشفهای برای آن مطرح شدهاند. در این مقاله روشجدیدی برای تشخیصمحدودهی گفتاری در سیگنال صوتیبر اساسدسته بندی گروهی دادگان ارائه شده است. در دستهبندی گروهی دادگان هدف تشخیصدستهی گروهی از دادگان ورودی است، که با توجه به دانشاولیهی موجود، به یک دسته تعلق دارند. با توجه به اینکه در سیگنال گفتار بخشهای مربوط به نویز وگفتار معمولا به صورت متوالی و پیوسته میباشند، میتوان از روشهای مربوط به دسته بندی گروهی دادگان برای تشخیصآنهااستفاده نمود. روشارائه شده از دسته بندی گروهی مبتنی بر نزدیکترین همسایه استفاده میکند، بنابراین نیاز به آموزشخاصی برای ایجاد مدلهایی از نویز و گفتار نمیباشد و تنها نیاز به مجموعهای از دادگان اولیه است که به عنوان دادگان مرجع مورد استفادهقرار گیرد؛ به همین دلیل دارای زمان فاز آموزشآن بسیار ناچیز میباشد، به علاوه نسبت به روشهای آماری و مکاشفهای دارای دقت بالاتری میباشد و نسبت به آنها سادهتر است. روش پیشنهادی با چند روشمتداول برای تشخیصمحدودهی گفتاری، درمحیط های مختلف باSNR متفاوت، مقایسه شده که نتایج مقایسات نشان دهندهی کارای بالای روشارائه شده برای تشخیص محدودهی گفتار میباشد و در مقایسه با روشهای مقایسه شده توانسته با نرخ تشخیصاشتباه پایین به نرخ تشخیص صحیح بالایی دست یابد.

کلیدواژه ها:

تشخیصمحدودهی گفتاری در سیگنال صوتی ، دسته بندی گروهی ، دسته بندی برمبنای نزدیکترین همسایه

نویسندگان

رضا وفاشعار

دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر ، تهران،

سعید شیری

استادیار، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر ، تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Hoyt, J.D., Wechsler, H., "Detection of human speech in structured ...
Juang, B.H., Chou, W., Lee, C.H., "Mimum classification error rate ...
Liang, Y., Liu, X., Lou, Y., Shan, B., "An improved ...
Wu, J., Zhang, X., _ efficient voice activity detection algorithm ...
Gorriz, J.M., Ramirez, J., Lang, E.W.. Puntonet, C.G., "Hard C-means ...
Vlaj, D.. Kacic, Z., Kos, M., "Voice activity detection algorithm ...
Engineering, Vol. 38(6), pp. 1820-1836, 2012. ...
Sasudin N.A., Bradley, A.P.. "Nearest neighbour group-based classification ", Pattern ...
Mitani, Y., Hamamoto, Y., _ local mean-based nonparametric classifier", Pattern ...
Hwang, S., Cho, S., _ 'Clus tering-Based Reference Set Reduction ...
TIMIT ac oustic-phonetic continuous speech corpus: http://www. ldc. _ edu/Ca ...
Tan, L.N., Borgstrom, B.J., Alwan, A., "Voice Activity Detection using ...
Sohn, J., Kim, N.S., Sung, W., "A statistical model-based voice ...

نمایش کامل مراجع