تشخیص ناروانی کشیده گویی با استفاده از شباهت سنجی فریم های متوالی گفتار

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 458

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTCK04_004

تاریخ نمایه سازی: 16 تیر 1397

چکیده مقاله:

در این پژوهش، ایده اصلی یافتن همبستگی های موجود در سیگنال گفتار به منظور کشفقسمت های تکراری آن است. برای این منظور ابتدا ویژگی های ضرایب کپسترال فرکانس مل(MFCC) و ضرایب پیشگویی خطی ادراکی (PLP) از سیگنال گفتار استخراج می گردد. سپس تغییرات همبستگی در ویژگی ها محاسبه شده و توسط یک الگوریتم جستجوی تغییرات همبستگی و مقایسه این تغییرات با یک حد آستانه، وجود و عدم وجود کشیده گویی و همچنینبازه زمانی رخ داد آن استخراج می گردد. این حد آستانه با توجه به بیشینه تغییرات همبستگیدر سیگنال های گفتار متفاوت تغییر می کند. روش پیشنهادی دارای دو مزیت مهم می باشد.نخست اینکه این روش بر خلاف روش های مرسوم مبتنی برطبقه بندی، نیازی به مرحلهآموزش ندارد؛ بنابراین به سادگی قابل پیاده سازی است. دومین مزیت روش پیشنهادی ایناست که حد آستانه تصمیم گیری به صورت وفقی برای هر سیگنال گفتار تغییر می نماید. نتایجشبیه سازی نشان می دهد روش پیشنهادی می تواند ضمن تشخیص بخشهای روان گفتار ازبخش های ناروان آن، با دقت بسیار خوبی بازه زمانی رخ داد کشیده گویی را آشکار نماید.

نویسندگان

ریحانه برومند

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، موسسه آموزش عالی سلمان، مشهد، ایران

محسن کریمان خراسانی

گروه مهندسی برق، واحد گناباد، دانشگاه آزاد اسلامی، گناباد، ایران