شناسایی گوینده به کمک تکنیکهای پردازش تصویر طیف سیگنال (اسپکتوگرام)

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 854

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

INCEE02_087

تاریخ نمایه سازی: 19 تیر 1394

چکیده مقاله:

مسئله شناسایی گوینده، فازهای مختلفی دارد که مهمترین فاز آن استخراج ویژگی هاست و عملکرد کلی سیستم به آن وابسته است. این مقاله به مسئله شناسایی وابسته به متن گوینده به کمک تکنیکهای پردازش تصویر بر روی تصاویر اسپکتوگرام می پردازد. روش سیفت که یکی از روشهای مرسوم در پردازش تصویر می باشد، برای استخراج ویژگی های منحصر به فرد گوینده که در الگوی تصاویر اسپکتوگرام موجود است پیشنهاد شده است که به دلیل خواص منحصر به فرد آن از جمله مقاومت دربرابر چرخش و تغییر ابعاد تصویر، یکی از بهترین روش های استخراج ویژگی می باشد. کلیه روش های این مقاله با زبان MATLAB پیاده سازی شده اند. برای ارزیابی عملکرد روش پیشنهادی، ازپایگاه داده صوتی Hyke ارائه شده توسط ماکروسافت در دانشگاه دهلی استفاده شده است. نتایج نشان می دهد که نرخ شناسایی گوینده روش پیشنهادی 91/47 درصد می باشد. همچنین ابعاد بردار ویژگی و زمان شناسایی در مقایسه با روش های دیگر کاهش چشم گیری یافته است.

نویسندگان

فاطمه تاج آبادی فراهانی

دانشکده فنی مهندسی، دانشگاه آزاد اسلامی واحد اراک ، اراک، ایران

محسن رحمانی

دانشگاه آزاد اسلامی دانشکده فنی مهندسی، واحد اراک، اراک، ایران