ارزیابی روشهای استخراج ویژگی با استفاده ازشبکه های عصبی گلوگاهی برای بازشناسی گفتارتلفنی فارسی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,114

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICBME20_075

تاریخ نمایه سازی: 25 فروردین 1394

چکیده مقاله:

سیستم بازشناسی گفتارانسان یک سیستم شناسایی مقاوم ویادگیرنده است ازانجا که شبکه های عصبی مصنوعی توانایی یادگیری اطلاعات سطح بالایی مانند الگوهای زمان بلند ویژگیهای ورودی به شبکه را دارهند میتوانند ابزار مناسبی برای بهبود کارایی سیستم های متداول بازشناسی گفتارباشند ازاین رو هدف این مقاله معرفی و بررسی روشهای استخراج اطلاعات مناسب ازویژگیهای رایج گفتاری با استفاده ازشبکه های عصبی گلوگاهی است برای این منظور دوروش براساس شبکه های خودانجمنی و شبکه های طبقه بندی کننده واج انتخاب و درحالت های مختلف برروی دادگان فارس دات کوچک تلفنی ازمایش و بررسی شده است استفاده ازدادگان تلفنی به علت پهنای باند فرکانسی محدود و محاوره ای بودن بیان آن یکی ازچالشی ترین ازمونهای بازشناسی گفتار دردهه اخیر است نتایج ازمایشها نشان میدهند که اعمال تجزیه مولفه های اصلی غیرخطی و همچنین هنجارسازی به میانگین و واریانس برروی ویژگیهای استخراجی ضروری می باشد همچنین برای رسیدن به بهترین کارایی لازم است تاویژگیهای استخراجی درکنار ویژگیهای گفتاری خام و اولیه قراربگیرند که این کار منجر به بهبود نتیجه بازشناسی خواهد شد

نویسندگان

محمدمحسن گودرزی

دانشگاه صنعتی امیرکبیر دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمند علائم RCISPگروه پردازش صوت و زبان طبیعی

یاسر شکفته

دانشگاه صنعتی امیرکبیر دانشکده مهندسی پزشکی پژوهشکده پردازش هوشمند علائم RCISPگروه پردازش صوت و زبان طبیعی

فرشاد الماس گنج

دانشگاه صنعتی امیرکبیر دانشکده مهندسی پزشکی

جهانشاه کبودیان

دانشگاه رازی کرمانشاه دانشکده فنی و مهندسی گروه مهندسی کامپیوتر