طبقه بندی حروف صدادار زبان فارسی با استفاده از ماشین بردار پشتیبان

زهرا فتح الهی; صبا جودکی

طبقه بندی حروف صدادار زبان فارسی با استفاده از ماشین بردار پشتیبان

محل انتشار: کنفرانس ملی کامیپوتر،فناوری اطلاعات و کاربردهای هوش مصنوعی

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 602

فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/762596

شناسه ملی سند علمی:

CEITCONF01_133

تاریخ نمایه سازی: 26 مرداد 1397

چکیده مقاله:

بازشناسی تصویری گفتار برای کمک به افرادی که دچار آسیب در سیستم صوتی شده اند، در سالهای اخیر مورد توجه محققین قرار گرفته است. در این مقاله روشی برای تشخیص واج های مصوت(() و /آ ،/ /ای ،/ / او/) زبان فارسی توسط پردازش تصویر ارایه می شود. روش پیشنهادی بدین صورت است که پس از استخراج ناحیه لب از تصاویر چهره توسط یک روش ابتکاری (استفاده از شدت روشنایی و تقارن های طبیعی موجود در آن)، برای استخراج ویژگیهای لب از تابع موجک دو بعدی گسسته(DWT) و سپس محاسبه هیستوگرام ضرایب موجک بدست آمده، استفاده شده است و در نهایت توسط طبقه بند SVM به تشخیص واج های مصوت پرداخته می شود. نتایج بدست آمده نشان میدهد که روش استخراج ویژگی و طبقهبند پیشنهادی می تواند تاثیر چشمگیری در بهبود عملکرد سیستم تشخیص داشته باشد، به طوری که با انتخاب کرنل گوسین برای طبقه بند SVM و انتخاب تعداد ستون های هیستوگرام 60 تایی و انتخاب تابع موجک از نوع بای ارتگنال با جزییات قطری در مرحله استخراج ویژگی، دقت تشخیص آن به 10/84 رسید این در حالی است که نتیجه آزمایش سایر طبقهبندها بر روی دیتاست انتخابی، برای طبقه بند نزدیکترین همسایه(KNN) برابر 18/72، برای شبکه عصبی (ANN) برابر 24/62 و برای طبقهبند درخت تصمیم (DT) برابر 12/60 میباشد.

کلیدواژه ها:

لب خوانی ، واج های مصوت ، تبدیل موجک ، طبقه بند SVM ، دقت تشخیص

نویسندگان

زهرا فتح الهی

دانشجوی کارشناسی ارشد مهندسی نرمافزار، دانشگاه آزاد اسلامی واحد خرم آباد

صبا جودکی

استادیار گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد خرم آباد