بازشناسی اعداد پیوستۀ فارسی بصورت مستقل از گوینده بر روی خط تلفن توسط سیستم ترکیبی متشکل از مدل مخفی مارکف و شبکۀ عصبی

سال انتشار: 1381
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,670

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI08_085

تاریخ نمایه سازی: 18 بهمن 1386

چکیده مقاله:

تشخیص اعدادی که بصورت گفتاری بیان شده باشند بدلیل مورد استفاده بودن در بسیاری از کاربردها از جمله اعلام شمارۀ شناسائی شخصی، شمارۀ حساب بانکی یا شمارۀ عضویت برای کاربران یک سیستم خدمات رسانی، ارتباط با بانک اطلاعاتی ا ز راه دور، ثبت نام دانشجویان از طریق تلفن یا اینترنت و مانند آن بسیار حائز اهمیت می باشد . بازشناسی گفتار و از آن جمله بازشناسی اعداد چنانچه از راه دور و از طریق تلفن بیان شده باشند بدلیل تأثیرات ناشی از دهنی تلفن و نیز خطوط مخابراتی از پیچیدگی و ویژگی های خاص خود برخوردار می باشد . مدل مخفی مارکف و شبکه های عصبی، روش هایی هستند که مبنای اغلب سیستم های بازشناسی گفتار را تشکیل می دهند و هر کدام از این روش ها در مواردی دارای ضعف می باشند . در این مقاله، بازشناسی اعداد پیوستۀ فارسی که از طریق تلفن و بصورت نامقید و نیز مستقل از گوینده بیان شده باشند، توسط مدل مخفی مارکف با چگالی احتمال پیوسته، شبکۀ عصبی پرسپترون چندلایه و ترکیب مدل مخفی مارکف و شبکۀ عصبی مورد نظر می باشد . مقایسه بر حسب نرخ بازشناسی واج و کلمه انجام می گیرد . دو نوع ویژگی مورد استفاده قرار گرفته است . نوعی الگوریتم برنامه ریزی پویا برای استخراج اعداد از رشته واج های بازشناسی شده، بکار برده شده است و نتایج بازشناسی اعداد حاصل از سه روش با هم مقایسه شده اند .

کلیدواژه ها:

بازشناسی گفتار پیوسته ، مدل مخفی مارکف پیوسته ، شبکۀ عصبی پرسپترون چندلایه ، بازشناسی اعداد ، ترکیب مدل مخفی مارکف و شبکۀ عصبی

نویسندگان

محمدمهدی همایون پور

آزمایشگاه سیستمهای هوشمند صوتی - گفتاری دانشکده مهندسی کامپیوتر دان

ذبیح اله احمدپور

آزمایشگاه سیستمهای هوشمند صوتی - گفتاری دانشکده مهندسی کامپیوتر دان

جهانشاه کبودیان

آزمایشگاه سیستمهای هوشمند صوتی - گفتاری دانشکده مهندسی کامپیوتر دان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • شیوا رستم‌زاده، سید محمد احدی، حمید شیخ‌زاده نجار، "بازشناسی گفتار ...
  • سعید بابایی‌زاده، ایمان غلامپور، کامبیز نایبی، "بهبود کارآیی سیستم‌های بازشناسی ...
  • محمدمهدی همایون‌پور، امیر نجاری، "بازشناسی ارقام فارسی ناوابسته به گوینده ...
  • ابوالقاسم صیادیان، کامبیز بدیع، محمد حکاک، محمدرضا بیک‌زاده، "ارائه روش ...
  • احمد اکبری، بابک ناصرشریفن، "بازشناسی هجاها در اعداد دورقمی فارسی ...
  • علی طاهری دمنه، سید محمد احدی، سیدعلی سیدصالحی، "بازشناسی گفتار ...
  • J. R. Deller, J. G. Proakis, J. H. L. Hansen, ...
  • L. R. Rabiner, B.-H. Juang, ، «Fundamental s of Speech ...
  • N. Morgan, H. Bourlard, ،Neural Networks for Statistical Recognition of ...
  • N. Morgan, H. Bourlard, ،4Continuous Speech Recognition: An Introduction to ...
  • N. Morgan, H. Bourlard, ،، C onnectionist Speech Recognition: A ...
  • S. K. Riis, ،Hidden Neural Networks: Application to Speech Recognition'*, ...
  • C. A. Ynoguti, E. da Silva Morais, F. Violaro, 4A ...
  • نمایش کامل مراجع