تشخیص 6 واژه گفتاری از روی حرکات لب و با استفاده از تصاویر رنگی

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,762

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI12_305

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

دقت و اطمینان سیستمهای تشخیص اتوماتیک گفتار صوتی با استفاده از اطلاعات تصویری از حرکات لب گویندگان بهبود می یابد. در این مقاله، یک رویکرد جدید برای تشخیص دیداری گفتار ارائه شده است که شامل دومرحله استخراج ویژگی از دنباله تصاویر لب و تصاویر لب و طبقه بندی ویژگی های بدست آمده میباشد. برای استخراج ویژگی از دنباله تصاویر لب، یک الگوریتم استخراج کانتور لب مبتنی بر ناحیه بر اساس مدلهای انعطاف پذیر پیشنهاد شده است. الگوریتم از یک تابع هزینه آماری برای قسمت بندی تصاویر لب داده شده به ناحیه لب و غیر لب استفاده می کند. ابتدا نگاشت احتمال گسسته با استفاده از روشهای خوشه بندی فازی ایجاد شده است و با داشتن این نگاشت، طریقه بهینه سازی تابع هزینه در حوزه پیوسته نشان داده شده است. با تابع هزینه مبتنی بر ناحیه، الگوریتم برای تصاویر لب با کنتراست رنگی کم و دارای نویز و آرتیفکت مطمئنتر می باشد. پارامترهای استخراج شده با استفاده ازتوزیع احتمال پیوسته مدل شده است ووابستگی انها بوسیله مدلهای مخفی مارکوف مدل شده است. ارزیابی بر روی مجموعه دادگان جمع آوری شده از تصاویر لب 20 گوینده مختلف صورت گرفته و بر روی 6 واژه گفتاری با 92% موفقیت، بازشناسی گفتار انجام شده است.

نویسندگان

رضا شالباف

کارشناسی ارشد مهندسی پزشکی دانشگاه صنعتی امیرکبیر

منصور وفادوست

استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر