CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص 6 واژه گفتاری از روی حرکات لب و با استفاده از تصاویر رنگی

عنوان مقاله: تشخیص 6 واژه گفتاری از روی حرکات لب و با استفاده از تصاویر رنگی
شناسه ملی مقاله: ACCSI12_305
منتشر شده در دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1385
مشخصات نویسندگان مقاله:

رضا شالباف - کارشناسی ارشد مهندسی پزشکی دانشگاه صنعتی امیرکبیر
منصور وفادوست - استادیار دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر
احمد شالباف

خلاصه مقاله:
دقت و اطمینان سیستمهای تشخیص اتوماتیک گفتار صوتی با استفاده از اطلاعات تصویری از حرکات لب گویندگان بهبود می یابد. در این مقاله، یک رویکرد جدید برای تشخیص دیداری گفتار ارائه شده است که شامل دومرحله استخراج ویژگی از دنباله تصاویر لب و تصاویر لب و طبقه بندی ویژگی های بدست آمده میباشد. برای استخراج ویژگی از دنباله تصاویر لب، یک الگوریتم استخراج کانتور لب مبتنی بر ناحیه بر اساس مدلهای انعطاف پذیر پیشنهاد شده است. الگوریتم از یک تابع هزینه آماری برای قسمت بندی تصاویر لب داده شده به ناحیه لب و غیر لب استفاده می کند. ابتدا نگاشت احتمال گسسته با استفاده از روشهای خوشه بندی فازی ایجاد شده است و با داشتن این نگاشت، طریقه بهینه سازی تابع هزینه در حوزه پیوسته نشان داده شده است. با تابع هزینه مبتنی بر ناحیه، الگوریتم برای تصاویر لب با کنتراست رنگی کم و دارای نویز و آرتیفکت مطمئنتر می باشد. پارامترهای استخراج شده با استفاده ازتوزیع احتمال پیوسته مدل شده است ووابستگی انها بوسیله مدلهای مخفی مارکوف مدل شده است. ارزیابی بر روی مجموعه دادگان جمع آوری شده از تصاویر لب 20 گوینده مختلف صورت گرفته و بر روی 6 واژه گفتاری با 92% موفقیت، بازشناسی گفتار انجام شده است.

کلمات کلیدی:
استخراج کانتور لب ، ویژگی های تصویری گفتار ، بازشناسی دیداری گفتار ، الگوهای انعطاف پذیر ، مدل لب ، جداسازی لب ، خوشه بندی فازی ، تصاویر رنگی ، تابع هزینه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/44691/