CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

لب خوانی به کمک پردازش تصاویر به منظور کمک به معلولین حرکتی گفتاری

عنوان مقاله: لب خوانی به کمک پردازش تصاویر به منظور کمک به معلولین حرکتی گفتاری
شناسه ملی مقاله: ICBME13_009
منتشر شده در سیزدهمین کنفرانس مهندسی پزشکی ایران در سال 1385
مشخصات نویسندگان مقاله:

رضا شالباف - دانشکده مهندسی پزشکی دانشگاه صنعتی امیرکبیر
منصور وفادوست
احمد شالباف

خلاصه مقاله:
افراد زیادی هستند که دچار آسیب در سیستم صوتی بوده و قادر به برقراری ارتباط با دیگران نیستند این افراد معمولا توانایی انجام صحیح حرکات لب به شکلی که برای تکلم لازم است را داشته و میتوان با انجام لب خوانی به مقصود آنها پی برد. فرآیند بازشناسی تصویری گفتار راه حلی است که محققین برای غلبه بر مشکل فوق یافته اند و شامل دو مرحله استخراج ویژگی از دنباله تصاویر لب و دسته بندی ویژگی های بدست آمده می باشد. در این الگوریتم، ابتدا یک مدل لب یا محدودیت های هندسی مشخص تعریف می شود. سپس، اطلاعات تصاویر از فضای رنگی RGB به فضای رنگی CIELAB تبدیل شده و الگوریتم K_means و عملگرهای مورفولوژیک برای جداسازی ناحیه لب استفاده شده و مدل پیشنهادی بر روی مرز این ناحیه، انطباق داده می شود و در نهایت برای یکسان سازی بعد بردار ویژگی، از روش درون یابی و برای کاهش بعد بردار ویژگی از روش های PCA و FLD استفاده می گردد. برای دسته بندی 6 واژه، از الگوریتم HMM استفاده شده است و ارزیابی بر روی مجموعه دادگان جمع آوری شده از تصاویر لب 20 گوینده مختلف، صورت گرفته که بیشترین نرخ شناسایی 91% می باشد که علاوه بر رفع عیوب روشهای متداول، حدود 3% نیز نرخ بازشناسی را بهبود می دهد.

کلمات کلیدی:
مدلسازی لب، استخراج مرز لب، بازشناسی دیداری گفتار، مدل مخفی مارکوف

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/53685/