CIVILICA We Respect the Science
ناشر تخصصی کنفرانسهای ایران
عنوان
مقاله

بکارگیری نرمالسازی اثر طول مسیرصوتی گوینده ها (VTLN) در سیستم بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف

اعتبار موردنیاز : ۱ | تعداد صفحات: ۸ | تعداد نمایش خلاصه: ۱۲۳۰ | نظرات: ۰
سرفصل ارائه مقاله: پردازش ویدئو و صحبت
سال انتشار: ۱۳۸۶
نوع ارائه: شفاهی
کد COI مقاله: ACCSI13_111
زبان مقاله: فارسی
حجم فایل: ۱۶۷.۸۱ کیلوبایت (فایل این مقاله در ۸ صفحه با فرمت PDF قابل دریافت می باشد)

راهنمای دانلود فایل کامل این مقاله

اگر در مجموعه سیویلیکا عضو نیستید، به راحتی می توانید از طریق فرم روبرو اصل این مقاله را خریداری نمایید.
با عضویت در سیویلیکا می توانید اصل مقالات را با حداقل ۳۳ درصد تخفیف (دو سوم قیمت خرید تک مقاله) دریافت نمایید. برای عضویت در سیویلیکا به صفحه ثبت نام مراجعه نمایید. در صورتی که دارای نام کاربری در مجموعه سیویلیکا هستید، ابتدا از قسمت بالای صفحه با نام کاربری خود وارد شده و سپس به این صفحه مراجعه نمایید.
لطفا قبل از اقدام به خرید اینترنتی این مقاله، ابتدا تعداد صفحات مقاله را در بالای این صفحه کنترل نمایید.
برای راهنمایی کاملتر راهنمای سایت را مطالعه کنید.

خرید و دانلود فایل مقاله

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای ۸ صفحه است در اختیار داشته باشید.

قیمت این مقاله : ۳,۰۰۰ تومان

آدرس ایمیل خود را در کادر زیر وارد نمایید:

مشخصات نویسندگان مقاله بکارگیری نرمالسازی اثر طول مسیرصوتی گوینده ها (VTLN) در سیستم بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف

باقر باباعلی - مربی دانشگاه آزاد اسلامی واحد دشتسنان
  حسین صامتی - استادیار دانشکده کامپیوتر، دانشگاه صنعتی شریف
  هادی ویسی - دانشجوی دکتری دانشکده کامپیوتر، دانشگاه صنعتی شریف

چکیده مقاله:

مقاوم سازی سیستم های بازشناسی در مقابل تغییرات بین گوینده های مختلف جهت حفظ کارایی از جمله مسایل مطرح در مبحث بازشناسی گفتار می باشد. یکی از عوامل اصلی تغییرات بین گوینده های مختلف ناشی از تفاوت موجود در طول مجرای صوتی می باشد . روش نرمال سازی طول مسیر صوتی از روش های رایج برای از بین بردن و یا حداقل کم اثر کردن تغییرات ناشی از طولهای مختلف مسیر صوتی در افراد مختلف است که مورد توجه قرار گرفته است. در این مقاله روش های متداول استخراج و اعمال ضریب پیچش بر روی طیف گفتار جهت نرمال سازی اثر طول مسیر صوتی مورد بررسی و مقایسه قرار گرفته اند. سپس تأثیر استخراج ضریب پیچش با رویکرد مبتنی بر جستجو و اعمال آن بر طیف گفتار به روش پیچش فرکانسی در یک سیستم بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف با واژگان بزرگ بررسی شده است. دادگان گفتاری بکار گرفته شده جهت آموزش سیستم، فارس دات تمیز می باشد و دادگان آزمون شامل ۱۴۰ جمله از فارس دات تمیز بهمراه ۴ مجموعه نویزی است. بر مبنای نتایج بدست آمده از انجام آزمایشات بکارگیری نرمال سازی اثر طول مسیر صوتی بر روی دادگان آزمون تمیز ۲% بهبود دقت و بر رخی از مجموعه ها ی نویزی تا ۷% بهبود دقت را بهمراه داشته است. همچنین مشاهده شد که هرچه مقدار ضریب پیچش از مقدار پیش فرض ۱ فاصله بیشتری داشته باشد، بکارگیری نرمال سازی اثر طول مسیرصوتی بهبود بیشتری را به دنبال خواهد داشت چون مقدار پیچش ۱ معادل عدم اعمال پیچش است.

کلیدواژه‌ها:

بازشاسی گفتار پیوسته ، نرمال سازی اثر طول مسیر صوتی گوینده ، تغییرات گوینده

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-ACCSI13-ACCSI13_111.html
کد COI مقاله: ACCSI13_111

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
باباعلی, باقر؛ حسین صامتی و هادی ویسی، ۱۳۸۶، بکارگیری نرمالسازی اثر طول مسیرصوتی گوینده ها (VTLN) در سیستم بازشناسی گفتار پیوسته فارسی مبتنی بر مدل مخفی مارکوف، سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران، جزیره کیش، انجمن کامپیوتر، دانشگاه صنعتی شریف، https://www.civilica.com/Paper-ACCSI13-ACCSI13_111.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (باباعلی, باقر؛ حسین صامتی و هادی ویسی، ۱۳۸۶)
برای بار دوم به بعد: (باباعلی؛ صامتی و ویسی، ۱۳۸۶)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

  • _ M. Pitz, S. Molau, R. Schl uter, H. Ney, ...
  • P. Zhan and A. Waibel. Vocal Tract Length Normalization for ...
  • P. Zhan, M. Westphal, M. Finke, _ Waibel, Speaker Normalization ...
  • D. Pye and P. C. Woodland. Experiments in speaker normalization ...
  • L. Welling, R. H aeb-Umbach, X. Aubert, N. Haberland, A ...
  • Vocal Track Normalization And Speaker Adaptation. IEEE, 1998. ...
  • E. B. Gouvea, Acoustic- Fea ture-Based Frequency Warping for Speaker ...
  • T. Claes, I. Dologlou, L. ten Bosch and D. Van ...
  • L. Welling, H. Ney, S. Kanthak, Speaker Adaptive Modeling by ...
  • B. Babaali, H. Sameti, The Sharif Speaker Independent Large Vocabulary ...
  • M. Bijankhan et al., FARSDAT - The Speech Database of ...
  • مدیریت اطلاعات پژوهشی

    اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

    مقالات پیشنهادی مرتبط

    مقالات مرتبط جدید

    شبکه تبلیغات علمی کشور

    به اشتراک گذاری این صفحه

    اطلاعات بیشتر درباره COI

    COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
    کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.