CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)
عنوان
مقاله

Efficient Incorporation of PLSA and LDA Semantic Knowledge in Statistical Language Model Adaptation for Persian ASR Systems

اعتبار موردنیاز PDF: ۱ | تعداد صفحات: ۶ | تعداد نمایش خلاصه: ۱۲۵ | نظرات: ۰
سال انتشار: ۱۳۹۳
کد COI مقاله: JR_IJOCIT-2-4_003
زبان مقاله: انگلیسی
حجم فایل: ۲۴۲.۳۹ کیلوبایت (فایل این مقاله در ۶ صفحه با فرمت PDF قابل دریافت می باشد)

راهنمای دانلود فایل کامل این مقاله

متن کامل این مقاله دارای ۶ صفحه در فرمت PDF قابل خریداری است. شما می توانید از طریق بخش روبرو فایل PDF این مقاله را با پرداخت اینترنتی ۳۰,۰۰۰ ریال بلافاصله دریافت فرمایید
قبل از اقدام به دریافت یا خرید مقاله، حتما به فرمت مقاله و تعداد صفحات مقاله دقت کامل را مبذول فرمایید.
علاوه بر خرید تک مقاله، می توانید با عضویت در سیویلیکا مقالات را به صورت اعتباری دریافت و ۲۰ تا ۳۰ درصد کمتر برای دریافت مقالات بپردازید. اعضای سیویلیکا می توانند صفحات تخصصی شخصی روی این مجموعه ایجاد نمایند.
برای راهنمایی کاملتر راهنمای سایت را مطالعه کنید.

خرید و دانلود فایل PDF مقاله

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این مقاله را که دارای ۶ صفحه است به صورت فایل PDF در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:

مشخصات نویسندگان مقاله Efficient Incorporation of PLSA and LDA Semantic Knowledge in Statistical Language Model Adaptation for Persian ASR Systems

Seyed Mahdi Hoseini - Computer Department of Shafagh University Tonekabon
Behrouz Minaei - Computer Department of Iran University of Science & Technology Tehran

چکیده مقاله:

Language models (LMs) are important tools for especially ASR systems to improve their efficiency. Development of robust spoken language model ideally relies on the availability of large amounts of data preferably in the target domain and language. However, more often than not, speech developers need to cope with very little or no data, typically obtained from a different target domain. Language models are very brittle when moving from one domain to another. Language model adaptation is achieved by combining a generic LM with a topic-specific model that is more relevant to the target domain. We review a two major topic-based generative language model techniques designed to gain semantic knowledge of text. We show that applying a tf-idf-related per-word confidence metric, and using unigram rescaling rather than linear combinations with N-grams produces a more robust language model which has a significant higher accuracy on FARSDAT test set than a baseline N-gram model

کلیدواژه‌ها:

Speech Recognition, Statistical Language Model Adaptation, Corpus,

کد مقاله/لینک ثابت به این مقاله

برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است و به عنوان سند ثبت مقاله در مرجع سیویلیکا مورد استفاده قرار میگیرد:
https://www.civilica.com/Paper-JR_IJOCIT-JR_IJOCIT-2-4_003.html
کد COI مقاله: JR_IJOCIT-2-4_003

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:
Hoseini, Seyed Mahdi & Behrouz Minaei, ۱۳۹۳, Efficient Incorporation of PLSA and LDA Semantic Knowledge in Statistical Language Model Adaptation for Persian ASR Systems, International Journal of Computer & Information Technologies 2 (4), https://www.civilica.com/Paper-JR_IJOCIT-JR_IJOCIT-2-4_003.html

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (Hoseini, Seyed Mahdi & Behrouz Minaei, ۱۳۹۳)
برای بار دوم به بعد: (Hoseini & Minaei, ۱۳۹۳)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

مدیریت اطلاعات پژوهشی

اطلاعات استنادی این مقاله را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

مقالات مرتبط جدید

شبکه تبلیغات علمی کشور

به اشتراک گذاری این صفحه

اطلاعات بیشتر درباره COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.