CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تعمیمی برمدل آماری پردازش ماشینی زبان طبیعی برای تطبیق سوال فارسی

عنوان مقاله: تعمیمی برمدل آماری پردازش ماشینی زبان طبیعی برای تطبیق سوال فارسی
شناسه ملی مقاله: CECIT01_477
منتشر شده در کنگره ملی مهندسی برق، کامپیوتر و فناوری اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

سارا ایزدی - دانشگاه یزد
محمد قاسم زاده - دانشگاه یزد
علیمحمد زارع بیدکی - دانشگاه یزد

خلاصه مقاله:
فضای اینترنت شامل حجم عظیمی ازاطلاعات و ازآن جمله جفت های پرسش و پاسخ است لذا این قابلیت که بتوانیم سوال معادل و یا سوال مشابه با سوال کاربر را به سرعت یافته وپاسخ مربوطه را ارایه دهیم اهمیت ویژه ای یافته است دراین زمینه کوشش هایی برای سایرزبانها صورت پذیرفته است دراین مقاله روشی مبتنی برترکیب فضای برداری و تعمیمی ازمدلهای زبانی یونی گرم و بای گرم برای تطابق سوال فارسی ارایه میگردد روشمورد نظر پیاده سازی و برروی داده های محک انبوه ارزیابی شده اند داده های محک شامل بایگانی سرویس پرسش و پاسخ برخط راسخوان که ح اوی بیش ازهجده هزارجفت پرسش و پاسخ است می باشد حجم نتایج این تحقیق می باشند دربخش ارزیابی میزان بهبود مدل نسبت به روشی که تنها فضای برداری استفاده شود نیز مقایسه شده است نتایج این مقایسه نشان از بهبود معیارهای دقت و فراخوانی با استفاده ازمدلهای زبانی ارایه شده است همچنین این مدل درمقایسه با مدلهای تطبیق سوال ارایه شده برای سایرزبانها که ازروشهای پیچیده تری مانند هستان شناسی درتطبیق سوال استفاده کرده اند نیز پاسخ بهتری را ارایه میدهد

کلمات کلیدی:
پردازش زبان طبیعی، تطبیق سوال، مدل آماری زبان، الگوریتم کارآمد

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/210937/