CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

گواهی نمایه سازی مقاله ارائه یک سیستم پرسش و پاسخ با رده بندی سوالات و جملات کاندید با استفاده از n-gram

عنوان مقاله: ارائه یک سیستم پرسش و پاسخ با رده بندی سوالات و جملات کاندید با استفاده از n-gram
شناسه (COI) مقاله: ACCSI14_235
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال ۱۳۸۷
مشخصات نویسندگان مقاله:

مسلم محمدی جنقرا - دانشگاه آزاد اسلامی واحد ملکان
مرتضی آنالویی - دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران

خلاصه مقاله:
در این مقاله یک روش مبتنی بر رده بندی و وزن دهی کلمات برای پاسخدهی به سوالات در حوزه زندگینامه پیشنهاد شده است. با استفاده از یک پیکره از پاسخ هایی که به صورت دستی استخراج شده اند، کلمات فنی به همراه bi-gram ها و uni-gram ها دراین حوزه، تعیین می شوند و سپس این کلمات وزن دهی شده و برای رده بندی سوالات مطرح شده و جملات کاندید برای پاسخ ، مورد استفاده قرار می گیرند. ما در این مقاله برای ارزیابی روش پیشنهادی سیستم، انواع سوالات را به سوالات در زمینه " تاریخ ولادت" ،" تاریخ وفات" محدود کرده ایم. با استفاده از این روش در واقع از تمام الگوهای پاسخ استفاده می شود ولی هیچ نیازی به ایجاد الگوها نمی باشد و در واقع یک روش مبتنی بر بازیابی اطلاعات توسعه داده شده می باشد. در این روش میزان MRR برابر 53 % بوده ولی میزان دقت خیلی امیدوار کننده و برابر 80% می باشد.

کلمات کلیدی:
سیستم پرسش و پاسخ ، بازیابی اطلاعات ، پردازش زبان طبیعی ، سوالات با جواب کوتاه ، زبان فارسی ، حوزه زندگینامه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://www.civilica.com/Paper-ACCSI14-ACCSI14_235.html