بهبود الگوریتم طبقه بندی سوالات فارسی با استفاده از شبکه عصبی عمیق

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 569

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG03_217

تاریخ نمایه سازی: 14 فروردین 1399

چکیده مقاله:

ضرورت وجود سیستم های پاسخ در سوال (QA) با در نظر گرفتن این حقیقت آشکار می شود که حجم عظیم داده های بدون ساختار ایجاد شده توسط انسان ها امروزه، منجر به بی اثر کردن موتورهای جستجو برای ارایه راه حل دقیق برای یک سوال داده شده، می شود. با این حال، یک سیستم سوال مهم در پاسخ به سیستم نیازمند یک سیستم طبقه بندی سوال برجسته (QC ) است. طبقه بندی کننده سوال سیستمی است که یک برچسب برای هر سوال تعیین می کند. روش های متفاوتی برای حل این مشکل وجود دارد، مانند یادگیری مبتنی بر قاعده، یادگیری ماشین، و رویکردهای ترکیبی. استخراج ویژگی در این مقاله با استفاده از رویکردهای یادگیری ماشین و شبکه عصبی عمیق بهبود کنترل کیفیت را فراهم می کند. در این مقاله مجموعه داده (University of Tehran Question Dataset 2016) UTQD. 2016) را معرفی می کنیم که از نوعی بازی در معرض خطر از سوی تلویزیون رسمی ایران جمع آوری شده است. این مجموعه حاوی 1175 سوال فارسی است که به صورت دستی جمع شده و برچسب گذاری شده است و الگوی ورودی بدست آمده به صورت داده json بوده که عملکرد را آسان و سریع می کند. در روش پیشنهادی، هر سوال به ماتریسی که در آن هر سطر نمایش، Word2vec از یک کلمه را نشان می دهد، تبدیل می کند. سپس، یک شبکه LSTM برای هدف، طبقه بندی بکار میرود که در آزمایش ها ما منجر به دقت متوسط 5%. 87 در مجموعه داده سوال شده است. و نشان می دهد با وجود مجموعه داده محدود منطقی است از شبکه های عصبی مصنوعی استفاده کرد.

نویسندگان

سمیه بختیاری زاده

دانشجویی کارشناسی ارشد گروه مهندسی کامپیوتر، دانشگاه شهاب دانش

گلنوش عبایی

استادیار گروه مهندسی کامپیوتر