روشی جدید برای خلاصه سازی چکیده تک سند فارسی با استفاده از یادگیری عمیق

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 642

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCT06_032

تاریخ نمایه سازی: 24 شهریور 1398

چکیده مقاله:

یکی از موضوعات مهمی که در سالهای اخیر در حوزه پردازش زبانهای طبیعی مورد توجه قرار گرفته است، سیستم های خلاصه سازی متن است. مسالهی اصلی در خلاصه سازی نگاشت دنباله هایی با طولهای نامشخص و متغیر به یکدیگر است. روشهای سنتی پردازش زبان طبیعی برای حل اینگونه مسائل دارای محدودیتهای خاص خود میباشند. از این جهت در این پژوهش تلاش شد با استفاده از روشهای جدید یادگیری عمیق، به توسعه ی مدلی مبتنی بر شبکه های عصبی بازگشتی جهت نگاشت دنباله به دنباله پرداخته شود. مدل پیاده سازی شده از روش چکیده و ابزار تنسورفلو یکی از ابزارهای یادگیری عمیق در بستر زبان برنامه نویسی پایتون استفاده کرده است. در یادگیری عمیق برای آموزش شبکه به تعداد داده های زیاد احتیاج است به همین علت جهت آموزش شبکه از مجموعه دادگانی شامل بیش از صدهزار سند خبری استفاده گردید. به منظور تطبیق داده ها با مدل از پردازش زبان طبیعی استفاده شد. نتایج پیاده سازی نشان دهنده نرخ یادآوری 19/2، دقت 10/45 و کیفیت خلاصه 13/6 است

نویسندگان

الهام یادگاری

موسسه آموزش عالی صفاهان، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، اصفهان

هادی خسروی

دانشگاه شهرکرد، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، شهرکرد

محمدعلی عرب زاده

موسسه آموزش عالی صفاهان، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، اصفهان