روشی جدید برای خلاصه سازی چکیده تک سند فارسی با استفاده از یادگیری عمیق

الهام یادگاری; هادی خسروی; محمدعلی عرب زاده

روشی جدید برای خلاصه سازی چکیده تک سند فارسی با استفاده از یادگیری عمیق

محل انتشار: ششمین کنفرانس بین المللی فناوری اطلاعات، کامپیوتر و مخابرات

سال انتشار: 1398

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 656

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/924213

شناسه ملی سند علمی:

ITCT06_032

تاریخ نمایه سازی: 24 شهریور 1398

چکیده مقاله:

یکی از موضوعات مهمی که در سالهای اخیر در حوزه پردازش زبانهای طبیعی مورد توجه قرار گرفته است، سیستم های خلاصه سازی متن است. مسالهی اصلی در خلاصه سازی نگاشت دنباله هایی با طولهای نامشخص و متغیر به یکدیگر است. روشهای سنتی پردازش زبان طبیعی برای حل اینگونه مسائل دارای محدودیتهای خاص خود میباشند. از این جهت در این پژوهش تلاش شد با استفاده از روشهای جدید یادگیری عمیق، به توسعه ی مدلی مبتنی بر شبکه های عصبی بازگشتی جهت نگاشت دنباله به دنباله پرداخته شود. مدل پیاده سازی شده از روش چکیده و ابزار تنسورفلو یکی از ابزارهای یادگیری عمیق در بستر زبان برنامه نویسی پایتون استفاده کرده است. در یادگیری عمیق برای آموزش شبکه به تعداد داده های زیاد احتیاج است به همین علت جهت آموزش شبکه از مجموعه دادگانی شامل بیش از صدهزار سند خبری استفاده گردید. به منظور تطبیق داده ها با مدل از پردازش زبان طبیعی استفاده شد. نتایج پیاده سازی نشان دهنده نرخ یادآوری 19/2، دقت 10/45 و کیفیت خلاصه 13/6 است

کلیدواژه ها:

خلاصه سازی متن ، پردازش زبان طبیعی ، خلاصه سازی چکیده ، یادگیری عمیق ، مدلهای رمزگذار/رمزگشا

نویسندگان

الهام یادگاری

موسسه آموزش عالی صفاهان، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، اصفهان

هادی خسروی

دانشگاه شهرکرد، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، شهرکرد

محمدعلی عرب زاده

موسسه آموزش عالی صفاهان، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، اصفهان