CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

خلاصه سازی متون فارسی با استفاده از الگوریتم یادگیری عمیق

عنوان مقاله: خلاصه سازی متون فارسی با استفاده از الگوریتم یادگیری عمیق
شناسه ملی مقاله: IDMEC01_065
منتشر شده در اولین کنفرانس ملی کسب و کارهای نوین و هوشمند داده کاوی و پردازش تصاویر در سال 1397
مشخصات نویسندگان مقاله:

ساره قانع - دانشجوی کارشناسی ارشد هوش مصنوعی موسسه آموزش عالی اشراق
قدرت سپیدنام - استادیار و عضو هیات علمی موسسه آموزش عالی اشراق
احسان جعفری - مدیر گروه و عضو هیات علمی موسسه آموزش عالی اشراق

خلاصه مقاله:
با توجه به رشد روزافزون اطلاعات و افزایش سریع حجم داده های دیجیتالی، ناگزیر به خلاصه سازی متون هستیم. نیاز به خلاصه سازی متون و اخبار یکی از نیازهای لازم در حوزه پردازش زبان طبیعی می باشد. روش های حاضر بر حسب روش های آمار، وردنت ، روش های مبتنی بر گراف و غیره می باشند. خلاصه سازی خودکار متن به عنوان هسته مرکزی طیف گسترده ای از ابزارهای پردازشگر متن مانند خلاصه سازهای ماشینی، سیستم های تصمیم یار، سیستم های پاسخگو، موتورهای جستجو و غیره تلقی می شود. تلاش ما بر این است تا روشی بهتر از روش های ذکرشده برای خلاصه سازی متون با استفاده از الگوریتم های یادگیری عمیق به دست آوریم. هدف ما در این مقاله، ایجاد خلاصه سازی استخراجی از متون و انتخاب بهترین جملات درون متون برای ایجاد خلاصه بهتر با استفاده از یادگیری عمیق می باشد. این خلاصه سازی بر روی متون فارسی صورت می گیرد و پیش پردازش ها و محدودی،های خاصی را دارا می باشد. همچنین بررسی هایی انجام می دهیم که بتوانیم بهترین حال، نمایش یک سند متن فارسی را به حال، عددی به دست آوریم به طوری که معنای کلمات درونمتون آنها حذف نشود. نتایج نشان می دهد که مدل درخت، تصمیم با میزان دقت، 100 % بهترین مدل اعمال شده است و مدل شبکه عصبی با دقت، 98 % درصد در رتبه دوم قرار دارد.

کلمات کلیدی:
خلاصه سازی متن، یادگیری عمیق، شبکه عصبی، یادگیری بدون نظارت، متن کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/990619/