خلاصه سازی خودکار متون فارسی با استفاده از روش های مبتنی بر گراف

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,620

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCONF04_004

تاریخ نمایه سازی: 20 خرداد 1398

چکیده مقاله:

با ر شد سریع فناوری های تبادل اطلاعات، حجم انبوهی از داده های متنی تولید می شوند که شنا سایی بهترین اسناد از نظر میزان محتوای اطلاعاتی و همچنین استخراج مهم ترین اطلاعات آنها با در نظر گرفتن زمان، بر لزوم مواجهه با سیستم های خلاصه ساز خودکارتاکید می کند. در این پژوهش یک سیمتم خلاصه سازی استاراجی تک سندی مبتنی بر گراف ارائه شده است که به دو روش اقدام به تولید خلاصه نهایی می کند؛ با این توضیح که پا از بازنمایی سند ورودی در قالب گراف جایگزین و شناسایی میزان شباهت هر یک از رئوس گراف (جملات) و انتساب وزن یال ها، در روش اول با استفاده از معیارهای تشخیص مهم ترین رئوس گراف، مهم ترین جملات برای حضور در خلا صه انتخاب می شوند. همچنین در روش دوم درخت پو شای بیشینه گراف به عنوان بخشی از گراف که در بردارنده مهم ترین ارتباطات معنایی آن است استخراج شده و مبنای انتخاب جملات برای حضور در خلاصه نهایی خواهد بود. درخت پوشای بیشینه یک زیر گراف از گراف اصلی است که بین هر راس آن فقط یک مسیر وجود دارد و مجموع وزن یال های آن بیشینه است. این پژوهش از دانش خاصی برای خلاصه سازی استفاده نمی کند و صرفا با به کارگیری صحیک ابزار مربوط به پردازش زبان طبیعی اقدام به تولید خلاصه می نماید، از این رو اینروش مناسب برای خلاصه سازی هر محتوایی می باشد

کلیدواژه ها:

خلاصه سازی خودکار متن ، خلاصه استخراجی ، درخت پوشای بیشینه ، خلاصه سازی مبتنی بر گراف

نویسندگان

نادیا صنوبری

گروه فناوری اطلاعات موسسه آموزش عالی عبدالرحمن صوفی رازی

نگار ملکی

گروه فناوری اطلاعات موسسه آموزش عالی عبدالرحمن صوفی رازی

مجید رمضانی

گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران