خلاصه سازی چند سندی متون فارسی با استفاده از یک روش مبتنی بر خوشه بندی
محل انتشار: کنفرانس ملی مهندسی نرم افزار
سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 4,571
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCSE01_015
تاریخ نمایه سازی: 14 آبان 1387
چکیده مقاله:
در این مقاله، یک روش جدید مبتنی بر خوشه بندی برای خلاصه سازی چند سندی متون فارسی پیشنهاد شد. در این روش، پس از پیش پردازش متن شامل تعیین مرز واژ هها و جمله ها، یکسان سازی متن، حذف واژ ههای عمومی و شناسایی عناصر متنی چندتایی، فرآیند اصلی خلاصه سازی آغاز میشود. در مرحله ی خلاصه سازی، ابتدا جمله ها خوشه بندی می شود و سپس به ازای هر خوشه جملها ی که بیشترین ارتباط با سایر جمله ها را دارد، گزینش می شود. در آخرین مرحله ی خلاصه سازی، جمله ها با توجه به ترتیب زمانی متن ها (خبری) در خلاصه ی نهایی درج میشوند. نتایج پیاده سازی نشان میدهند که در بیشتر موارد خروجی سامانه ی خلاصه سازی پیشنهادی خلاصه ی قابل قبولی را تولید می کند (بیش از 80 درصد).
کلیدواژه ها:
نویسندگان
محسن مشکی
دانشکده کامپیوتر دانشگاه علم و صنعت ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :