استفاده از خوشه بندی و خلاصه سازی اسناد جهت نمایه سازی معنایی پنهان توزیع شده

سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,545

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC03_026

تاریخ نمایه سازی: 13 دی 1389

چکیده مقاله:

نمایه سازی معنایی پنهان یک روش مفهومی در سیستم های بازیابی اطلاعات می باشد دراین روش ماتریس کلمه - سند با استفاده از روشهای وزن دهی کلمات ساخته می شود این ماتریس با روشهای تجزیه ریاضی مانند تجزیه مقادیر منفرد به یک فضای مفهومی نگاشته می شود اگر تعداد کلمات و اسناد افزایش یابد انگاه به طور فزاینده ای به درایه های ماتریس کلمه - سند افزوده می شود که باعث ایجادمشکلاتی از قبیل افزایش بسیار زیاد مصرف حافظه و هزینه های محاسباتی خواهد شد با این فرض که استفاده از توزیع اسناد باعث کاهش حافظه مورد نیاز و هزینه های اجرا می شود ما یک روش نمایه سازی معنایی پنهان را طراحی و پیاده سازی نمودیم. دراین روش با خوشه بندی اسناد و خلاصه سازی اسناد جهت بهتر شدن کارایی نیز ترکیب شده است دراین ترکیب ماتریس کلمه - سند به ازای هر خوشه دوباره ایجاد م یشود و بازیابی براساس ماتریس کلمه - سند هر خوشه انجام می گیرد ما روش ارائه شده خود را با استفاده از اسناد Hamshahri Collection که مجموعه ای از اخبار فارسی است مورد ارزیابی قرا رداده ایم ارزیابی ها نشان داد که روش ترکیبی کارایی بهتری نسبت به روش غیرترکیبی دارد.

کلیدواژه ها:

نویسندگان

مهدی به شامه

عضو هیئت علمی دانشگاه آزاد اسلامی واحد تویسرکان

حسن بشیری

عضو هیئت علمی دانشگاه صنعتی همدان