استفاده از خوشه بندی و خلاصه سازی اسناد جهت نمایه سازی معنایی پنهان توزیع شده
محل انتشار: سومین کنفرانس داده کاوی
سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,545
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC03_026
تاریخ نمایه سازی: 13 دی 1389
چکیده مقاله:
نمایه سازی معنایی پنهان یک روش مفهومی در سیستم های بازیابی اطلاعات می باشد دراین روش ماتریس کلمه - سند با استفاده از روشهای وزن دهی کلمات ساخته می شود این ماتریس با روشهای تجزیه ریاضی مانند تجزیه مقادیر منفرد به یک فضای مفهومی نگاشته می شود اگر تعداد کلمات و اسناد افزایش یابد انگاه به طور فزاینده ای به درایه های ماتریس کلمه - سند افزوده می شود که باعث ایجادمشکلاتی از قبیل افزایش بسیار زیاد مصرف حافظه و هزینه های محاسباتی خواهد شد با این فرض که استفاده از توزیع اسناد باعث کاهش حافظه مورد نیاز و هزینه های اجرا می شود ما یک روش نمایه سازی معنایی پنهان را طراحی و پیاده سازی نمودیم. دراین روش با خوشه بندی اسناد و خلاصه سازی اسناد جهت بهتر شدن کارایی نیز ترکیب شده است دراین ترکیب ماتریس کلمه - سند به ازای هر خوشه دوباره ایجاد م یشود و بازیابی براساس ماتریس کلمه - سند هر خوشه انجام می گیرد ما روش ارائه شده خود را با استفاده از اسناد Hamshahri Collection که مجموعه ای از اخبار فارسی است مورد ارزیابی قرا رداده ایم ارزیابی ها نشان داد که روش ترکیبی کارایی بهتری نسبت به روش غیرترکیبی دارد.
کلیدواژه ها:
نویسندگان
مهدی به شامه
عضو هیئت علمی دانشگاه آزاد اسلامی واحد تویسرکان
حسن بشیری
عضو هیئت علمی دانشگاه صنعتی همدان