عشق بود خوشه بندی متون با استفاده از تئوری برهان قابل استماع

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 975

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DOROUDIT01_104

تاریخ نمایه سازی: 7 آذر 1391

چکیده مقاله:

یکی از مباحث مهم در حوزه بازیابی اطلاعات خوشه بندی مستندات براساس شباهت بین آن‌ها می‌باشد که با توجه به وجود همین شباهت‌ها و معیارهای تعیین آن‌ها می‌توان روند خوشه بندی مستندات را بهبود بخشید. از آنجایی که تاکنون بین روش‌های خوشه بندی سلسله مراتبی و جز بندی مقایسه‌ای برمبنای فاصله بین ترم‌های مستندات و شیوه‌های تعیین شباهت صورت نگرفته بر آن شدیم تا پنج روش خوشه بندی، براساس هفت معیار تعیین فاصله را با دو روش نمایش بردار ویژگی مستندات SingleWord و روش پیشنهادی Rich Document بر اساس تئوری برهان قابل استماع آن که در دهه 80 میلادی مطرح گردید را آزمایش نمایی که نتایج ارائه شده حاصل از آزمایشات، حاکی از برتری برجسته‌ترین شباهت برمبنای تئوری برهان قابل استماع می‌باشد .

کلیدواژه ها:

بازیابی اطلاعات ، تئوری برهان قابل استماع ، خوشه بندی

نویسندگان

هومن کاشانیان

دانشجوی کارشناسی ارشد نرم افزار - دانشکده برق و کامپیوتر - دانشگاه آزا