CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود یک معیار شباهت خوشه بندی صفحات وب سایت با استفاده از شباهت بین صفحات

عنوان مقاله: بهبود یک معیار شباهت خوشه بندی صفحات وب سایت با استفاده از شباهت بین صفحات
شناسه ملی مقاله: IDMC02_115
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:

بنفشه صفرخانی
مهران محسن زاده

خلاصه مقاله:
خوشه بندی کاربران در بسیاری از کاربردهای وب کاوی در کاربرد وب مورد نیاز است. تعیین شباهت بین جلسات کاربران مهمترین حالت در این فاز محسوب می شود. روشهای موجود برای تعیین شباعت در شیوه ی نمایش جلسات و محاسبه ی شباهت با هم تفاوت دارند. با این وجود روشهای محدودی شباهت بین صفحات را در محاسبه ی شباهت لحاظ می کنند در این مقاله یک روش محاسبه شباهت بر مبنای طبقه بندی دامنه ی وب سایت ارایه شده که شباهت بین صفحات را مبتنی بر روش معیار شباهت lcs بین کلمات لحاظ می کند. نتایج ارزیابی نشان میدهد که معیار شباهت تعریف شده کارایی قابل قبولی در خوشه بندی صفحات و ایجاد کرده است.

کلمات کلیدی:
خوشه بندی صفحات وب، شباهت جلسات، شباهت صفحات

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70505/