الگوریتمی جهت خوشه بندی صفحات وب بر اساس محتوای داده ای
محل انتشار: سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 3,160
فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI13_241
تاریخ نمایه سازی: 25 آبان 1386
چکیده مقاله:
در این مقاله الگوریتم جدیدی برای خوشه بندی صفحات وب بر اساس محتوای داده ای ارائه شده است. الگوریتم جدید بر اساس عبارات و کلمات موجود در صفحات وب نمایش بیتی انها بصورت برداری و با استفاده از یک معیار تشابه جدید که از ترکیب معیار تشابه Cosing و جاکارد بدست آمده، پیشنهاد شده است. برای ارزیابی کارایی الگوریتم پیشنهادی، صفحاتی با پنج موضوع مهندسی نرم افزار، شبکه های کامپیوتریف معماری کامپیوتر، پردازش موازی و سیستم عامل مورد جستجو قرار گرفته و بعد از آماده سازی بستر داده ای مناسب، الگوریتم ارائه شده بصورت جداگانه با دو معیار تشابه Cosing و معیار تشابه ارائه شده در این مقاله شبیه سازی شده و با استفاده از شاخص Dunn مورد ارزیابی قرار گرفته است. نتایج بدست آمده از شبیه سازی نشان دهنده کارایی بالای الگوریتم پیشنهادی در تفکیک صفحات وب از هم و خوشه بندی مناسب انها می باشد.
کلیدواژه ها:
نویسندگان
روح اله اعتمادی
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد بناب
نصراله مقدم چرکری
استادیار دانشکده فنی و مهندسی دانشگاه تربیت مدرس
محمدرضا صالح نمدی
استادیار دانشکده تحصیلات تکمیلی دانشگاه آزاد اسلامی واحد تهران جنوب
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :