یک روش خزنده متمرکز مبتنی بر تشخیص جوامع در شبکه ی وب

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 408

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KBEI04_201

تاریخ نمایه سازی: 18 اسفند 1397

چکیده مقاله:

خزنده وب اطلاعات وبسایت های اینترنت را به دست می آورد در حالی که خزنده متمرکز درباره موضوع خاصی اطلاعات را از صفحات وب جمع آوری میکند. خزنده متمرکز سنتی در محتوای صفحه، به جزئیات آن دقت میکند به طوری که با زیاد شدن صفحات در وب، خزنده متمرکز سنتی دارای مشکلاتی خواهد بود . صفحات وب مانند گرافی هستند که با لینک کردن به یکدیگر، یالی بین آنها به وجود میآید. حجم بالای این صفحات در گراف، باعث به وجود آمدن مشکل برای خزنده متمرکز در حین جمع آوری اطلاعات میشود. بنابراین با محدود کردن دامنه خزنده متمرکز، میتوان کارایی را بهبود داد. در این مقاله با استفاده از الگوریتم تشخیص جامعه و تحلیل ساختار لینک در شبکه گراف صفحات، به خزنده گروهی از وبسایتها داده میشود که باعث محدود کردن دامنه خزنده متمرکز میشود. همچنین برای بررسی شباهت صفحات به موضوع موردنظر، از روش پیشنهادی توسعه یافته استفاده شده است. بررسی شباهت صفحات، داخل همین جامعه و با معیار Score انجام میشود. نتایج نشان میدهد با استفاده از روش پیشنهای توسعه یافته، میانگین Score صفحات مرتبط، 0.2 افزایش یافت و با استفاده از الگوریتم تشخیص جامعه، میانگین Score صفحات مرتبط، 0.15 بیشتر شد. درنتیجه هردو روش باعث بهبود روش خزنده متمرکز گردید.

نویسندگان

عطیه جبل عاملی فروشانی

دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان کاشان، ایران

سیدمهدی وحیدی پور

دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان کاشان، ایران

ایوب باقری

دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان کاشان، ایران