CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص و حذف بهینه ی صفحات شبه تکراری

عنوان مقاله: تشخیص و حذف بهینه ی صفحات شبه تکراری
شناسه ملی مقاله: COMCONF01_215
منتشر شده در کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر در سال 1394
مشخصات نویسندگان مقاله:

محمود محمدی - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
محمد طهماسبی - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
صبا حاتمی علم - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
محمد ابراهیم شیری - استادیار نام دانشگاه صنعتی امیرکبیر

خلاصه مقاله:
موتور جستجو یک ابزار مهم برای کاربران برای دسترسی به منابع اطلاعاتی شبکه است .ب ههرحال، تعداد زیادی از صفحات تکراری و شبه تکراری به بار مسئولیت کاربر افزوده شده اند .در حال حاضر،موتورهای جستجو فقط صفحات تکراری را حذف میکنند ولی هنوز استراتژیهای مؤثری در تشخیص و حذف صفحات شبه تکراری ندارند .این مقاله روشهای موجود برای انتخاب روش مناسب برای تشخیص صفحات شبه تکراری را بررسی کرده است و استراتژی حذف را بهینهسازی کرده است تا تضمین کند که صفحات شبه تکراری فضای زیادی را در نتایج جستجو اشغال نمیکنند وقتی که ب هطور مؤثر استفاده میشوند .اینها به کاربران اجازه خواهند داد که اطلاعات موردنیاز را سادهتر بازیابی کنند

کلمات کلیدی:
موتورجستجو ، بازیابی اطلاعات ، شبه تکراری ، تشخیص تکراری ، روشهای رتبه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/404319/