تشخیص و حذف بهینه ی صفحات شبه تکراری
عنوان مقاله: تشخیص و حذف بهینه ی صفحات شبه تکراری
شناسه ملی مقاله: COMCONF01_215
منتشر شده در کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر در سال 1394
شناسه ملی مقاله: COMCONF01_215
منتشر شده در کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر در سال 1394
مشخصات نویسندگان مقاله:
محمود محمدی - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
محمد طهماسبی - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
صبا حاتمی علم - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
محمد ابراهیم شیری - استادیار نام دانشگاه صنعتی امیرکبیر
خلاصه مقاله:
محمود محمدی - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
محمد طهماسبی - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
صبا حاتمی علم - دانشجوی کارشناسی ارشد دانشگاه آزاد بروجرد
محمد ابراهیم شیری - استادیار نام دانشگاه صنعتی امیرکبیر
موتور جستجو یک ابزار مهم برای کاربران برای دسترسی به منابع اطلاعاتی شبکه است .ب ههرحال، تعداد زیادی از صفحات تکراری و شبه تکراری به بار مسئولیت کاربر افزوده شده اند .در حال حاضر،موتورهای جستجو فقط صفحات تکراری را حذف میکنند ولی هنوز استراتژیهای مؤثری در تشخیص و حذف صفحات شبه تکراری ندارند .این مقاله روشهای موجود برای انتخاب روش مناسب برای تشخیص صفحات شبه تکراری را بررسی کرده است و استراتژی حذف را بهینهسازی کرده است تا تضمین کند که صفحات شبه تکراری فضای زیادی را در نتایج جستجو اشغال نمیکنند وقتی که ب هطور مؤثر استفاده میشوند .اینها به کاربران اجازه خواهند داد که اطلاعات موردنیاز را سادهتر بازیابی کنند
کلمات کلیدی: موتورجستجو ، بازیابی اطلاعات ، شبه تکراری ، تشخیص تکراری ، روشهای رتبه بندی
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/404319/