موتور جستجو بر پایه فناوری وب معنایی و استفاده از روش K نزدیک ترین همسایه برای رتبه بندی و طبقه بندی صفحات وب

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 731

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

DCBDP04_092

تاریخ نمایه سازی: 24 شهریور 1397

چکیده مقاله:

وب معنایی نسخه ی ارتقاء یافته ی وب کنونی است که اطلاعات موجود در آن دارای معانی تعریف شده ای هستند. در این مقاله یک الگوریتم پیشنهادی بر پایه فناوری وب معنایی ارایه شده است. روش پیشنهادی از دو بخش تشکیل شده است، بخش اول بیشتر شامل پیش پردازش صفحات وب و استخراج کلمات کلیدی و تشکیل بردار کلمات کلیدی برای هر یک از صفحات وب است و بخش دوم پردازش پرس و جوی کاربر و تبدیل آن به یک بردار کلمات کلیدی است. برای بررسی میزان شباهت معنایی کلمات پرس و جو کاربر و متن صفحات وب از دیکشنری WordNet استفاده شده است. در نهایت در روش پیشنهادی از روش K نزدیک ترین همسایه برای رتبه بندی و طبقه بندی صفحات و محاسبه فاصله کلمات پرس و جو و کلمات کلیدی استخراج شده از هر صفحه وب استفاده شد. برای ارزیابی الگوریتم پیشنهادی از مجموعه داده با 250 نمونه صفحه وب استفاده شد که نتایج نشان می دهد الگویتم پیشنهادی در و پرس و جو کلمات مرتبط با میانگین 81.6 درصد و در پرس و جو یک جمله با میانگین 71.20 و پرس و جو خود کلمات کلیدی با میانگین 91 درصد صحیح توانسته صفحات وب را براساس ارتباط معنایی رتبه بندی کند.

کلیدواژه ها:

موتور جستجو ، وب معنایی ، وب کاوی ، دیکشنری K ، WordNet نزدیک ترین همسایه

نویسندگان

هادی سعیدی فرد

دانشجوی کارشناسی ارشد نرم افزار، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران

امین بابازاده سنگر

استادیار، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران