نقش الگوریتم سنجش شباهت های معنایی کلمه در وب برای بهبود کارآیی و سرعت بخشیدن به عملکرد موتور جستجو

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 896

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEIT01_426

تاریخ نمایه سازی: 9 تیر 1393

چکیده مقاله:

سنجش تشابه معنایی کلمات در وب، از اقدامات مهمی است که امروزه برای سرعت بخشیدن به فعالیت های کاربران از سوی محقق ها مورد بررسی قرار می گیرند. با وجود فواید زیادی که این فعالیت به همراه دارد، اما دقت در سنجش تشابه معنایی کلمه ها همچنان اقدامی چالش انگیز است. اخیراً الگوریتم ها ی گوناگونی در این زمینه در نظر گرفته شده که در این مقاله الگوریتم های برآورد تشابه معنایی، براساس دو شیوه شمارش صفحه و قطعه بندی متن، محاسبه شده و کلمه های مختلف به طور خاص با استفاده از معیار رخداد مشترک شمارش صفحه، تعریف می شوند، سپس الگوهای واژگانی قطعه بندی متن استخراج شده یکپارچه سازی می شود، سپس برای شناسایی روابط متعدد معنایی بین دو کلمه با توجه به الگوریتم استخراج الگوی متن و الگوی الگوریتم بهینه خوشه بندی ترکیبی براساس شمارش صفحه مبتنی بر رخداد مشترک ظاهر می شود و الگوی خوشه بندی واژگان حاصل شده توسط ماشین های بردار پشتیبانی حمایت می شود. نتایج مختلف و روش های مبتنی بر معیارهای شباهت معنایی وب در گذشته، در سه مجموعه داده معیار با همبستگی بالا، براساس امتیازهای کاربران نشان داده شده است، بطور قابل توجهی دقت و صحت در جستجو را بهبود می دهد.

نویسندگان

حمیده رستم تاش

دانشجوی کارشناسی ارد نرم افزار، علوم و تحقیقات گیلان