نقدوبررسی روشهای یافتن اسنادمشابه بادرجه تشابه بالا
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 645
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_291
تاریخ نمایه سازی: 29 دی 1392
چکیده مقاله:
مسائل مختلفی درزمینه داده کاوی ازمجموعه داده های عظیم مطرح است که یکی ازآنها یافتن عناصرمشابه است موارد مختلفی رادراین مسئله میتوان به عنوان عناصردرنظرگرفت یکی ازموارد مرتبط دراین زمینه بررسی برای یافتن اسنادمشابه بادرجه تشابه بالا می باشد یعنی هدف یافتن اسنادی می باشد که تقریبا یکسان هستند مسئله پیدا کردن اسنادمشابه رامیتوان به یک مسئله برپایه ی مجموعه تبدیل کرد که این کاردرقالب روش Shingling انجام میگیرد همچنین درادامه میتوان به کمک اعضای این مجموعه ها زابررسی تمامی جفت اسنادبرای یافتن اسنادمشابه خودداری کرد وفقط اسنادی را که با احتمال بیشتری مشابه هستند بررسی نمودازجمله میتوان به روش شاخص گذاری اشاره کرد که به این صورت عمل می کند ما دراین مقاله روشهای مختلف شاخص گذاری راباپیاده سازی و مورد بررسی قراردادیم این روشها شامل شاخص گذاری براساس پیشوند موقعیت و طول پسوند می باشند درواقع هدف اصلی مقاله ارزیابی این روشها و همچنین کمک به تصمیم گیری برای انتخاب بهترین روش باتوجه به فرضهای مسائل مختلف می باشد
کلیدواژه ها:
داده کاوی ، Shingling/شاخص گذاری پیشوند/شاخص گذاری موقعیت/شاخص گذاری طول پسوند
نویسندگان
معصومه قاسمی ماه سایه
کارشناسی ارشدکامپیوتر
علی مهجور
دکتری تخصصی
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :