نقدوبررسی روشهای یافتن اسنادمشابه بادرجه تشابه بالا

معصومه قاسمی ماه سایه; علی مهجور

نقدوبررسی روشهای یافتن اسنادمشابه بادرجه تشابه بالا

محل انتشار: اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 673

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/225556

شناسه ملی سند علمی:

BPJ01_291

تاریخ نمایه سازی: 29 دی 1392

چکیده مقاله:

مسائل مختلفی درزمینه داده کاوی ازمجموعه داده های عظیم مطرح است که یکی ازآنها یافتن عناصرمشابه است موارد مختلفی رادراین مسئله میتوان به عنوان عناصردرنظرگرفت یکی ازموارد مرتبط دراین زمینه بررسی برای یافتن اسنادمشابه بادرجه تشابه بالا می باشد یعنی هدف یافتن اسنادی می باشد که تقریبا یکسان هستند مسئله پیدا کردن اسنادمشابه رامیتوان به یک مسئله برپایه ی مجموعه تبدیل کرد که این کاردرقالب روش Shingling انجام میگیرد همچنین درادامه میتوان به کمک اعضای این مجموعه ها زابررسی تمامی جفت اسنادبرای یافتن اسنادمشابه خودداری کرد وفقط اسنادی را که با احتمال بیشتری مشابه هستند بررسی نمودازجمله میتوان به روش شاخص گذاری اشاره کرد که به این صورت عمل می کند ما دراین مقاله روشهای مختلف شاخص گذاری راباپیاده سازی و مورد بررسی قراردادیم این روشها شامل شاخص گذاری براساس پیشوند موقعیت و طول پسوند می باشند درواقع هدف اصلی مقاله ارزیابی این روشها و همچنین کمک به تصمیم گیری برای انتخاب بهترین روش باتوجه به فرضهای مسائل مختلف می باشد

کلیدواژه ها:

داده کاوی ، Shingling/شاخص گذاری پیشوند/شاخص گذاری موقعیت/شاخص گذاری طول پسوند

نویسندگان

معصومه قاسمی ماه سایه

کارشناسی ارشدکامپیوتر

علی مهجور

دکتری تخصصی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

S.Mitra, S.K.Pal and P.Mitra; "Data mining in soft computing framework: ...
_ Manber; "Finding similar files in a large file system", ...
S.Brin; "Near neighbor search _ large metric spaces, Department of ...
_ _ _ _ _ Similarity Team, 2008. ...
Rajaraman.A, D.Ullman.J; Mining of Massive Datasets, Cambridge Univ Pr, 2011. ...
Chaudhuri, S. and Ganti, V. and Kaushik, R., "A primitive ...
Xiao, C. and Wang, W. and Lin, X. and Yu, ...

نمایش کامل مراجع