بررسی کلی و مقایسهای ازمهمترین الگوریتمهای کاوش مجموعه اقلام تکرارشونده بسته از سال 1999 تا 2007

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,369

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC02_089

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

کاوش قوانین وابستگی که یکی از مهمترین روشهای دادهکاوی است، به کاوش وابستگیها و ارتباطات پنهان بین دادهها در پایگاهدادههای بزرگ میپردازد و مهمترین عمل در آن یافتن اقلام تکرارشونده است. اقلام تکرارشونده بسته یک روش خلاصه مهم برای اقلام تکرارشونده است که قدرت یکسانی با کاوش کامل مجموعه قلمهای تکرارشونده دارد، ضمن اینکه قوانین اضافی را کاهش داده و تأثیر کاوش را افزایش میدهد. در سالهای اخیر الگوریتمهای زیادی در این زمینه مطرح شده است که از استراتژیهای مختلفی مانند جستجوی اول عمقی در مقابل جستجوی اول سطحی، قالب عمودی در مقابل قالب افقی، ساختار درختی در مقابل دیگر ساختارها، پیمایش بالا به پایین در مقابل پیمایش پایین به بالا و غیره استفاده میکنند. در این مقاله مروری کلی و مقایسهای از مهمترین الگوریتمهای کاوش اقلام تکرارشونده بسته انجام میشود. نتایج آزمایشات نشان داده که هرکدام از این الگوریتمها با توجه به استراتژی به کاربرده، در پایگاهدادههای مختلف پراکنده و متراکم دارای یکسری نقاط ضعف و قدرت هستند؛ اما در بین آنها، الگوریتم DCI-Closed دارای کارایی بهتری نسبت به بقیه است .