بررسی کلی و مقایسهای ازمهمترین الگوریتمهای کاوش مجموعه اقلام تکرارشونده بسته از سال 1999 تا 2007
محل انتشار: دومین کنفرانس داده کاوی ایران
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,369
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC02_089
تاریخ نمایه سازی: 14 فروردین 1388
چکیده مقاله:
کاوش قوانین وابستگی که یکی از مهمترین روشهای دادهکاوی است، به کاوش وابستگیها و ارتباطات پنهان بین دادهها در پایگاهدادههای بزرگ میپردازد و مهمترین عمل در آن یافتن اقلام تکرارشونده است. اقلام تکرارشونده بسته یک روش خلاصه مهم برای اقلام تکرارشونده است که قدرت یکسانی با کاوش کامل مجموعه قلمهای تکرارشونده دارد، ضمن اینکه قوانین اضافی را کاهش داده و تأثیر کاوش را افزایش میدهد. در سالهای اخیر الگوریتمهای زیادی در این زمینه مطرح شده است که از استراتژیهای مختلفی مانند جستجوی اول عمقی در مقابل جستجوی اول سطحی، قالب عمودی در مقابل قالب افقی، ساختار درختی در مقابل دیگر ساختارها، پیمایش بالا به پایین در مقابل پیمایش پایین به بالا و غیره استفاده میکنند. در این مقاله مروری کلی و مقایسهای از مهمترین الگوریتمهای کاوش اقلام تکرارشونده بسته انجام میشود. نتایج آزمایشات نشان داده که هرکدام از این الگوریتمها با
توجه به استراتژی به کاربرده، در پایگاهدادههای مختلف پراکنده و متراکم دارای یکسری نقاط ضعف و قدرت هستند؛ اما در بین آنها، الگوریتم DCI-Closed دارای کارایی بهتری نسبت به بقیه است .
کلیدواژه ها: