استفاده از مجموعه اقلام پرتکرار در بهبود الگوریتم SPAM

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 735

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIKT08_060

تاریخ نمایه سازی: 5 بهمن 1395

چکیده مقاله:

کشف توالی های پرتکرار یکی از وظایف مهم داده کاوی است که دارای کاربردهای فراوانی است.الگوریتم های ارائه شده برای این مسئله بهسه دسته تقسیم می شوند. رویکرد مبتنی بر Apriori ، رویکرد عمودی و رویکرد مبتنی بر توسعه الگو. از بین این روشها، روشهایعمودی در مجموعه داده هایی با توالی های طولانی و با چگالی بالاتر کاراتر می باشند. در الگوریتمهای عمودی، از روش تولید توالی هایکاندید و چک کردن تعداد تکرارشان استفاده می شود که برای مجموعه داده های بزرگ زمانبر است.دراین مقاله روشی پیشنهاد شده است که هدفش هرس نمودن الگوهای کاندید، قبل از محاسبه تعداد تکرارشان است. مطابق خاصیتApriori تمام مجموعه آیتم های موجود در یک توالی پرتکرار، خود پرتکرار هستند؛ بنابراین در روش پیشنهادی، از مجموعه آیتم هایپرتکرار برای هرس کردن توالی های کاندید استفاده شده است. به عبار دیگر، اگر یک توالی کاندید، دارای مجموعه آیتمی باشد که عضومجموعه آیتم های پرتکرار نباشد آنگاه به طور حتم پرتکرار نیست و نیاز به اشتراک گیری و محاسبه تعداد تکرارش نخواهد بود. بنابراینابتدا به کمک روش FP-growth تمامی مجموعه اقلام پرتکرار ساخته می شود؛ سپس از این مجموعه ها، در مرحله هرس کردن استفادهمی شود. آزمایش های انجام شده بر روی مجموعه داده های مصنوعی نشان داد الگوریتم پیشنهادی توانسته است تا حد زیادی الگوهای کاندیدرا هرس نماید.

نویسندگان

آزاده سلطانی

دانشگاه بجنورد، گروه مهندسی کامپیوتر

محمود سلطانی

دانشگاه مهندسی فناوری های نوین قوچان، گروه مهندسی کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • R. Agrawal and R. Srikant, "Mining sequential patterns, " Taipei, ...
  • M. J. Zaki, :SPADE: An Efficient Algorithm for Mining Frequent ...
  • J. Pei, J. Han, B. Mortazavi-Asl, J. Wang, H. Pinto, ...
  • X. Yan, J. Han, and R. Afshar, "CloSpan: Mining closed ...
  • A. Gomariz, M. Campos, R. Marin, and B. Goethals, "Clasp: ...
  • R. Srikant and R. Agrawal, Mining sequential and performance ...
  • improvements. Springer, 1996. ...
  • Advances in Databases Concepts, Systems and [7] J. Ayres, J. ...
  • P. Fournier-Viger _ A. Gomariz, M. Campos, and R. Thomas, ...
  • R. Agrawal, R. Srikant, and others, _ algorithms for mining ...
  • Z. Yang, Y. Wang, and M. Kitsuregawa, :LAPIN: effective sequential ...
  • Applications, Springer, 2007, p. 1020-1023. [1]P. Fourrier-Viger _ A. Gomariz, ...
  • نمایش کامل مراجع