بررسی تعارض بین نرمال سازی و داده کاوی و ارائه روش های رفع آن

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,455

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCOS02_045

تاریخ نمایه سازی: 5 مهر 1393

چکیده مقاله:

پس از مروری اجمالی بر مفاهیم نرما لسازی و داده کاوی، تعارض جدی بین این دو مفهوم نشان داده شده است ، که با توجه به کاربرد وسیع نرمال سازی و اهمیت داده کاوی در دنیای امروز، نیازمند راه حل هایی است. تعارض مطرح شده که ناشی از طبیعت نرمال سازی است، باعث ایجاد نتایج نادرست در داده کاوی و تحلیل داده ها می شود. در ادامه برای رفع این تعارض، به بررسی denormalization عدم نرمال سازی ، NO - SQL و تغییر آرام ابعاد یا SCD عنوان راه حلی در این موضوع، پرداخته شده است. Denormalization به نوعی برگرداندن عمل نرمال سازی است و در آن الحاق کلیه جداول تقسیم شده دنبال می شود . این کار در داده کاوی و data warehouse نیز، انجام میشود. ولی راه حل کاملی برای تعارض مطرح شده نیست. عدم نرمال سازی مشکل را حل می کند. ولی مانع از بهره بردن از مزایای نرمال سازی م یشود و در مواردی خاص کاربردی است NO SQL، پایگاه داده جدید غیررابطه ای است که از ارزش- کلید جهت ذخیره و بازیابی عناصر در پایگاه داده استفاده م یکند. این پایگاه داده غیر رابط های، توزیع شده، مقیاس پذیر افقی و باز است و برای کاربردهای گسترده و توزیع شده کاربرد دارد. هم چنین این پایگاه دارای ویژگی های بدون شما بودن، پشتیبانی آسان از تکرار APIساده، داده های خیلی زیاد و در نهایت سازگار است. در روش SCD همگام با تغییر داده ها، سابقه ای از آنها نیز به طور محدود یا نامحدود و با تبعیت از قوانین مشخص، بسته به انواع SCD نگهداری میشود. این کار باعث می شود حتی با وجود نرمال سازی، داده کاوی صحیحی داشته باشیم

نویسندگان

فاطمه شکرآرا

دانشکده برق و کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران

حمزه ابراهیمی

دانشکده برق و کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران

روح اله شکرآرا

دانشکده برق و کامپیوتر، دانشگاه آزاد نجف آباد، اصفهان، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مید محمد تقی روحانی اکوهی، مفاهیم بنیادی پایگاه داده‌ها، چاپ ...
  • فرصتها و چالشهای دادهکاوی در شهر الکترونیکی [مقاله کنفرانسی]
  • معاونت آموزشی، پژوهشی و فرهنگی سازمان سما دانشکده فنی و ...
  • http ://www .wikipedia.org ...
  • Potomac, INTR ODUCTION TO DATA MINING AND KN OWLEDGE DISCOVERY. ...
  • G. L. Sanders, S. K. Shin., _ :Denormal ization effects ...
  • David G. Sullivan, "Data Mining IV: Preparing the Data", Computer ...
  • S. K. Shin, G. L. Sanders, _ _ Denormalization strategies ...
  • J. Singh, B. Singh, Y. Sriveni, _ Convenient Way From ...
  • Christof Strauch, "NoSQL Databases", Lecture on Selected _ ftware-Technolog! _ ...
  • http://www. 10gen.com/nosql ...
  • http ://no sql-database.org ...
  • نمایش کامل مراجع