چهارمين كنفرانس بين المللي مديريت فناوري اطلاعات و ارتباطات (1386)

 

ارائه تكنيكي كارآ به منظور آماده سازي داده ها در فرايند داده كاوي

نويسنده:
مهدي اسماعيلي - عضو هيئت علمي دانشگاه آزاد اسلامي واحد كاشان

خلاصه مقاله:

مدل هاي داده اي پيشرفته و روش هاي بهينه ساز پرس و جو از پيشرفت هاي چشمگير در پايگاه داده ها به شمار مي رود. اما اين تمام خواسته هاي يك كاربر نيست. فرايند كشف و استخراج دانش از اين داده هاي ذخيره شده بخشي از سيستم هاي اطلاعاتي نسل جديد است. معرفي مسئله، پيش پردازش و آماده سازي داده ها، اجراي الگوريتم هاي داده كاوي و در نهايت ارائه الگوهاي مناسب مراحل فرايند مذكور را تشكيل مي دهد. داده هاي بدون نقص الگوهاي مناسبي را براي كاربر توليد مي كنند اما داده هاي دنياي واقعي ناقص و نادرست هستند. از آنجا كه سيستم هاي استخراج دانش به داده هايي با كيفيت بالا و ترجيحا كم حجم نياز دارند بنابراين، آماده سازي داده ها مي تواند يكي از گامهاي بنيادي در تحليل داده ها باشد. جمع اوري و تغيير شكل داده ها، پالايش داده ها و همچنين كاهش اندازه داده ها از جمله تكنيك هايي هستند كه در مرحله آماده سازي داده ها مطرح يم شوند. براي هر يك از اين تكنيك ها الگوريتم هاي متعددي وجود دارد كه هر يك از انها داراي مزايا و معايب وهمچنين كاربرد خاصي هستند. در اين مقاله يك روش براي كاهش داده ها به منظور اماده سازي داده ها جهت داده كاوي ارائه مي شود كه مبتني بر نمونه گيري از داده هاست. در اين روش مزاياي همچون دقت و سرعت قابل قبول با نمونه گيري مناسب بدست مي آيد.

 

كلمات كليدي:

آماده سازي داده ها ، پيش پردازش داده ها ، داده كاوي ، كاهش داده ها


دریافت اصل مقاله: http://www.civilica.com/Paper-ICTM04-ICTM04_008.html