اهمیت ترکیب روش های آماری و علوم رایانه ای در تحلیل داده های بزرگ

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 405

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCONFC01_054

تاریخ نمایه سازی: 13 مهر 1397

چکیده مقاله:

در دنیای پیشرفته ی امروزی، هر روز حجم بی سابقه ای از اطلاعات به طور مداوم و در اکثر زمینه ها ایجاد می شد. در بررسی این اطلاعات عظیم یا همان داده های بزرگ دو موضوع اولیه مطرح می گردد. یکی جمع آوری و ذخیره سازی داده ها می باشد و دیگری تجزیه و تحلیل داده ها است. توانایی در تجزیه و تحلیل و درک مجموعه ی داده های انبوه نسبت به توانایی در جمع آوری و ذخیره سازی داده ها از اهمیت بیشتری برخوردار است. توانایی در تفسیر و استفاده از تمامی این اطلاعات مزایای اقتصادی و اجتماعی در برداشته و سبب پیشرفت هایی در زمینه های مختلف و بهبود کیفیت خواهد شد. روش های تحلیل داده های بزرگ، روش های ترکیبی است که با کمک آمار و سایر رشته های وابسته به آن مانند داده کاوی، یادگیری ماشین، شبکه های عصبی، تحلیل شبکه های اجتماعی، پردازش سیگنال، تشخیص الگو، روش های بهینه سازی و تجسم رویکردها به راحتی اطلاعات نهفته ی مجموعه ای بسیار بزرگ از داده ها به دست آورده می شود. این روش ها، الگوها و تکنیک های متفاوتی از جمله رگرسیون، سری زمانیف ماشین های بردار پشتیبان، درخت تصمیم و ... هستند که هریک به فراخورد داده ها و کارایی مورد نظر باید انتخاب شوند. در این مقاله ضمن معرفی داده های بزرگ و ویژگی های آن روش های تحلیل این داده ها معرفی می گردد. در مثالی از تحقیق چانگ (2004)، مربوط به زایمان مادران، اهمیت و ترکیب روش های آماری (مدل سازی لگاریتم خطی) و نظریه یادگیری از علوم رایانه ای (درخت رده بندی رگرسیونی) برای دستیابی به اطلاعات بیشتر و کامل تر از یک مجموعه داده ی بزرگ تایید می گردد.

کلیدواژه ها:

داده بزرگ ، مدل سازی الگوریتم خطی ، نظریه یادگیری ، درخت رده بندی رگرسیونی

نویسندگان

آسیه ابطحی

استادیار