classification درکلان داده

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,255

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF01_669

تاریخ نمایه سازی: 8 آذر 1394

چکیده مقاله:

امروزه فرایند استخراج اطلاعات معتبرناشناخته قابل فهم و قابل ا عتمادازمجموعه داده های بزرگ و استفاده ازان درتصمیم گیری و درفعالیت تجاری داده کاوی نامیده میشود همواره دررابطه با تحلیل و بررسی داده های باحجم بالا بامشکل طلسم ابعادوپیچیدگی پایگاه داده مواجه هستیم علم داده کاوی شامل کاربرد ابزاری برای تحلیل داده های مصنوعی و کشف الگوهای ناشناخته معتبر و روابط بین مجموعه های داده وسیع می باشد این ابزار ها میتواند شامل مدلهای اماری الگوریتم های ریاضی و روشهای یادگیری ماشین الگوریتم هایی که بطور خودکار اجرایشان را ازطریق تجربیات بهبود می بخشند ازقبیل شبکه های عصبی یا درختان تصمیم باشد استفاده ازاین الگوریتم ها درمباحث مختلف صنعتی مدییرتی مالی و مهندسی منجر به پیشرفت سازمان درتحلیل داده های وسیع شده است دراین مقاله نیز ابتدا به تعریفی ازکلاس بندی پرداخته و سپس برخی ازانواع الگوریتم های کلاس بندی ازجمله c4.5,bagging,decision tree,naive bays,random forest,svm بیان میشوند ازمیان آنها الگوریتم svm درحال حاضربطور گسترده ای برای مسائل دسته بندی مورداستفاده قرارمیگیرد که شایدبتوان محبوبیت کنونی ماشین بردارپشتیبان رابامحبوبیت شبکه عصبی دردهه گذشته مقایسه کرد و درنهایت به بیان خلاصه ای ازجریان کاری طبقه بندی داده درکلان داده بااستفاده ازابزار mahout پرداختیم

کلیدواژه ها:

نویسندگان

مریم بخشی

دانشجوی کارشناسی ارشدمهندسی فناوری اطلاعات دانشگاه علوم و تحقیقات تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :