دسته بندی داده های بزرگ با استفاده از الگوریتم جنگل تصادفی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 420

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECHSD04_036

تاریخ نمایه سازی: 31 تیر 1398

چکیده مقاله:

امروزه فرایند استخراج اطلاعات معتبر ناشناخته، قابل فهم و قابل اعتماد از مجموعه داده های بزرگ و استفاده از آن در تصمیم گیری ودر فعالیت های تجاری بیشتر از گذشته احساس می شود. از این رو لازم برای تحلیل داده ها مصنوعی و کشف الگوی نا شناخته معتبر و روابط بین مجموعه های داده وسیع می باش. این ابزار ها می تواند شامل مدل های آماری و الگوریتم های ریاضی و روش یادگیری ماشین باشد. با استفاده از این الگوریتم ها در مباحث مختلف صنعتی ، مدیریتی ،مالی ، مهندسی منجر به پیشرفت سازمان ها در تحلیل داده های وسیع شده است و با توجه به هدف اصلی طبقه بدی داده ها رسیدن به صحت بالاست و یکی از متدها برای رسیدن به این هد استفاده از یادگیری تلفیقی است . جنگل تصادفی به عنوان درخت تصمیم تلفیقی محسوب می شودو کارایی خوبی هم در طبقه بندی داده ها کلان دارد. طبقه بندی مجموعه داده های نامتعادل چالشی را برای اکثر تکنیک های یادگیری استاندارد به وجود آورده است و الوریتم جنگل تصادفی هم تحت تاثیر منفی توزیع کلاس نا متعادل قرار گرفته است ودر نهایت کار طبقه بندی این داده ها را به کمک الگوریتم جنگل تصادفی انجام داده ایم.

نویسندگان

بهمن فرجی فیجانی

دانشگاه آزاد اسلامی واحد ساوه ، ساوه

مریم رستگارپور

دانشگاه آزاد اسلامی واحد ساوه ، ساوه