شناسایی ریسک مشتریان بیمه با استفاده از یادگیری تجمعی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 530

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECHSD04_040

تاریخ نمایه سازی: 31 تیر 1398

چکیده مقاله:

امروزه در جهت بهبود و پیشرفت صنعت بیمه باید مسائلی را ورای موارد گذشته در نظر گرفت ، مسائلی که با استفاده از ویژگیهای آن سمت و سوی اهداف یک مشتری را مشخص می کند. یکی از مهمترین این موارد که سر شاخه بسیاری از ویژگیهاست ریسک نامیده می شود. شرکت های بیمه با شناسایی میزان ریسک مشتریان می توانند آنها را با استفاده از علم داده کاوی دسته بندی کرده و دانش لازم جهت بهبود فعالیت خود را از بین اطلاعات حجیم آن استخراج نمایند. اهمیت این دانش رجوع بیشتر مشتریان به دلیل شرایط متناسب با ریسک آنها و بالا رفتن تعداد بیمه شوندگان در شرکتهای بیمه می باشد. لازم بذکر است در زمینه داده کاوی مطالعات زیادی روی مدلهای آماری همچنین روشهای یادگیری ماشین ( الگوریتمهایی که به صورت خودکار اجرایشان را از طریق تجربیات بهبود می بخشند از قبیل شبکه عصبی ، درخت تصمیم و...)صورت گرفته است که همگی به صورت منفرد عمل می کنند. در این پایان نامه الگوریتم شناسایی ریسک مشتریان بیمه با استفاده از یادگیری تجمعی با استفاده از داده های شرکت بیمه ماشین های کاروان ارائه شده که در ابتدا سعی در شناسایی داده های نامتوازن (داده های اکثریت و اقلیت) و نحوه برخورد با داده های اقلیت و همچنین تعیین تعداد طبقه بندی پایه منظور ساخت کلاس متوازن مطرح شده است که مسئله نامتوازن بودن داده ها تا حدود زیادی حل می گردد و همچنین به منظور دسته بندی جدیدی مجموعه داده بر مبنای الگوریتم جنگل تصادفی، برداری از صفات خاصه داده ها به صورت تصادفی بر اساس یکی از صفات خاصه ،درختان تصمیم ،جنگل تصادفی را ایجاد میکند. براساس امتیاز مبنای هر جنگل ، درخت هایی که حداقل امتیاز مبنا را بدست آورده باشند وارد مرحله دوم شده مجددا0و براساس امتیازهای درختهای جنگل مرحله دوم امتیاز مبنای جدیدی بدست آمده و درختهایی که امتیازشان کمتر از امتیاز مبناست از جنگل حذف می شوند. براساس ارزیابی های انجام شده با الگوریتم بهبود یافته جنگل تصادفی با حفظ سرعت دقت نیز افزایش یافته است. همچنین با توجه به نتیجه نمودارهای ROC ، ریسکهای مشتریان شرکت بیمه با دقت %96 پیش بینی شده است.

کلیدواژه ها:

جنگل تصادفی_ داده های نامتوازن – درخت تصمیم – امتیاز – ریسک- بیمه

نویسندگان

بهمن فرجی فیجانی

دانشگاه آزاد اسلامی واحد ساوه ، ساوه

مریم رستگارپور

دانشگاه آزاد اسلامی واحد ساوه ، ساوه