CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی ریسک مشتریان بیمه با استفاده از یادگیری تجمعی

عنوان مقاله: شناسایی ریسک مشتریان بیمه با استفاده از یادگیری تجمعی
شناسه ملی مقاله: TECHSD04_040
منتشر شده در چهارمین همایش بین المللی علوم و تکنولوژی با رویکرد توسعه پایدار در سال 1397
مشخصات نویسندگان مقاله:

بهمن فرجی فیجانی - دانشگاه آزاد اسلامی واحد ساوه ، ساوه
مریم رستگارپور - دانشگاه آزاد اسلامی واحد ساوه ، ساوه

خلاصه مقاله:
امروزه در جهت بهبود و پیشرفت صنعت بیمه باید مسائلی را ورای موارد گذشته در نظر گرفت ، مسائلی که با استفاده از ویژگیهای آن سمت و سوی اهداف یک مشتری را مشخص می کند. یکی از مهمترین این موارد که سر شاخه بسیاری از ویژگیهاست ریسک نامیده می شود. شرکت های بیمه با شناسایی میزان ریسک مشتریان می توانند آنها را با استفاده از علم داده کاوی دسته بندی کرده و دانش لازم جهت بهبود فعالیت خود را از بین اطلاعات حجیم آن استخراج نمایند. اهمیت این دانش رجوع بیشتر مشتریان به دلیل شرایط متناسب با ریسک آنها و بالا رفتن تعداد بیمه شوندگان در شرکتهای بیمه می باشد. لازم بذکر است در زمینه داده کاوی مطالعات زیادی روی مدلهای آماری همچنین روشهای یادگیری ماشین ( الگوریتمهایی که به صورت خودکار اجرایشان را از طریق تجربیات بهبود می بخشند از قبیل شبکه عصبی ، درخت تصمیم و...)صورت گرفته است که همگی به صورت منفرد عمل می کنند. در این پایان نامه الگوریتم شناسایی ریسک مشتریان بیمه با استفاده از یادگیری تجمعی با استفاده از داده های شرکت بیمه ماشین های کاروان ارائه شده که در ابتدا سعی در شناسایی داده های نامتوازن (داده های اکثریت و اقلیت) و نحوه برخورد با داده های اقلیت و همچنین تعیین تعداد طبقه بندی پایه منظور ساخت کلاس متوازن مطرح شده است که مسئله نامتوازن بودن داده ها تا حدود زیادی حل می گردد و همچنین به منظور دسته بندی جدیدی مجموعه داده بر مبنای الگوریتم جنگل تصادفی، برداری از صفات خاصه داده ها به صورت تصادفی بر اساس یکی از صفات خاصه ،درختان تصمیم ،جنگل تصادفی را ایجاد میکند. براساس امتیاز مبنای هر جنگل ، درخت هایی که حداقل امتیاز مبنا را بدست آورده باشند وارد مرحله دوم شده مجددا0و براساس امتیازهای درختهای جنگل مرحله دوم امتیاز مبنای جدیدی بدست آمده و درختهایی که امتیازشان کمتر از امتیاز مبناست از جنگل حذف می شوند. براساس ارزیابی های انجام شده با الگوریتم بهبود یافته جنگل تصادفی با حفظ سرعت دقت نیز افزایش یافته است. همچنین با توجه به نتیجه نمودارهای ROC ، ریسکهای مشتریان شرکت بیمه با دقت %96 پیش بینی شده است.

کلمات کلیدی:
جنگل تصادفی_ داده های نامتوازن – درخت تصمیم – امتیاز – ریسک- بیمه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/900537/