بهبود دقت رده بندهای تشخیص تقلب روی مجموعه داده نامتوازن بیمه با استفاده از نمونه برداری ترکیبی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 647

فایل این مقاله در 11 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

BICO01_003

تاریخ نمایه سازی: 29 فروردین 1397

چکیده مقاله:

در سال های اخیر با افزایش حجم اطلاعات، استفاده از سیستم های هوشمند مانند داده کاوی جهت یافتن الگوهای پنهان تقلب در حجم وسیعی از داده ها، بیش ازپیش مورد توجه قرارگرفته است. از طرفی در بیشتر پرونده های خسارت بیمه، موارد تقلب درصد کمتری نسبت به موارد قانونی دارند؛ و پایگاه داده مدل های کشف تقلب مانند این پژوهش، نامتوازن است. ازاین رو در این تحقیق هدف، ساخت یک سیستم کشف تقلب روی مجموعه داده به شدت نامتوازن بیمه خودرو و افزایش نرخ دقت درست کلاس اقلیت (تقلب) است که اهمیت بیشتری دارد.در روش پیشنهادی فوق به دلیل بالابودن نرخ پرتی کلاس اکثریت، از دو تکنیک کانزدیکترین همسایه و عامل پرت محلی جهت توازن و حذف داده پرت استفاده شد؛ و در ادامه جهت کاهش ابعاد، روش آماری تحلیل مولفه های اصلی مورد استفاده قرار گرفت. سپس داده ها با رده بندهای مختلف مدلسازی شد؛ و در مقایسه، رده بند ماشین بردار پشتیبان که از ازدحام ذرات جهت بهینه سازی پارامترها استفاده می کند، با دقت 94.26% بهبود خوبی در معیار دقت کلاس مثبت داشت. این تحقیق لزوم استفاده از روش های موثر کاهش ابعاد در میان متغیرهای نامتوازن این مجموعه داده را به اثبات رساند. هم چنین تنظیم پارامترهای بردار پشتیبان با ازدحام ذرات، تاثیر بسزایی درافزایش دقت رده بندی داشت.

کلیدواژه ها:

تشخیص تقلب در بیمه ، داده نامتوازن ، تشخیص داده پرت ، ماشین بردار پشتیبان ازدحام ذرات ، تحلیل مولفه های اصلی

نویسندگان

میناسادات ربطی

کارشناس ارشد مهندسی کامپیوتر نرم افزار