تشخیص بیمه گزار وفادار

پروژه دانشجویان ارشد نرم افزار (دانشگاه آل طه) - پایتون پیشرفته (دانشگاه الزهرا) - علم داده پاییز 97 (جهاد دانشگاهی شریف)

داده ها

در این مجموعه داده برای هر نمونه 11 ویژگی شامل ویژگی های مختلف بیمه گزار از جمله درصد پرداخت نقدی حق بیمه، سن بیمه گزار به روز، میزان درآمد بیمه گزار و ... وجود دارد که براساس آنها باید ویژگی دوازدهم یعنی تمدید یا عدم تمدید بیمه برای سال آینده را مشخص کرد، این متغیر گسسته دو مقداری است و با نام  renewal مشخص شده است. داده ها شامل مقادیر از دست رفته نیز می باشد.

 داده های موجود به شدت نامتوازن بوده و درصد افرادی که بیمه خود را تمدید نمی کنند بسیار کمتر از افرادی است که بیمه خود را تمدید می کنند.

فایل خروجی باید دارای یک ستون باشد که مشخص کننده مقدار متغیر هدف به ازای هر نمونه است. تعداد سطرهای فایل خروجی برابر با تعداد نمونه‌های مجموعه داده آزمایش است.

به عنوان مثال فایل خروجی باید به صورت زیر باشد.

1

1

0

1

1

ارزیابی خروجی‌ها با استفاده از معیار F-Measure صورت می‌گیرد.

* با توجه به اینکه کلاس 0 کلاس اقلیت و مهمتر می باشد، در محاسبه F-Measure این کلاس به عنوان کلاس مثبت در نظر گرفته شده است.

داده های آموزش

2.48 مگابایت
دانلود

داده های آزمایش

1.19 مگابایت
دانلود