داده ها
دادههای آموزش شامل ۱۴ ویژگی است. در این دادهها ویژگی هدف label نام دارد که گسسته دو مقداره است. سایر ویژگیها ترکیبی از متغیرهای گسسته و پیوسته هستند. همچنین این مجموعه داده، داده مفقودی دارد.
فایل خروجی باید دارای یک ستون باشد که در هر سطر آن متغیر هدف به ازای هر نمونه مشخص شده باشد. تعداد سطرهای فایل خروجی به تعداد نمونههای مجموعه داده آزمایش است.
به عنوان مثال فایل خروجی باید به صورت زیر باشد.
0
1
0
0
0
ارزیابی خروجیها با استفاده از معیار weighted mean recall صورت میگیرد. وزن تشخیص هر نمونه سالم 0.35 و هر نمونه بیمار 0.65 است. در واقع اگر کلاس مثبت را کلاس افراد سالم در نظر بگیریم ارزیابی به صورت زیر انجام خواهد شد:
0.35 * (TP / (TP+FN)) + 0.65 * (TN / (TN+FP))