Kerangka Prediksi Default Dengan Set Fitur Optimal dan Rasio Pencocokan

Kerangka Prediksi Default Dengan Set Fitur Optimal dan Rasio Pencocokan

ABSTRAK
Kami mengusulkan kerangka kerja prediksi baku yang menggabungkan penanganan ketidakseimbangan dan pemilihan fitur. Untuk penanganan ketidakseimbangan, kami menentukan rasio optimal perusahaan non-baku bayar terhadap perusahaan gagal bayar dengan meminimalkan kesalahan Tipe-II dari model jaringan terhubung penuh dalam dengan suara mayoritas (MV-DFCN). Untuk pemilihan fitur, kami merancang proses dua tahap yang pertama-tama menghilangkan fitur yang sangat berkorelasi dan berlebihan, lalu menyempurnakan set fitur menggunakan pemilihan mundur. Hasil eksperimen menunjukkan bahwa model DFCN dalam kerangka kerja yang diusulkan mengungguli model dasar dalam hal G-Mean dan AUC serta mencapai tingkat kesalahan Tipe-II terendah. Lebih jauh, kerangka kerja tersebut mengungguli delapan kombinasi dasar dari penanganan ketidakseimbangan dan strategi pemilihan fitur. Selain itu, nilai SHAP digunakan untuk menilai kontribusi fitur, dan sembilan fitur dengan dampak signifikan secara statistik diidentifikasi.

Leave a Reply

Your email address will not be published. Required fields are marked *