Proyek R&D membangun sistem klasifikasi menggunakan algoritma C4.5 untuk menilai kelayakan permohonan KPR. Pipeline: data cleaning -> feature engineering -> C4.5 decision tree -> evaluasi (accuracy, precision, recall). Output dipaketkan dalam service yang dapat di-call oleh backend untuk memberikan rekomendasi awal.
Data tidak seimbang dan missing values pada kolom finansial.
Imputasi missing value, SMOTE untuk balancing, pruning pohon untuk menghindari overfitting, dan validasi silang k-fold.
Model mencapai performa yang memadai untuk screening awal dengan akurasi yang dapat ditingkatkan melalui data tambahan.
Check out our other amazing work