Projede Kaggle üzerinde yayımlanan Realistic Loan Approval Dataset | US & Canada veri seti kullanılmıştır.
🔗 Veri Seti Bağlantısı:
https://www.kaggle.com/datasets/parthpatel2130/realistic-loan-approval-dataset-us-and-canada
Problem, ikili sınıflandırma (binary classification) problemi olarak ele alınmıştır.
Aşağıdaki veri ön işleme adımları RapidMiner Studio kullanılarak uygulanmıştır:
no_missing_attributes yöntemi ile eksik verilerin temizlenmesiÇalışma kapsamında aşağıdaki sınıflandırma algoritmaları uygulanmış ve karşılaştırılmıştır:
Karar ağacı tabanlı modellerde gain ratio bölünme kriteri kullanılmış; aşırı öğrenmenin önüne geçmek amacıyla pre-pruning ve post-pruning teknikleri uygulanmıştır.
Modellerin genellenebilirliğini değerlendirmek amacıyla 5-Katlı Çapraz Doğrulama (5-Fold Cross Validation) yöntemi kullanılmıştır.
| Model | Accuracy (%) |
|---|---|
| Decision Tree | 89.22 |
| Neural Network | 87.56 |
| Logistic Regression | 86.38 |
| Random Forest | 84.27 |
| Naive Bayes | 83.20 |
Deneysel sonuçlar, Decision Tree (Karar Ağacı) modelinin kredi skoru ve borç/gelir oranı gibi baskın finansal öznitelikleri açık ve yorumlanabilir karar kuralları ile modelleyebilmesi sayesinde en yüksek doğruluk oranına ulaştığını göstermektedir. Bu durum, karar ağaçlarını finansal karar destek sistemleri için oldukça uygun hâle getirmektedir.