資源簡介
本文分析了臺灣某銀行客戶的違約支付情況,提出了基于數據挖掘技術的預測客戶違約可能性。從風險管理的角度來看,預測的違約概率的準確性可以用來對可信的或不可信的客戶進行分類。
本文首先對數據集進行了初步處理,將數據拆分為2000個訓練集與1000個測試集。每個客戶信息中有23個自變量,根據其各個因素的相關性進行了調整然后使用了5挖掘方法,包括KNN,分類樹,隨機森林,Logistic回歸,神經網絡進行建模,比較這5種方法中違約概率的預測準確性。其中神經網絡的預測效果最好,預測準確率達到了83.3%;其次,分類樹(81.8%)和隨機森林(80.1%),然后是Logistic回歸(78.3%)。KNN的
代碼片段和文件信息
評論
共有 條評論