-
大小: 389KB文件類型: .pdf金幣: 1下載: 0 次發布日期: 2021-07-18
- 語言: 其他
- 標簽: Clementine??
資源簡介
可視化數據挖掘應用實例一則——某銀行信貸規則評估
吳源林
(上海財經大學MBA 學院,上海 200083)
摘要:本文應用 Clementine 工具,通過對某銀行評估客戶信用申請的資料挖掘,展示
了數據挖掘中遇到的問題和解決思路。
關鍵詞:數據挖掘;決策樹;Clementine
數據挖掘是運用模式識別技術,以及統計和數
學知識,通過對大量的、不完全的、有噪聲的、模
糊的、隨機的數據集進行詳盡審查挖掘,以發現數
據中內在的關聯性、特征和趨勢。數據挖掘綜合了
多種學科技術,能提供數據分類、聚類、關聯和預
測等功能。
近年來,數據挖掘技術已經在
國外多行業中得到了普遍應用,尤
其在金融、電信、零售等領域。許
多企業紛紛利用數據挖掘技術作為
他們獲取競爭優勢的戰略工具,典
型的數據挖掘應用包括生產營運管
理、營銷管理和信用分析等。一些
軟件公司也推出了功能強大、用戶
友好的數據挖掘應用軟件,如SAS
公司的Data Miner,SPSS 公司的
Clementine,IBM Intelligent Miner
等,微軟公司在其客戶關系管理軟
件CRM3.0 中也集成了部分數據挖
掘功能。
目前國內不少企業也正在引進
和開始實施這些技術,以期提高其
決策管理能力和競爭優勢。但數據
挖掘不僅僅是一個技術運用問題,
其涉及到商務活動中的各個方面。
如果我們對所研究的問題和數據挖掘方法的認識不
夠深入的話,則很可能得到錯誤的信息,造成巨大
的經濟損失。
本文通過對日本某銀行審批客戶申請貸款的記
錄進行挖掘,展示數據挖掘中可能遇到的問題和解
決思路,并希望能起到拋磚引玉的作用。
數據挖掘功能的強大性,使其幾乎可以運用于
任何商業或科研領域,為了保障數據挖掘的質量和
有效性,SPSS 公司聯合幾大行業巨頭制定了“數據
挖掘跨行業標準流程”(CRISP-DM1)。我們下面的
挖掘過程也將嚴格按照該流程進行。為清晰展現整
個數據挖掘流程, 我們使用了SPSS 公司的
Clementine 工具。該工具使用節點連接的方式建立
模型,能讓我們直觀了解建模過程,并把注意力集
中在具體問題的分析上。
一、商業理解,亦即研究理解階段
這一階段把項目的目標和要求用清晰的,并把
這些目標和制約條件轉化成數據挖掘問題的定義,
形成一個初步實現目標的策略;
在本例中,我們的目標是要找出銀行批準或否
代碼片段和文件信息
- 上一篇:flex for linux
- 下一篇:匯編語言貪吃蛇、俄羅斯方塊雙任務設計代碼
評論
共有 條評論