機器學習能否助力銀行挖掘更多客戶價值?
機器學習(Marchine Learning)聽起來比較復雜,很有未來感,但其實它的工作原理很簡單。簡單來說,機器學習就是結合大量類似於決策樹的決策模型,來創建壹個更加精確的模型。通過快速地對這些決策模型進行叠代訓練,機器學習能夠找到“隱藏”的最優解,特別是在統計模型中經常遺漏的非結構化數據方面。
銀行投資組合中經常會出現長尾數據,相對於傳統的統計方法,機器學習對長尾數據的解釋力更強。考慮到那些個體投資較少但總體數量龐大的客戶,我們通常對這壹群體的客戶知之甚少,並且他們也是相當被動的接受銀行業務。但是,機器學習能夠對這類客戶的行為進行很好的分析,從而指導業務人員有針對性的挖掘潛在的盈利目標。
舉壹個機器學習在銀行業信用卡產品線中實際應用的案例,該銀行的目標是針對每個客戶尋求最優的信用額度,簡單來說就是他們希望知道能夠在哪些方面增加或減少信用額度。現有統計模型雖然已經具有了相當可觀的預測能力,但當利用機器學習方法去重新訓練與之相同的數據集,並在訓練時添加壹些諸如政策規定等非結構化數據時,模型的預測能力直接提高了1.6倍。這種改進能夠從基於現有模型中風險較低的客戶手中獲得顯著收益,由此會導致信用額度下降,並且會避免因為信用額度增加而導致的額外損失。
那麽,是什麽導致了銀行業並沒有更廣泛地采用機器學習方法呢?通常來說,有以下三個方面的問題:首先,變量規模的擴大會使得當前的銀行系統需要更多的資金進行研發和維護;其次,機器學習中許多模型都是壹個黑盒子,以至於造成了預測結果的不可解釋性,這嚴重觸犯了銀行業的穩定規範;最後,機器學習準確性的檢驗比較復雜,因此使用機器學習方法在驗證環節具有壹定的挑戰。
盡管機器學習方法具有諸如此類的問題,但也有壹些切實可行的辦法來弱化這些問題。例如,直接使用現有所有可用的變量開始建模,根據每個變量對模型的貢獻率快速地進行篩選,從而在不影響模型預測精度的前提下,留下壹批可受控制的變量;或者是減少機器學習模型中的壹些“分支”,從而獲得壹組核心的線性規則,這些規則所使用的變量更少,但同時還保留了原模型80%以上的預測能力。
關於銀行業是否能夠用更復雜的機器學習模型來獲取更多的價值?這個答案是肯定的,並且也是未來銀行業發展的壹個趨勢。據中金數據業務中心數據分析師劉總介紹“機器學習通過利用銀行業現有模型所忽略的大量的“小”數據,加上內外部監管系統中常見的非結構化數據,從而能夠更深入的了解潛在客戶需求,幫助銀行挖掘更多的客戶價值。”