互聯(lián)網(wǎng)金融企業(yè)多數(shù)為純線上服務(wù),與客戶沒有直接接觸,它收集客戶數(shù)據(jù)的來源主要分為如下幾類:
第一類是自身積累的數(shù)據(jù),這主要包括客戶在金融服務(wù)類網(wǎng)站的行為記錄,如電商的交易日志、支付的流水記錄,以及一切登錄瀏覽等行為;
第二類是通過各類線上線下的合作伙伴處獲取的數(shù)據(jù),如行業(yè)黑名單、法院審判結(jié)果、第三方信用評估等;
第三類是通過爬蟲從互聯(lián)網(wǎng)上采集的公開數(shù)據(jù),包括新聞、各種空間自媒體、微博;
第四類是客戶授權(quán)從其他系統(tǒng)獲得的數(shù)據(jù),如客戶的信用報(bào)告、聯(lián)系人、工資單、銀行流水、電商記錄、信用卡流水、通話記錄等。
這些信息單獨(dú)存在的價值都不大,但當(dāng)它們匯聚成海量信息,成為大數(shù)據(jù),經(jīng)過數(shù)據(jù)采集、清洗、分析、建模、機(jī)器學(xué)習(xí)等一系列步驟,就可以建立集中式大數(shù)據(jù)平臺提供服務(wù)。目前大數(shù)據(jù)在互聯(lián)網(wǎng)金融行業(yè)的應(yīng)用較為突出的領(lǐng)域有授信、風(fēng)控反欺詐、營銷、動態(tài)定價等。
(1)用戶畫像
無論是借錢還是投資,企業(yè)都需要深入了解客戶,包括收入水平、償還能力、消費(fèi)偏好、資產(chǎn)配置等,甚至還包括他的心理狀況、社會關(guān)系、所處行業(yè)的趨勢等。這些對于客戶投資借貸行為的預(yù)測都有著至關(guān)重要的意義。通過大數(shù)據(jù)分析,互聯(lián)網(wǎng)金融企業(yè)可以把客戶的屬性標(biāo)簽從幾十個擴(kuò)展到幾百甚至幾千個,從而360度無死角地描述一個客戶。
(2)快速授信
互聯(lián)網(wǎng)金融通過大數(shù)據(jù)等技術(shù)手段降低了征信成本和營銷成本,使更廣泛的人群也擁有了貸款/投資的機(jī)會,現(xiàn)在行業(yè)小額貸款的審批速度己經(jīng)普遍達(dá)到了十秒甚至秒級。
(3)風(fēng)控/反欺詐
互聯(lián)網(wǎng)在降低金融服務(wù)成本的同時,也給金融欺詐打開了方便之門。各種以“鉆補(bǔ)貼推廣空子"獲利的“羊毛黨”日益猖獗。身份偽造、惡意逾期等行為使互聯(lián)網(wǎng)金融行業(yè)損失數(shù)以十億元計(jì),每個企業(yè)都為如何堵漏洞發(fā)現(xiàn)欺詐絞盡腦汁。通過對用戶網(wǎng)絡(luò)行為、設(shè)備動態(tài)、平臺行為、交易行為,及整體行為的分析,可以形成一個用戶的行為數(shù)據(jù)圖譜。