互聯(lián)網金融的大數據風控是如何實現(xiàn)的
大數據目前能夠進行數據變現(xiàn)的商業(yè)模式目前就是兩個,一個是精準營銷,典型的場景是商品推薦和精準廣告投放,另外一個是大數據風控,典型的場景是互聯(lián)網金融的大數據風控。目前常用的互聯(lián)網金融大數據風控方式有以下幾種:
驗證借款人身份
驗證借款人身份的五因素認證是姓名、手機號、身份證號、銀行卡號、家庭地址。企業(yè)可以借助國政通的數據來驗證姓名、身份證號,借助銀聯(lián)數據來驗證銀行卡號和姓名,利用運營商數據來驗證手機號、姓名、身份證號、家庭住址。
如果借款人是欺詐用戶,這五個信息都可以買到。這個時候就需要進行人臉識別了,人臉識別等原理是調用國政通/公安局 API接口,將申請人實時拍攝的照片/視頻同客戶預留在公安的身份證進行識別,通過人臉識別技術驗證申請人是否是借款人本人。其他的驗證客戶的方式包括讓客戶出示其他銀行的信用卡及刷卡記錄,或者驗證客戶的學歷證書和身份認證。
分析提交的信息來識別欺詐
大部分的貸款申請都從線下移到了線上,特別是在互聯(lián)網金融領域,消費貸和學生貸都是以線上申請為主的。
線上申請時,申請人會按照貸款公司的要求填寫多維度信息例如戶籍地址,居住地址,工作單位,單位電話,單位名稱等。如果是欺詐用戶,其填寫的信息往往會出現(xiàn)一些規(guī)律,企業(yè)可根據異常填寫記錄來識別欺詐。如果企業(yè)發(fā)現(xiàn)一些重復的信息和電話號碼,申請人欺詐的可能性就會很高。
分析客戶線上申請行為來識別欺詐
欺詐用戶往往事先準備好用戶基本信息,在申請過程中,快速進行填寫,批量作業(yè),在多家網站進行申請,通過提高申請量來獲得更多的貸款。
企業(yè)可以借助于SDK或JS來采集申請人在各個環(huán)節(jié)的行為,計算客戶閱讀條款的時間,填寫信息的時間,申請貸款的時間等。例如,一般晚上11點以后申請貸款的申請人,欺詐比例和違約比例較高。
利用黑名單識別風險
互聯(lián)網金融公司面臨的主要風險為惡意欺詐,70%左右的信貸損失來源于申請人的惡意欺詐??蛻粲馄诨蛘哌`約貸款中至少有30%左右可以收回,另外的一些可以通過催收公司進行催收,M2逾期的回收率在20%左右。
黑名單來源于民間借貸、線上P2P、信用卡公司、小額借貸等公司的歷史違約用戶,其中很大一部分不再有借貸行為,參考價值有限。另外一個主要來源是催收公司,催收的成功率一般小于于30%(M3以上的),會產生很多黑名單。而現(xiàn)在央行和上海經信委正在聯(lián)合多家互聯(lián)網金融公司建立統(tǒng)一的黑名單平臺。
利用移動設備數據識別欺詐
行為數據中一個比較特殊的就是移動設備數據反欺詐,公司可以利用移動設備的位置信息來驗證客戶提交的工作地和生活地是否真實,另外來可以根據設備安裝的應用活躍來識別多頭借貸風險。
欺詐用戶一般會使用模擬器進行貸款申請,移動大數據可以識別出貸款人是否使用模擬器。欺詐用戶也有一些典型特征,例如很多設備聚集在一個區(qū)域,一起申請貸款。欺詐設備不安裝生活和工具用App,僅僅安裝和貸款有關的App,可能還安裝了一些密碼破譯軟件或者其他的惡意軟件。
欺詐用戶還有可能不停更換SIM卡和手機,利用SIM卡和手機綁定時間和頻次可以識別出部分欺詐用戶。另外欺詐用戶也會購買一些已經淘汰的手機,其機器上面的操作系統(tǒng)已經過時很久,所安裝的App版本都很舊。這些特征可以識別出一些欺詐用戶。
利用消費記錄來進行評分
大會數據風控除了可以識別出壞人,還可以評估貸款人的還款能力。過去傳統(tǒng)金融依據借款人的收入來判斷其還款能力,但是有些客戶擁有工資以外的收入,例如投資收入、顧問咨詢收入等。另外一些客戶可能從父母、伴侶、朋友那里獲得其他的財政支持,擁有較高的支付能力。
按照傳統(tǒng)金融的做法,在家不工作照顧家庭的主婦可能還款能力較弱。無法給其提供貸款,但是其丈夫收入很高,家庭日常支出由其太太做主。這種情況,就需要消費數據來證明其還款能力了。
常用的消費記錄由銀行卡消費、電商購物、公共事業(yè)費記錄、大宗商品消費等。還可以參考航空記錄、手機話費、特殊會員消費等方式。例如頭等艙乘坐次數,物業(yè)費高低、高爾夫球俱樂部消費,游艇俱樂部會員費用,奢侈品會員,豪車4S店消費記錄等消費數據可以作為其信用評分重要參考。
互聯(lián)網金融的主要客戶是小額借貸者,其電商消費記錄、旅游消費記錄、以及加油消費記錄都可以作為評估其信用的依據。有的互聯(lián)金融公司專門從事個人電商消費數據分析,只要客戶授權其登陸電商網站,其可以借助于工具將客戶歷史消費數據全部抓取并進行匯總和評分。
參考社會關系來評估信用情況
物以類聚,人與群分。一般情況下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低。
參考借款人常聯(lián)系的朋友信用評分可以評價借款人的信用情況,一般會采用經常打電話的朋友作為樣本,評估經常聯(lián)系的幾個人(不超過6六個人)的信用評分,去掉一個最高分,去掉一個最低分,取其中的平均值來判斷借款人的信用。
但是這種方式挑戰(zhàn)很大,只是依靠手機號碼來判斷個人信用可信度不高。一般僅僅用于反欺詐識別,利用其經常通話的手機號在黑名單庫里面進行匹配,如果命中,則此申請人的風險較高,需要進一步進行調查。
利用司法信息評估風險
涉毒涉賭以及涉嫌治安處罰的人,其信用情況不是太好,特別是涉賭和涉毒人員,這些人是高風險人群,一旦獲得貸款,其貸款用途不可控,貸款有可能不會得到償還。
尋找這些涉毒涉賭的嫌疑人,可以利用當地的公安數據,但是難度較大。也可以采用移動設備的位置信息來進行一定程度的識別。如果設備經常在半夜出現(xiàn)在賭博場所或賭博區(qū)域例如澳門,其申請人涉賭的風險就較高。
另外中國有些特定的地區(qū),當地的有一部分人群從事涉賭或涉賭行業(yè)。涉賭和涉毒的人員工作一般也不太穩(wěn)定或者沒有固定工作收入,如果申請人經常換工作或者經常在某一個階段沒有收入,這種情況需要引起重視。涉賭和涉毒的人活動規(guī)律比較特殊,經常半夜在外面活動,另外也經常住本地賓館,這些信息都可以參考移動大數據進行識別。
總之,互聯(lián)網金融的大數據風控采用了用戶社會行為和社會屬性數據,在一定程度上補充了傳統(tǒng)風控數據維度不足的缺點,能夠更加全面識別出欺詐客戶,評價客戶的風險水平?;ヂ?lián)網金融企業(yè)通過分析申請人的社會行為數據來控制信用風險,將資金借給合格貸款人,保證資金的安全。