① 如何構建銀行業大數據分析平台
一是銀行與電商平台形成戰略合作。銀行業共享小微企業在電商平台上的經營數據和經營者的個人信息,由電商平台向銀行推薦有貸款意向的優質企業,銀行通過交易流水、買賣雙方評價等信息,確定企業資信水平,給予授信額度。建設銀行曾在這方面做過有益的嘗試。此外也有銀行參股電商、開展數據合作的案例。
二是銀行自主搭建電商平台。銀行自建電商平台,獲得數據資源的獨立話語權。在為客戶提供增值服務的同時,獲得客戶的動態商業信息,為發展小微信貸奠定基礎,是銀行搭建電商平台的驅動力。2012年,建設銀行率先上線「善融商務」,提供B2B和B2C客戶操作模式,涵蓋商品批發、商品零售、房屋交易等領域,為客戶提供信息發布、交易撮合、社區服務、在線財務管理、在線客服等配套服務,提供的金融服務已從支付結算、託管、擔保擴展到對商戶和消費者線上融資服務的全過程。
三是銀行建立第三方數據分析中介,專門挖掘金融數據。例如,有的銀行將其與電商平台一對一的合作擴展為「三方合作」,在銀行與電商之間,加入第三方公司來負責數據的對接,為銀行及其子公司提供數據分析挖掘的增值服務。其核心是對客戶的交易數據進行分析,准確預測客戶短時間內的消費和交易需求,從而精準掌握客戶的信貸需求和其他金融服務需求。
銀行業有處理數據的經驗和人才。數據分析和計量模型技術在傳統數據領域已得到較充分運用,同時也培養出大批精通計量分析技術的人才。如在風險管理方面,我國金融監管部門在與國際接軌過程中,引入巴塞爾新資本協議等國際准則,為銀行業提供了一套風險管理工具體系。銀行在此框架下,利用歷史數據測度信用、市場、操作、流動性等各類風險,內部評級相關技術工具已發揮出效果,廣泛應用於貸款評估、客戶准入退出、授信審批、產品定價、風險分類、經濟資本管理、績效考核等重要領域。
② 大數據能為銀行做什麼
隨著移動互聯網、雲計算、物聯網和社交網路的廣泛應用,人類社會已經邁入一個全新的「大數據」信息化時代。而銀行信貸的未來,也離不開大數據。
國內不少銀行已經開始嘗試通過大數據來驅動業務運營,如中信銀行信用卡中心使用大數據技術實現了實時營銷,光大銀行建立了社交網路信息資料庫,招商銀行則利用大數據發展小微貸款。從發展趨勢來看,銀行大數據應用總的可以分為四大方面:
第一方面:客戶畫像應用。
客戶畫像應用主要分為個人客戶畫像和企業客戶畫像。個人客戶畫像包括人口統計學特徵、消費能力數據、興趣數據、風險偏好等;企業客戶畫像包括企業的生產、流通、運營、財務、銷售和客戶數據、相關產業鏈上下游等數據。值得注意的是,銀行擁有的客戶信息並不全面,基於自身擁有的數據有時難以得出理想的結果甚至可能得出錯誤的結論。
比如,如果某位信用卡客戶月均刷卡8次,平均每年打4次客服電話,從未有過投訴,按照傳統的數據分析,該客戶是一位滿意度較高流失風險較低的客戶。但如果看到該客戶的微博,真實情況是:工資卡和信用卡不在同一家銀行,還款不方便,好幾次打客服電話沒接通,客戶多次在微博上抱怨,該客戶流失風險較高。所以銀行不僅僅要考慮銀行自身業務所採集到的數據,更應考慮整合外部更多的數據,以擴展對客戶的了解。包括:
(1)客戶在社交媒體上的行為數據(如光大銀行建立了社交網路信息資料庫)。通過打通銀行內部數據和外部社會化的數據可以獲得更為完整的客戶拼圖,從而進行更為精準的營銷和管理;
(2)客戶在電商網站的交易數據,如建設銀行則將自己的電子商務平台和信貸業務結合起來,阿里金融為阿里巴巴用戶提供無抵押貸款,用戶只需要憑借過去的信用即可;
(3)企業客戶的產業鏈上下游數據。如果銀行掌握了企業所在的產業鏈上下游的數據,可以更好掌握企業的外部環境發展情況,從而可以預測企業未來的狀況;
(4)其他有利於擴展銀行對客戶興趣愛好的數據,如網路廣告界目前正在興起的DMP數據平台的互聯網用戶行為數據。
第二方面:精準營銷
在客戶畫像的基礎上銀行可以有效的開展精準營銷,包括:
(1)實時營銷。實時營銷是根據客戶的實時狀態來進行營銷,比如客戶當時的所在地、客戶最近一次消費等信息來有針對地進行營銷(某客戶採用信用卡采購孕婦用品,可以通過建模推測懷孕的概率並推薦孕婦類喜歡的業務);或者將改變生活狀態的事件(換工作、改變婚姻狀況、置居等)視為營銷機會;
(2)交叉營銷。即不同業務或產品的交叉推薦,如招商銀行可以根據客戶交易記錄分析,有效地識別小微企業客戶,然後用遠程銀行來實施交叉銷售;
(3)個性化推薦。銀行可以根據客戶的喜歡進行服務或者銀行產品的個性化推薦,如根據客戶的年齡、資產規模、理財偏好等,對客戶群進行精準定位,分析出其潛在金融服務需求,進而有針對性的營銷推廣;
(4)客戶生命周期管理。客戶生命周期管理包括新客戶獲取、客戶防流失和客戶贏回等。如招商銀行通過構建客戶流失預警模型,對流失率等級前20%的客戶發售高收益理財產品予以挽留,使得金卡和金葵花卡客戶流失率分別降低了15個和7個百分點。
第三方面:風險管控
包括中小企業貸款風險評估和欺詐交易識別等手段。
(1)中小企業貸款風險評估。銀行可通過企業的產、流通、銷售、財務等相關信息結合大數據挖掘方法進行貸款風險分析,量化企業的信用額度,更有效的開展中小企業貸款。
(2)實時欺詐交易識別和反洗錢分析。銀行可以利用持卡人基本信息、卡基本信息、交易歷史、客戶歷史行為模式、正在發生行為模式(如轉賬)等,結合智能規則引擎進行實時的交易反欺詐分析。如IBM金融犯罪管理解決方案幫助銀行利用大數據有效地預防與管理金融犯罪,摩根大通銀行則利用大數據技術追蹤盜取客戶賬號或侵入自動櫃員機(ATM)系統的罪犯。
第四方面:運營優化。
(1)市場和渠道分析優化。通過大數據,銀行可以監控不同市場推廣渠道尤其是網路渠道推廣的質量,從而進行合作渠道的調整和優化。同時,也可以分析哪些渠道更適合推廣哪類銀行產品或者服務,從而進行渠道推廣策略的優化。
(2)產品和服務優化:銀行可以將客戶行為轉化為信息流,並從中分析客戶的個性特徵和風險偏好,更深層次地理解客戶的習慣,智能化分析和預測客戶需求,從而進行產品創新和服務優化。如興業銀行目前對大數據進行初步分析,通過對還款數據挖掘比較區分優質客戶,根據客戶還款數額的差別,提供差異化的金融產品和服務方式。
(3)輿情分析:銀行可以通過爬蟲技術,抓取社區、論壇和微博上關於銀行以及銀行產品和服務的相關信息,並通過自然語言處理技術進行正負面判斷,尤其是及時掌握銀行以及銀行產品和服務的負面信息,及時發現和處理問題;對於正面信息,可以加以總結並繼續強化。同時,銀行也可以抓取同行業的銀行正負面信息,及時了解同行做的好的方面,以作為自身業務優化的借鑒。
銀行是經營信用的企業,數據的力量尤為關鍵和重要。在「大數據」時代,以互聯網為代表的現代信息科技,特別是門戶網站、社區論壇、微博、微信等新型傳播方式的蓬勃發展,移動支付、搜索引擎和雲計算的廣泛應用,構建起了全新的虛擬客戶信息體系,並將改變現代金融運營模式。
大數據海量化、多樣化、傳輸快速化和價值化等特徵,將給商業銀行市場競爭帶來全新的挑戰和機遇。數據時代,智者生存,未來的銀行信貸,是從數據中贏得未來,是從風控中獲得安穩。
③ 國內有哪些醫療大數據公司做得比較好的優勢在哪
武漢金豆數據是國來內醫保自/醫療數據增值服務一體化解決方案供應商。全國運營中心位於北京,研發中心位於武漢,在河南、河北、廣東、雲南等地共設有7家分、子公司,匯聚了140多名跨學科的醫療數據挖掘精英和1000多人的專家顧問團隊。公司在香河投建佔地50畝、建築面積80000餘平方米的醫療大數據產業園,並在深圳前海與恆大集團共同出資設立恆金健康科技有限公司。
作為國內最早開始專注醫療大數據技術與行業經驗積累的團隊之一,金豆擁有十年 的醫療數據分析和疾病編碼應用與轉換產品研發經驗,八年的醫保控費和支付方式改 革方面產品研究與開發的經驗。共積累了120多項數據分析模型和相關演算法,並對部分核心技術申請了專利。
金豆醫療數據始終密切把握中國醫療改革的脈搏。從國務院38號文件、到「十三五」規劃綱要、「健康中國2030」規劃綱要, 再到今年全國兩會政府工作報告,都明確指出推行DRG預付費制勢在必行。基於深厚的行業積淀,金豆提供一體化的解決方案。金豆是全國醫療服務價格與成本監測網路的中標建設及維護單位,並開發出了目前市場上可實現12個版本疾病診斷/操作編碼一鍵轉換的產品,實現了企業跨越式的發展。
④ 大數據助推金融業發展
大數據助推金融業發展
專家表示,對於金融行業來說,尤其是以銀行、保險為主的金融行業都是非常注重數據應用的,很多企業已經在利用大數據去服務其風險管理、客戶營銷和運營管理等工作。大數據未來將成為全球金融業競爭的主要「陣地」之一。對大數據的應用能力已經成為金融企業的核心競爭力,未來有競爭力的金融企業一定是有深厚大數據文化的企業。
今年《政府工作報告》明確提出要「發展壯大新動能。做大做強新興產業集群,實施大數據發展行動」。近年來,以信息通信技術的創新為基礎,互聯網、大數據和人工智慧等蓬勃發展,新的經濟形態展現出強勁的生命力。接受《金融時報》記者專訪的畢馬威中國大數據團隊學科帶頭人魏秋萍博士表示,對於金融行業來說,尤其是以銀行、保險為主的金融行業都是非常注重數據應用的,很多企業已經在利用大數據去服務其風險管理、客戶營銷和運營管理等工作。
金融大數據值得關注
魏秋萍表示,金融行業本身是一個自帶很大流量的行業。比如一個規模較大的銀行,都擁有海量的客戶。銀行可以利用大數據技術,針對不同的客戶群體制定不同的個性化服務方案,可以創建出很多不同的場景。同時,銀行擁有很多的數據維度,這些數據項又比一般的網路行為大數據擁有更高的價值密度,可以發揮很大的業務價值。因此,金融行業充分利用自己的流量、數據,有效結合外部數據,再配套先進的技術和理念,必然可以成為一個生態體系中的核心組織。
大數據已經被廣受關注,但到底什麼是大數據,並沒有一個被大家普遍認可的定義。魏秋萍認為,要認識大數據,可以從數據和技術兩大層面來看。在大數據這個熱詞沒有出現之前,金融行業早就開始了商務智能分析和數據挖掘,不過這時被分析的數據往往是企業內部的結構化數據。目前,金融企業分析的數據已經不再拘泥於此,而是大大拓寬了數據的廣度,除了結構化數據外,也會根據實際的分析需要來引入非結構化數據,同時也會結合企業內部數據和企業外部數據來開展分析。在技術層面,也有了很大的變革,包括存儲能力、計算能力和演算法種類等,都有長足的進步。在10多年前做數據挖掘的時候,往往由於樣本量龐大需要做采樣技術,現在有了高性能存儲和內存計算等技術的更新,采樣基本不再是必需的了。
魏秋萍預計,大數據未來將成為全球金融業競爭的主要「陣地」之一。與互聯網企業相比,雖然金融行業踐行大數據戰略的起步要晚了一些,但是金融行業利用大數據的進程也發展得很快。對大數據的應用能力,已經成為金融企業的核心競爭力,未來有競爭力的金融企業一定是有深厚大數據文化的企業。大數據提供了全新的溝通渠道和客戶經營手段,可以加深企業和客戶的互動,更及時精準地洞察客戶。大數據也可以幫助金融企業滋生新型的金融業態參與市場競爭,用大數據來武裝自己的金融企業未來一定是某個生態鏈中的關鍵組件。
風控需同步跟上
魏秋萍表示,應用大數據必須要重視數據質量和技術創新。舉例來說,把大數據應用於風險控制是金融業應用大數據最典型的場景之一。在這一場景的應用中,有以下兩點必須注意:一是對於數據的整合和數據的治理。風控是一個復雜的過程,要利用數據對風險進行穿透式管控,必須實現用真實的數據再現業務流程,因此,數據的可獲得性和數據質量非常關鍵。二是先進技術的應用和創新。風控是魔高一尺道高一丈的游戲,「小偷」的伎倆層出不窮,作為「警察」的風控必須要有不斷創新的能力,不斷優化風控的技術。她還表示,從大數據風控技術的角度看,國內和國際的差異並不大,中國也走在了技術的前沿。但是,國外的金融企業對創新技術的容錯會比國內好,他們有一些機制來鼓勵創新技術的試錯。這一點值得國內企業學習。
魏秋萍還認為,應用大數據的時候,數據安全也要同步跟上。保障數據安全的方法主要是三大手段:第一,需要依靠健全的法律制度來保障和約束數據交易的買賣雙方;第二,需要加強數據買賣雙方的道德約束;第三,需要通過安全技術來保障數據的安全。
金融企業應用大數據是一個逐步發展的過程,大數據的價值釋放也必然是循序漸進的。企業內部一致的大數據理念和數據驅動決策的文化,也是大數據助推金融企業發展的保障。
⑤ 五大賽道、八位專家,銀行局中人眼裡的AI江湖
誰說大象不能跳舞?
2020於全體銀行而言,是一場無預告的終極考驗,一輪最直觀的金融 科技 對決。疫情讓網點流量驟降到接近於0,全方位挑戰銀行線上服務水平,檢驗那些連年增加的 科技 投入,有多少真正變作數字化、智能化的一點一滴。
踏進2021,銀行們迎來周密復盤、整裝待發的最好時間節點。
在過去這一年,銀行更努力地擺脫大象轉身的刻板印象,告別以往被各路創新推著走的窘況,試圖在金融 科技 和數字新基建的浪潮里承擔更主動、開放的角色,以輕快敏捷的步伐持續向前。
沒有一家銀行不想擁抱AI,沒有人願意錯過數智化轉型的未來。在梳理數十家銀行AI全布局,以及 「銀行業AI生態雲峰會」 多位嘉賓的分享過程中,我們逐漸發現銀行業AI的那些挑戰和困境,那些艱險之處同樣是機遇所在。
數據安全與隱私保護
銀行業AI,首先被AI本身正面臨的數據困境,和日漸收緊的數據監管尺度攔住。
在技術維度不斷向前奮進的同時,銀行必然要思考的一個議題是:業務創新與隱私保護如何兼顧?
雷鋒網AI金融評論主辦的 《聯邦學習系列公開課》 曾對這一問題展開過系統深入的探討。第一節課上, 微眾銀行首席人工智慧官楊強 就直接點明:「人工智慧的力量來自於大數據,但在實際運用過程中碰到更多的都是小數據。」
平安 科技 副總工程師王健宗 也在課上指出,「傳統的AI技術必須從海量的數據中學習或者挖掘一些相關的特徵,利用數學理論,去擬合一個數學模型,找到輸入和輸出的對應關系,比如深度學習中訓練網路的權重和偏置,模型效果與數據量級、質量、以及數據的真實性等有著密切的關系。」
一個典型例子就是銀行信貸風控:現在大部分AI應用都由數據驅動,信貸風控更需要大量數據訓練,但大額貸款風控的案例又非常少。「要是來做深度學習模型,只用少量這種大額貸款的樣本遠遠不夠。」楊強解釋。
小數據需要「聚沙成塔」,同時又面臨侵犯隱私的可能。為此,網路安全與數據合規領域的立法進入了快車道,濫用數據和爬蟲也受到過嚴厲整治。
雖然目前《數據安全法》還只是處於草案的狀態,但是草案明確提出要關注數據本身的使用,需要在保護公民組織、相關權益的前提下,促進數據為關鍵要素的經濟發展。
數據被稱作是新時代的油田,但銀行該怎樣通過AI摸索出更高效、更合規的開采工具?
在「銀行業AI生態雲峰會」第一場演講中, 微眾銀行區塊鏈安全科學家嚴強博士 就對銀行必備的數據安全與隱私保護思維,進行了深入討論。他指出:
在數字經濟時代下,銀行業AI發展 必須要尊重「數據孤島」作為數據產業的原生態,隱私保護技術則是打破數據價值融合「零和博弈」的關鍵,需要打通隱私數據協同生產的「雙循環」。
而 區塊鏈 是承載數據信任和價值的最佳技術,對於隱私計算和AI應用中常見的數據品質等難題,都可以通過區塊鏈進行互補或提升效果。
聯邦學習、TEE可信計算、安全多方計算等多個AI技術路線也正嘗試落地於銀行的核心業務場景。
AI金融評論了解到,除了微眾銀行, 江蘇銀行 2020年也已開展聯邦學習方向的 探索 ,他們與騰訊安全團隊合作,基於聯邦學習技術對智能化信用卡經營進行聯合開發和方案部署,在聯邦學習技術支持下進行金融風控模型訓練。
銀行資料庫
以「數據」為線,銀行前中後台的升級軌跡清晰可見。
如果說前些年的銀行 科技 ,討論度更集中在前台智能化應用,那麼如今中後台建設開始更多地來到聚光燈下,討論它們為銀行數字化轉型呈現的價值和意義。
這當中的一個重要模塊,就是 銀行資料庫 的改造升級。
我們曾經報道,Oracle自進入中國市場以來,在銀行資料庫市場,一直具有壓倒性優勢,也是許多銀行的采購首選。
由於長期使用Oracle,不少銀行形成較嚴重的路徑依賴。平安銀行分布式資料庫技術負責人李中原也曾向AI金融評論表示,系統遷移和重新建設需要大量成本,從單機變為多機群體,故障發生的故障發生的概率和維護成本都會加大,對整體系統運維將是巨大挑戰。(詳見 《銀行業「求變」之日,國產資料庫「破局」之時》 )
但隨著銀行業務創新需求愈發復雜,傳統資料庫在技術邊界、成本、可控性方面越來越不相匹配;采購資料庫的來源單一也讓銀行陷入非常被動的處境。
而雲計算的出現,讓Oracle在資料庫市場接近壟斷的地位有所動搖,各大互聯網雲廠商殺入戰場。
騰訊雲副總裁李綱就表示,雲化資料庫勝在成本低、易擴容兩大特點,任意一台X86的PC伺服器就可以運行,理論上也有著無限的橫向擴展能力,這都是Oracle等傳統資料庫難以企及的優點。
中國數千家銀行由此獲得更多選擇餘地,開始從集中式資料庫遷移到分布式資料庫,一場事關「大機下移」的漫長征途就此展開。
這場變革已有先行者,例如 張家港行 在2019年就將其核心業務系統放在了騰訊雲TDSQL資料庫上,傳統銀行首次為核心系統選用國產分布式資料庫;2020年,平安銀行信用卡的核心系統也完成切換投產,新核心系統同樣採用了國產資料庫。
在「銀行業AI生態雲峰會」上, 騰訊雲資料庫TDSQL首席架構師張文 就深入分享了張家港行和平安銀行這兩個典型的資料庫遷移轉型案例。
以 平安銀行 為例,其體量之大,意味著應用改造更具挑戰性。張文解釋道,為了配合此次改造,應用引入了微服務架構對應用進行了拆分和解耦。對賬號的分布進行了單元化劃分,以DSU為一個邏輯單元,單個DSU包含200萬個客戶信息,單個DSU同時處理聯機和賬務兩種業務。
但國產分布式資料庫也同樣還在成長當中,張文也指出了目前金融級分布式資料庫面臨一系列挑戰點,除了有可伸縮、可擴展的能力,更要解決高可用性、數據強一致性,同時 探索 更具性價比的性能成本,以及為金融機構打造更易上手的、更產品化的成熟解決方案。
中台建設
「中台建設」這個熱門關鍵詞,不再是互聯網公司的專屬。銀行也不例外,甚至更需要中台。
銀行這樣的大型機構,架構極其復雜,還有跨部門多團隊的協作,海量數據日積月累之下如同年久失修的危樓,更需要及時、持續的治理。
在看來,銀行擁有大量的數據、技術和人才,資源卻往往「各行其是」,部門之間沒有配合意識、獨立造煙囪;技術流於表面,無法鏈接、深入,這造成了銀行資源的大量浪費。
中台 的體系化建設和順利運轉,才能將這龐大體系中的「死結」一一梳開。
建設銀行 監事長王永慶就曾指出:中台建設是商業銀行數字化經營轉型的關鍵環節,認為商業銀行數字化轉型的必然歸宿是生態化、場景化。
盡管商業銀行在多年經營過程中沉澱了一定的競爭優勢,形成了各具特色的內部生態系統,但目前仍是封閉的、高冷的,還無法滿足數字經濟對開放式生態化經營可交互、高黏性、有體感、無邊界的要求。
因此,建行也已在數據中台先行一步,其落地上概括為5U(U是統一的意思),包括統一的模型管理、統一的數據服務、統一的數據視圖,統一的數據規范以及統一的數據管理。
為求輕松支撐億級用戶,實現高時效、高並發場景化經營, 招商銀行 近兩年也在中台和技術生態體系的建設上持續發力。去年年底發布的招商銀行App 9.0,迭代需求點超過1800項,「10+N」數字化中台建設就占據了相當的比重。
如何構建金融機構需要的數據中台?
在「銀行業AI生態雲峰會」上, 360數科首席科學家張家興 就用「三通三快」概括了數據中台的標准:
金融機構面對著海量用戶、復雜業務,一個優秀的數據中台,必須是達到多業務打通,內外數據互通和用戶關系連通,同時還要做到數據的實時處理快、使用快、需求響應快。
他進一步強調,數據與AI融合得非常緊密,如果數據中台和AI中台各自建設,兩者之間將不可避免地存在割裂的現象。
基於此,360數科也推出了自己的數據AI融合中台,將最上層數據平台,到中間數據服務支撐的平台服務,再到整個數據資產的管理,到最下面整個數據技術架構的設計都進行調整,並且將自身沉澱的AI能力嵌入其中。
張家興也在雲峰會的演講上透露,360數科研發了一項聯邦學習技術——分割式神經網路,通過神經網路在高維空間,Embedding不可逆的特性,使得不同參與的數據合作方只需要傳遞Embedding向量,見不到原始數據,但最終可以使模型產生目標效果。
銀行信貸智能風控
而在過去一年裡,銀行信貸風險管理,仍然是最引人關注的方向之一。
關注度一方面來自於,受疫情影響而劇增的貸款逾期和壞賬風險,如何藉助技術手段「端穩這碗水」,把握好信貸支持尺度,成為銀行、消金公司和風控技術服務商們的開年大考。(詳見 《信貸戰「疫」:一場給風控的開年大考》 )
而另一方面,2020年下半年起,針對金融 科技 或是互聯網金融的監管「紅線」逐漸清晰。例如《商業銀行互聯網貸款管理暫行辦法》,其中就明確提出了對商業銀行的風險管控要求,和對合作機構的管理規范。
盡管結合AI、大數據的智能風控在銀行 科技 應用中不再新鮮,但這並不意味著智能風控已經足夠成熟—— 數據資源壁壘、自有數據累積、數據特徵提煉、演算法模型提升 ,被認為是大數據風控目前所面臨四大困境。
某商業銀行負責人就曾表示,在模型建設和模型應用過程中普遍存在數據質量問題,包括外部數據的造假(黑產欺詐)和內部數據的濫用等,在模型迭代方面,很多銀行只追求迭代的速度和頻次,而忽略了最終效果。
前網路金融CRO、融慧金科CEO王勁 進一步指出,數據規范和治理體系不健全,數據質量差且缺失率高,技術能力不足,復合型 科技 人才匱乏等因素都是銀行等金融機構無法做好模型的重要原因。
王勁曾在有著「風控黃埔軍校」之稱的美國運通工作17年,負責過全球各國各類產品相關的700餘個模型提供政策制度和獨立監控。在雲峰會上,他也結合自身二十餘年風控經驗,剖析了金融風險管理中的那些理念誤區。
「很多人並不是特別理解,風險管理永遠是一個尋找平衡點的科學。」王勁認為,風險管理平衡有著這樣的核心三問:
他也解析了銀行等持牌金融機構做好風險管理平衡的核心要素,談到風險管理最重要的就是對數據的把控,「金融公司成立之初就要思考數據的生命周期。首先要從對業務產品和客戶的選擇當中,決定需要什麼樣的數據。」
數據戰略是一個相對長期的落地過程,機構首先要立下數據選擇的原則和條件:要考慮的不只是數據的合規性、穩定性和覆蓋率,更要考慮數據的新鮮度、時效性和時間跨度。
從模型建設的角度出發,王勁指出,一個卓越的風控模型應當具備辨別力、精準度、穩定性、復雜度和可解釋性五大要素,「原材料」數據、模型架構和演算法的選擇,衍生變數的出現,對模型的監控和迭代,以及對y的定義和樣本的篩選,無一不影響模型的「鍛造」。
在他看來,銀行等金融機構如果能在身份識別和控制、數據安全管理、風險模型管理,和自動化監控體系方面,做到高效完善,將會是非常理想的一種狀態。
RPA與內部流程優化
還有一個關鍵詞,在各家銀行年報中出現頻率越來越高,那就是RPA(機器人流程自動化)。此前AI金融評論也曾舉辦 《RPA+AI系列公開課》 ,邀請到五位頭部RPA廠商高管分享RPA與金融碰撞出的火花。
RPA的定義,很容易聯想到2012年左右的「流程銀行」轉型潮。當時的流程銀行,意為通過重新構造銀行的業務流程、組織流程、管理流程以及文化理念,改造傳統的銀行模式,形成以流程為核心的全新銀行經營管理體系。
如今銀行的轉型之戰,全方位升級為「數字化轉型」,內部流程的優化改造在AI和機器人技術的加持下持續推進,RPA也迅速成為銀行數字化轉型不可缺席的一把「武器」。
達觀數據聯合創始人紀傳俊 在「銀行業AI生態雲峰會」上指出,RPA+AI為銀行帶來的價值,最明顯的就是減少人工作業、降低人工失誤,提升業務流程效率,同時也提高風險的預警和監控能力。
AI金融評論注意到,已有多家國有大行將RPA投產到實際業務中。
以 工商銀行 為例,RPA在工行的應用覆蓋了前台操作、中台流轉和後台支撐等多個業務場景,在同業率先投產企業級機器人流程自動化(RPA)平台並推廣應用,全行累計46家總分行機構運用RPA落地實施120個場景。
建設銀行 同樣也引入了RPA,建立國內首個企業級RPA管理運營平台,敏捷研發業務應用場景 100 個,實現人工環節自動化、風險環節機控化。
農業銀行 方面則透露,農行目前還處於技術平台建設階段,之後將以信用卡業務、財務業務等為試點落地RPA需求。其實施策略,是建設全行統一的RPA技術平台,面向總分行各部門輸出RPA服務。
中國銀行 在2017年底,旗下公司中銀國際就已有RPA的概念驗證,團隊成功投產20個機器人,分別在不同崗位執行超過30個涉及不同業務流程的自動化處理工作,也與RPA廠商達觀數據展開了合作。
紀傳俊也在雲峰會上分享了目前AI+RPA在銀行各大典型場景的落地:
例如智慧信貸,面向的是整個銀行最核心的流程——信貸流程,分為貸前、貸中、貸後三大階段。其中涉及數據查詢、數據處理、財務報表、銀行流水等專業環節,需要完成基礎信息的錄入、盡調報告的審核,而這些環節中的大量重復勞動,可以基於AI、OCR、NLP等技術自動化完成。
⑥ 央行緊急排查銀行與大數據公司合作,涉及10家平台
昨日(10月24日)下午,有消息稱,央行緊急調研要求銀行填寫是否與第三方數據公司開展合作。
排查內容涉及數據採集、信用欺詐、信用評分、風控建模方面,央行要求上報第三方數據公司的名字、股東背景、是否涉及爬蟲。
有銀行人士向消金時代證實了此消息,並稱:「我們沒有收到直接文件,雖然通知是人行發的,但是銀監局直接電話通知我們的,時間是本周二。」
網路上流傳的一份截圖(上圖)顯示,各企業 徵信 機構還被要求梳理是否與:同盾科技、魔蠍科技、新顏科技、集奧聚合、公信寶、白騎士、天機數據、立木徵信、聚信立、51信用卡等10家公司有業務或股權投資關聯。
各機構排查自身業務中是否存在違規爬蟲行為,如存在上述情況,請立即上報,對於存在違規爬蟲業務的要立即整改,不存在上述兩種情況的,請出具加蓋公章的書面承諾,並於10月24日前送至徵信管理處。
不過,另有截圖(下圖)顯示監管部門要求填表了解是否與上述除同盾科技以外9家公司有業務或股權投資關聯。
河北地區銀行人士向我們表示:「要求我們交的僅是文字說明,未涉及表格。」
根據了解,被點名的平台或許是各地方監管的附加要求。據消金時代核實,某中部地區銀行收到的通知內包含同盾科技,某北方地區銀行收到的通知則不包含同盾科技。
而上述10家平台,最近都不算太平。
9月6日,魔蠍科技被警方控制,高管被帶走,服務癱瘓,新顏科技CEO黃向前被帶走,聚信立被曝有警方進駐調查。
9月11日,公信寶被警方查封。
9月12日,集奧聚合深圳分公司有10多人被帶走。財新等媒體報道稱,集奧聚合北京辦公室也被深圳警方帶走多人,包括爬蟲數據接入負責人和合同負責人。
中秋節期間,同盾科技子公司信川科技法人代表、總經理徐斐和旗下數聚魔盒總經理童保華被警方帶走協助調查。財新等媒體報道稱,10月3日,黑龍江警方從同盾科技北京辦公室帶走多位從事爬蟲業務的子公司員工。
10月9日,有媒體曝出立木徵信於7月18日被查,法人劉勤楓及大部分員工被警方帶走。
白騎士、天機數據此前也均是市場上較為活躍的有爬蟲服務的平台,此前已暫停爬蟲服務。
而據財新報道,除配合調查外,包括新顏CEO黃向前、同盾科技的兩位相關業務負責人徐斐和童保華已被檢方批捕。
已進行多輪自查
一張統計表截圖(下圖)顯示,合作情況排查僅上報金融機構與數據公司在個人信息方面的合作情況,不包括企業信息合作。從此條來看,排查意在個人信息保護。
由於大數據行業動盪,對風險向來敏感的金融行業,早已開始多輪自查。9月,中國互聯網金融協會發出窗口指導,提示行業內機構應清查使用數據的來源是否合規。
城商行、農商行、消金公司等多家機構也暫停大數據風控合作業務。一家數據商人士表示,各機構要求數據商出具文件對是否涉及爬蟲業務進行說明。
上周,北京銀監局下發文件,規範金融機構和金融科技公司合作,嚴禁金融機構與以「大數據」為名竊取、濫用、非法買賣或泄露客戶信息的企業開展合作。
10月22日,北京金融局窗口指導摸排區內所有大數據企業是否存在違規爬蟲業務。
近期,央行也下發了《個人金融信息(數據)保護試行辦法》(以下簡稱:《辦法》)的徵求意見稿。據媒體披露,《辦法》中最嚴苛的一點是,除了依法設立的徵信機構之外,未經人民銀行批准,任何單位和個人不得從事個人金融信息的收集處理工作,以及對外提供 個人徵信 業務。
《辦法》規定,金融機構也可以通過外包服務開展業務,只是對外包服務的要求更高,金融機構要進行充分調研審查,評估外包服務公司的能力。
從前述排查來看,有業內人士認為,監管強調的是客戶信息來源是否合規,而非否定金融機構與數據機構合作形式。也有人認為,在《辦法》正式下達前,中小銀行應該不敢再合作。
打擊套路貸,影響自下而上
前年開始,全國開始對套路貸和掃黑除惡進行打擊。今年4月,最高人民法院、最高人民檢察院發布《關於辦理實施「軟暴力」的刑事案件若干問題的意見》,打擊范圍升級。
10月11日至12日,「全國掃黑除惡專項斗爭第二次推進會」在陝西西安召開,對網貸涉黑嚴打的監管風暴持續強化。10月21日,兩高兩部正式發布 《放貸意見》 ,界定無牌發放年化36%以上 貸款 達一定條件的非法放貸以非法經營罪處罰。
對套路貸、非法放貸的監管日益趨嚴。而很多大數據風控公司與「714高炮」等現金貸平台合作密切,甚至有公司親自下場放貸,據財新報道,被查大數據公司均由於714高炮涉及的 催收 引發命案有關,公安對大數據公司是有針對性的介入。
網路現金貸暴力催收,引發數據行業動盪,有持牌機構人士稱:「最近的數據公司被抓,導致貸款業務風控模型可控程度急速下降。」風波影響可謂「自下而上」。
除了涉及現金貸問題,不少使用爬蟲技術的大數據風控公司本身就有致命缺陷。
對大數據風控服務商的強監管風暴,讓「爬蟲」一詞常登熱點,爬蟲技術中立也被業內反復強調。
一般來說,大數據風控行業的數據來源分幾種,數據源接入、機構 共享 及爬蟲。其中,爬蟲來的數據更為客觀和數量龐大,在數據積累初期作用很大,但也常常採用籠統授權的方式爬取用戶的非公開個人信息。
有業內人士向消金時代表示:「爬蟲乾的是臟活累活,市場過度競爭導致無利可圖,性價比低,所以企業只能把盈利點放在爬蟲以外的地方。聚信立、公信寶、魔蠍科技等數據公司都在做的事情就是把爬蟲數據入庫,如果僅輸出評分倒也不至於引發強烈後果,但很多都把通話記錄賣給催收,個人基本信息賣給營銷公司等,涉嫌販賣個人數據等問題。」
根據2017年6月施行的《最高人民法院、最高人民檢察院關於辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》,(一)出售或者提供行蹤軌跡信息,被他人用於犯罪的;(二)知道或者應當知道他人利用公民個人信息實施犯罪,向其出售或者提供的;(三)非法獲取、出售或者提供行蹤軌跡信息、通信內容、徵信信息、財產信息五十條以上的;(四)非法獲取、出售或者提供住宿信息、通信記錄、健康生理信息、交易信息等其他可能影響人身、財產安全的公民個人信息五百條以上的;(五)非法獲取、出售或者提供第三項、第四項規定以外的公民個人信息五千條以上的;(六)數量未達到第三項至第五項規定標准,但是按相應比例合計達到有關數量標準的等條件達到任一條,應當認定為刑法第二百五十三條之一規定的「情節嚴重」。
但是同時,上周北京銀監局下發的文件也肯定了大數據技術的價值,「充分運用大數據技術,加大風險監測和預警力度」。
在數據治理體系逐漸完善的背景下,大數據在金融行業的應用仍有無限前景。
⑦ 大數據如何助力銀行業金融機構輿情防控
金融企業運用大數據和機器學習演算法,對欠款客戶進行人群聚類並根據聚類的結果識別騙貸、惡意欠款、惡意透支、盜刷盜用、對交易有疑問拒絕還款、經濟狀況惡化無力還貸、遺忘還貸等多種欠款類型;從而准確預測客戶的還款概率和金額,從而進行催收策略評估,最大限度降低催收成本。
中國建設銀行資產總行風險管理部/資產保全部副總經理譚興民曾詳盡分析大數據何以幫助銀行提高徵信水平和風險管控能力:
首先,一站式徵信平台可以進行貸前客戶甄別。目前,銀行查詢客戶的情況既費時、費力,又增加銀行費用,而利用企業的一站式徵信平台,則可以最大限度地節省銀行的人力、物力及時間,並確保數據有效、及時、准確。
其次,風險量化平台可以助力貸後風險管控。平台基於企業日常經營數據,結合平台數據模型,採用動態、實時的雲端數據抓取技術,對企業的發展進行分析和評測,給出風險量化分數,並第一時間發現企業的生產經營異動,在風險觸發前3到6個月預警,使銀行等金融機構能夠及時採取相應措施,防止和減少損失發生。
同時,利用「企業族譜」查詢,對不良貸款進行監控。如一些企業通過關聯交易轉移利潤、製造虧損的假象,為不償還銀行貸款尋找理由;或者通過關聯交易製造虛假業績,為繼續獲得銀行貸款提供依據,這些假象通過關聯交易查詢,都可以很快發現蛛絲馬跡,讓企業造假暴露原形,可防止銀行上當受騙。
大數據風控相對於傳統風控來說,建模方式和原理其實是一樣的,其核心是側重在利用更多維的數據,更多互聯網的足跡,更多傳統金融沒有觸及到的數據。比如電商的網頁瀏覽、客戶在app的行為軌跡、甚至GPS的位置信息等,這些信息看似和一個客戶是否可能違約沒有直接關系,但實則通過大量的數據累積,能夠產生出非常有效的識別客戶的能力。
在運行邏輯上,大數據風控不強調較強的因果關系,看重統計學上的相關性是大數據風控區別於傳統金融風控的典型特徵。傳統金融機構強調因果,講究兩個變數之間必須存在邏輯上能夠講通因果。
在數據維度這個層級,傳統金融風控和大數據風控還有一個顯著的區別在於傳統金融數據和非傳統金融數據的應用。傳統的金融數據包括上文中提及的個人社會特徵、收入、借貸情況等等。而互金公司的大數據風控,採納了大量的非傳統金融數據。
相對於傳統金融機構,互金公司擴大了非傳統數據獲取的途徑,對於新客戶群體的風險定價,是一種風險數據的補充。當然,這些數據的金融屬性有多強,仍然有待驗證。
巨頭優勢明顯,並不代表創業公司的路已被堵死。大公司不可能面面俱到,布局各種場景。在互聯網巨頭尚未涉及的領域,小步快跑,比巨頭更早的搶下賽道,拿到數據,並且優化自己的數據應用能力,成為創業公司殺出重圍的一條路徑。
⑧ 銀行數據應用與管理團隊是干什麼的
銀行數據應用與管理團隊是開展各業務板塊數據中台、數據集市、數據應用的規劃設計工作的宴困枝。
崗位職責:1、負責帶領大數據開發晌敏團隊;2、負責牽頭數據架構規劃、大數據、人工智慧前沿技術與課題研究;3、負責數據中台的規劃與建設;4、負責大數據集市、大數據應用的規劃、建設與維護工作;5、負責提供大數據技術指導及解決大數據平台與應用中遇到的技術難題。做好與監管部門的日常溝通與對接,落實監管部門各項監管統計工作要求,處理各類監管調研、監尺舉管統計階段性重點工作。