A. 企業大數據之大數據徵信及風控應用
企業大數據之大數據徵信及風控應用
互聯網人口紅利區已經過去,獲客成本增大,用戶對產品的要求也越發提高,高價值和低成本服務是當前的一種趨勢。其中,企業服務致力於為企業在生產,銷售和溝通等環節提高效率,降低成本,受到越來越多的資本青睞。
隨著人工智慧對行業的滲透,以及數據量的劇增,越來越多的企業服務產品正利用人工智慧,大數據等相關技術提供更智能服務,大數據作為人工智慧模型中的訓練"糧食",占據重要位置,如何挖掘和利用企業數據,是做好企業服務的一個重要途徑,企業大數據來源主要有以下幾個方面:
a.企業內部數據化檔案,例如人事資料,紙質化資料等;
b.企業自產數據,例如企業內部OA,ERP和CRM系統所沉澱下來的客戶數據,辦公數據,生產經營數據,社交數據,電商數據,支付數據,供應鏈數據等;
c.企業信用數據
政府公開數據-比如工商的企業信用信息公示數據,失信被執行,被執行數據,裁判文書,開庭公告,法院公告,稅務數據,動產融資數據,招投標,司法拍賣數據等,專利商標,行政處罰等數據。互聯網公開數據-比如新聞數據,招聘網站數據,上市披露數據。
徵信概述
1.徵信定義
徵信一詞源於《左傳·昭公八年》中的「君子之言,信而有徵,故怨遠於其身」。其中,「信而有徵」即為可驗證其言為信實,或徵求、驗證信用。現代徵信是依法收集、整理、保存、加工自然人、法人及其他組織的信用信息,並對外提供信用報告、信用評估、信用信息咨詢等服務,幫助客戶判斷、控制信用風險,進行信用管理的活動。
2.政策/技術/市場環境分析
政策
中國社會由熟人社會慢慢轉變為陌生人社會,信用風險和信用危機也隨之產生,加快信用體系建設迫在眉睫,然而,行政過程中尚未全面建立起「守信激勵、失信懲戒」的機制,《政府信息公開條例》雖然已對政務信息公開作出了具體規定,但執行過程中,政務信息的公開尚不全面,部分信用信息的缺失,削弱了信用信息的完整性,不利於形成准確的信用狀況判斷.
技術
其次,互聯網時代早已成為大家共識,企業和個人在網路上留下的大量數據,為徵信帶來了數據基礎,且隨著大數據,雲計算,人工智慧的發展,為智能化徵信提供了技術支撐。
市場
另外,我國市場經濟體制建立的時間不長,全社會信用意識和社會信用環境還比較薄弱。為爭取經濟利益而失信的行為時有發生。這既有信用意識淡薄的原因,也有失信成本過低的原因。徵信作為金融的一個重要組成部分,是風險控制的核心,隨著互聯網金融的快速發展,適應互聯網,大數據徵信模式也營運而生,也亟需建立完善的徵信制度來為徵信發展保駕護航。
3.國內外徵信模式
我國的徵信出於初級階段,目前國際上的徵信模式主要有以下幾種
a.市場主導型,美國,Equifa、Experian和TransUnion三大管理局按照市場經濟的法則和運作機制,並對外提供服務給貸款授信企業,英國是P2P的發源地,以Zopa為代表網路貸款平台根據風險和利率水平促成借貸雙方完成交易、使借貸雙方都共同獲益,在某種程度上發揮了信用中介職能。
b.政府主導型,德國,中國。以中國為例,主要是以政府主導,授權中國人民銀行徵信系統創建,收集,維護和整合全國部分企業和個人徵信,目前已經覆蓋了銀行機構,法院,電信,社保,小額貸款等機構數據,目前覆蓋個人和企業的數量上一直維持著增長勢頭,從2015年4月的8.64億自然人、2068萬戶企業及其他組織增加到2017年5月的9.26億自然人、2371萬戶企業及其他組織,中國大陸將近14億人,企業及其他組織數量也在不斷增加,徵信系統覆蓋范圍還有很大的增長空間,總體上來講,對企業的數據覆蓋度不夠,難以滿足當前各種創新的金融模式對企業徵信的需求。
c.行業協會共享,行業會員制,分享數據,並以行業協會為核心建立信用共享中心,加入協會的組織可以共享數據,並提供一定的數據支撐,以此擴大協會的數據源。
d.混合型,韓國、印度為例,以政府和市場混合,協同發展。
4.徵信產品模式
徵信行業的產品模式主要有按業務模式劃分的企業和個人徵信,按服務對象劃分為信貸徵信、商業徵信、僱傭徵信以及其他徵信,各類不同服務對象的徵信業務,有的是由一個機構來完成,有的是在圍繞具有資料庫徵信機構上下游的獨立企業內來完成。按徵信范圍可分為區域徵信、國內徵信和跨國徵信等。
5.徵信行業產業鏈
徵信產業鏈包括上游的數據生產者、中游的徵信機構及下游的徵信信息的使用者,其中中游的徵信機構運行模式主要有採集數據、加工數據及銷售產品。數據供應商主要包括銀行等金融機構、政府部門、工商企業和個人,幾乎涉及人們生活的方方面面。徵信機構從數據供應商處獲得數據通過一定的模型進行加工處理得到信用評級結果,然後進行服務輸出。徵信報告使用方主要有房地產商、招聘企業、P2P平台、金融機構等,多數發生在個人購房和購車、個人小額信貸、企業信貸、債券買賣等場景。
6.面臨問題
1.徵信監管和法律健全亟需提高,政府信息公開有待加強,徵信法律法規不夠完善;
2.數據處理演算法計算能力有待提高,隨著大數據與徵信的結合,對數據的處理,分析和建模能力提出了更高的要求,才能更好的挖掘出企業信息價值。
3.信用信息安全問題嚴峻,雖然國家一直在出台政策保護徵信數據,但個人,企業的隱私數據安全面臨十分嚴峻的挑戰,催生了巨大的黑色產業發展,由此帶來了金融詐騙,電信詐騙,網路詐騙,木馬病毒竊取隱私數據進行交易獲利等違法犯罪活動。
7.大數據徵信與傳統徵信的區別
1.覆蓋群體更豐富,隨著網路的普及和互聯網金融的大力發展,更多的人或企業將會留下數據到相關平台,擴大了徵信覆蓋的群體。
2.數據來源更廣泛,傳統徵信的數據來源比較單一,但大數據徵信會整合互聯網公開半公開數據,第三方機構合作數據以及自由數據,數據來源變得更加廣泛。
3.數據價值的深入挖掘,隨著大數據和人工智慧在徵信行業的運用,機器學習,NLP,文本抽取等技術對企業數據的挖掘更加深入。
企業信用數據的行業運用
1.信貸風控,金融的核心是風險管理,目前主要由政府信用公示機構,比如國家企業信用查詢網,中國失信被執行網,中國被執行信息網,法院網,信用中國等公開查詢數據,為信貸金融機構提供貸前,貸中,貸後的信息查詢,信用報告和監控等服務。
2.融資租賃,為融資租賃公司提供融前盡調,融後監控服務,提高工作人員效率,並通過集團化賬號系統深入各個業務部門,提升工作質量和效率。
3.信用評級,根據企業的工商,法務,新聞,經營,債卷等多維度數據,對企業進行信用評級,常見的是債券評級.
4.供應鏈金融,圍繞核心企業,管理上下游中小企業的資金流和物流,並把單個企業的不可控風險轉變為供應鏈企業整體的可控風險,通過立體獲取各類信息,將風險控制在最低的金融服務。
5.其他,比如招聘,商業調研和律所。
企業徵信的未來展望
1.數據共享
數據作為徵信和風控行業的核心資產,也是構建信用社會的基石,過分孤立或過分共享都不利於行業發展。所以,如何在實現共贏,保護隱私的基礎上做到數據共享,打破數據孤島,打通各個平台的數據通道,讓不同的數據匯集在一起,共同打造徵信體系,是未來的發展趨勢。
2.挖掘數據價值
隨著大數據徵信技術的不斷發展,徵信產品將從信息的初次挖掘向深層次挖掘發展。初次挖掘是指圍繞企業相關數據,通過自身爬取入庫,第三方API介面或數據合作等方法整合並進行數據匯總分類,並以信息報告,圖片等方式簡單羅列呈現。深層次挖掘是將收集到的數據與徵信專業知識相結合,構建風險識別與量化,規則引擎,企業關聯圖譜,數據可視化等產品,對數據進深度挖掘,從而深化徵信產品與服務,提高徵信產品的專業性。例如利用企業工商信息,建立企業關聯網路,當網路上某一企業出現負面信息時,能夠迅速識別風險並預警其他企業,並根據風險情況量化預警等級。
3.提供垂直,細分領域服務
隨著徵信市場規模的不斷擴大,部分徵信機構基於自身特點及優勢,開始出現專注於某一細分領域或某一業務環節提供具有針對性、定製化的徵信產品服務的趨勢。例如提供爬蟲技術,一站式爬取,清洗,整合和入庫;針對新聞的輿情監控服務;提供企業獲客服務,為金融機構篩選優勢客戶,實現精準營銷;提供企業金融服務,比如理財,融資,支付和信貸;提供C2B,B2B的股權投資撮合平台等。
B. 大數據在企業中的應用
大數據在企業中的應用
2015年9月10日,首席數據官聯盟成立儀式暨第一屆首席數據官大會在北大召開,本次活動由中國新一代IT產業聯盟和易觀智庫聯合主辦,中國新一代IT產業推進聯盟技術分委會秘書長魯四海發表演講並參與對話討論。本次對話環節由易觀智慧院副院長葛涵濤主持,參與對話的嘉賓有北大電子政務研究院副院長楊明剛、殼牌中國CIO徐斌、華為大數據總監劉冬冬、北京瀚思安信科技有限公司聯合創始人董昕。各位嘉賓從大數據在企業的應用、人才隊伍建設等方面進行深入討論,以下是對話實錄:
葛涵濤:首先我想請大家做一下自我介紹。
劉冬冬:今年上半年開始代表華為做大數據生態圈的建設,我們這個生態圈是1+6的模式,華為提供公有雲,大計算等服務,與數據挖掘,商業應用,數據可視化展示等合作夥伴,國內篩選200多家大數據公司,和比較核心的合作夥伴,開始了第一批,第二批,第三批的流程,第一批選擇16家簽約,第二批還有十幾家,今年年底會完成初步50家的合作夥伴的合作。
徐斌:殼牌品牌是比較大的公司,殼牌中國業務比較大,殼牌中國在今年已經是121年了,1894年正式進入中國了,就沒有離開。目前我們在中國的業務有上油的油氣的開采,中油的煉化等業務。大數據在殼牌的應用歷史比較悠久,我們開採油田的時候需要用海量的數據做分析,幫助我們在哪裡打井更有效,如何保證製造環節更順暢,更早的發現潛在的風險,這方面有比較多的應用。針對我們幾百萬的用戶,也在做很多的和社交媒體的合作,掌握我們的客戶,留住我們的客戶,尋找新的商業機會。今天很高興有機會和大家交流大數據,特別是我們傳統行業如何使用大數據。
董昕:謝謝大家,我們是瀚思大數據安全,一個新的創業公司。大家想安全和大數據有什麼關系?其實有非常深的關系,我們後面有機會再和大家講。我們這個團隊是2014年成立的,主要成員是來自於埃森哲、甲骨文等這些公司。我們致力於把大型企業雲中心、互聯網裡面所有跟安全相關的,跟業務、應用安全相關的數據做統一大規模的存儲、挖掘、學習和展現,幫助IT從業者,運維人員,甚至企業的領導層從數據終發現一些跟安全相關的東西。希望通過數據驅動整個行業,和整個企業實現由傳統的基於防禦的安全策略,轉向主動智能的安全策略。我們成立一年多,我們公里56人,40多個人都是研發人員,數學科學家等跟數據相關的人員。非常高興有機會和大家探討比較新的行業。
楊明剛:非常感謝主辦方的邀請,很多朋友可能了解電子政務,電子政務就是政府的信息化,還有所謂的智慧城市,還有數字城市。在過去一年多,一直做政府相關的信息化的應用,包括頂層設計。現在隨著大數據概念的提出以後,應用和需求在過去一直存在,只是提升了一個水平。電子政務這塊近兩三年提上很重要的地位。電子商務對大數據的需求也是蠻多的,過去三四年,我們一直研究政務數據和商業大數據,非常高興和大家探討數據和首席數據官未來在整個企業決策和政策決策中的作用。
葛涵濤:我們的各位嘉賓對大數據,對數據資產進行了前期的描繪和支撐。我們都知道現在大數據產品和數據產品數據來源非常廣,包括來自於智能設備,可穿戴設備,來自於金融,來自於終端設備。有了大量的數據,基於數據進行挖掘和分析,數據產品化以後,再將數據產品應用到業務中。但是這些數據產品安全性怎麼樣?針對數據安全和用戶數據隱私與大數據是什麼關系?
楊明剛:我先從價值方面跟大家分享一下。美國有一本書《數字化生存》目前這個社會,隨著網路的發展,我們所有的網路,所也的社會的形態都可以用數據來表達,這個時候無論是政務數據,還是商業數據,還是個人數據都可以用來提供,或者給我們未來決策提供參考。無論是政府治理,還是企業的科學決策,或者個人未來合理的消費計劃,都可以從數據中提取到相關的決策參考。所以這塊,其實所有的數據,看似雜亂無章,各種非結構數據和結構化的數據,通過適當的方法處理,或者通過數學模型處理,能夠給我們管理和決策帶來新的支持或者更大的支持,這是我對整個目前數字這塊所謂的資產,數據是可以增值的資產。
其實我們有了互聯網以後,每個人在網路上,無論是購物,還是通過社交工具或者社會化媒體發表相關的看法或者思想等,我們在網路上留下了大量的數字的網路痕跡,其實提取這些痕跡,包括相關的特徵,用一定的方法去分析,就可以找尋每個人或者相關的機構未來的表現。這個東西在這裡面,有很多東西涉及到個人隱私,可能在這里買的房子,或者附近相關的消費,根據你的社會屬性可以判斷你未來的行為。從某種行為來說,會讓我自己感覺很不舒服,但是這些信息是通過我們允許的放在網路上,只是相關的機構提取過來做一些加工,可能對個人的隱私或者個人尊嚴是一種挑戰。隨著國家立法的完善,我相信網路的隱私權保護會逐漸解決。
董昕:其實好惡誇張的說,我們在座的每一個人都不安全,在網路空間,無論是你產生的數據,還是你的痕跡,還是你的隱私,或多或少在自己的手機里,PC里,或者是伺服器端,安全和隱私可能是永恆的話題,比較大,我就不展開講了。從我們的角度來說,我們更關注的,從一個角度如何把核心的數據,核心的資產保值增值,安全隱私的問題。無論是大數據下面的數據隱私,數據安全,還是小數據的數據隱私和數據安全方法論是一樣的。在管理制度上怎麼進行保障?
過去談論到數據安全,更多的時候是靠技術手段為主,所以才會出現各種各樣的防火牆,加解密設備,數據防泄漏,防入侵。這些東西都有用,但是無法解決所有的問題。要不然也不會出現JP摩根信用卡數據泄漏等問題。我們需要擁抱新型的技術,新型的平台,通過技術本身解決安全問題。
另外一個國外很多報告中都寫到了,設備本身控制數據資產不太現實,我假設所有的東西都是不安全的,把所有的東西都放一個安全體系,這是國際探討的問題。我們怎麼用新型技術保護數據安全,同時結合技術,如何使安全管理的流程和措施,能夠在企業中獲得更多的認識,從而解決這個問題。
葛涵濤:關於數據能力開放的問題,在之前大數據會議上,阿里集團代表上講過,阿里的數據不開放,他們是不是有數據安全的考量。因為他們收購了高德等一系列的社交和位置的公司,掌握了用戶全維度的數據,這是出於隱私保護,基於安全的數據開放,還是比較遙遠的話題。剛才我們在CDO調研報告裡面,在未來的數據業務和大數據技術方向上,在行業領域裡面的發展是非常重要的,我想請劉冬冬和徐總分別談談,比如說大數據業務,還有數據資產等等相關的技術和服務,在你們相應的通訊和能源行業怎麼與你們的業務結合落地的。
徐斌:像大數據的應用,在我們自己的傳統行業會產生什麼樣的作用?我們自己內部把大數據的企業進行劃分。從企業決策中大數據起了很多的作用,同行用爆破的方式採集信息,幫助我們判斷出這個地方打一口井效率是不是高,因為每一口的井的成本是上百萬的,提高10%的成功率是很可觀的,這是決策支持。
第二個是運營優化,比如說油站地下油庫存在非常大的隱患,汽油和柴油泄漏的時候,一對環境造成很大的風險,第二對地下水有影響,甚至產生爆炸。一旦發生這種情況,通過大數據技術能不能提前發現潛在的泄漏風險。通過對比站的分析,提前發現是否存在不適當的損耗的發生,從而發現風險。
第三個就是市場營銷,在我們消費互聯網層面談了很多,我們怎麼樣找到客戶的特性,延伸業務領域,包括業務合作。另外通過合作,找到我們潛在的客戶。像今天的孫總,我們客戶最典型的,對油品的質量要求比較高。我們從互聯網找到這個維度,在電商上購買率很高的,經常談到汽車的,這兩個碰撞就能找到潛在客戶。
第四個就是企業安全進行風險管控。能源行業是高危行業,包括油品配送過程中,配送的時候出現問題,可能出現爆炸的風險,包括成本的增加。因此我們在海外作業的時候,不能很好及時發現風險,可能造成重大的人身傷害,包括知識產權的保護,有跟多配方,這是很關鍵的,這個怎麼防止黑客攻擊。這個和董總有相關性,企業安全,人身的安全,包括信息安全。
第五是業務創新,第六是模式變革。這兩個把我們傳統的,我們通過賣汽油變成我們可能變成第三方汽車服務後市場。以後我們油品可能免費,免費的意義在於盈利模式通過後面衍生的新業務,就是羊毛出在豬身上狗來買單。這就是大數據在我們能源行業6方面的價值。
葛涵濤:我們原來做過石油遠程管道安全監護。現在俄羅斯他們傳輸的油氣管道,很多油氣管道每隔多少公里就有檢查油壓、溫度,還有油管表面的狀況,加入了很多感測器,獲取管道表面的數據,另外還有相應的機器人,會在軌道上定期巡邏,用光來檢查表面的狀況。將這些數據全部匯總在當地的數據中心,最後匯總到歐洲數據中心,如果正常就顯示為綠色的。大數據幫助能源運輸企業,在你發生問題之前就幫你預測問題即將在什麼時間大概發生。在發生之前進行預警,我覺得這個也是大數據跟商業智能整合的非常好的一個案例。
徐斌:在我們石油行業,特別是化工行業,生產行業一旦有一些事故終止生產,想恢復是非常長的時間,一般是三個月,三個月損失多大。越早預測到危險,提前採取措施,效率是很明顯的。
劉冬冬:我們通訊行業跟石油行業是很像的。我們華為也會裝各種各樣的感測器採集數據,知道什麼地方有什麼問題,然後解決問題。比如說一個大型會場,一個足球場,數萬人,大家都在發微信,這個時候能不能發出去,信號如何?這是我們自身運營商的應用場景。衍生出來的應用場景,如果華為或者運營商更早的把大數據應用到企業的經營管理等等各個維度中去,就不會發生像上海那樣的踩踏事件。當外灘單位面積內聚集的人口超過一定量以後就應該有一個預警,告訴相關的管理部門,公安也好,告訴相關的部門人說這個地方已經超多了,通過手機我們可以捕捉這個信息。我們在大數據行業剛剛起步,我相信將來所有的行業,都會面臨變成以數據為驅動,或者以數據為核心驅動力的,而不是像以前以產品為驅動力,以渠道或者品牌為驅動力的。以數據為驅動力的話,這個問題是蠻大的,作為華為來說,現在從各個方面改為以數據為驅動力。從宏觀來說,我們將要做什麼,我們要做哪些產品,這些都可以通過數據給我們進行指導。
在大數據產品裡面,哪些是最需要的,哪些是最急迫的,我們可以通過分析挖掘出來,這個可以指導我們企業將來做什麼,不做什麼。從很小的細節來說,華為2016年找誰做手機形象代言人,我們可以用大數據做。華為手機的粉絲超過100萬。這些人共同關注的是誰,他們共同興趣愛好是什麼?他們每天什麼時間上網,數據的統計就告訴我們了,不需要決策部門每天坐在一起拍腦袋決定是誰,不是誰。剛才說到數據安全問題,我認為數據安全和技術是矛和盾的問題。現在接受就可以了,當我們現在收到騷擾簡訊垃圾簡訊,為什麼會收到,是因為他們掌握了我們手機信息。當企業掌握了很多的信息以後,這時候就造成可以滿意度的問題,讓數據決定數據安全,讓市場決定技術到什麼程度,自然會有優勝劣汰,服務好的企業就會持續發展,服務部好的企業就會死掉。
葛涵濤:我們對用戶數據掌握的越來越多,我們對數據精準分析越來越多,我們傳遞出來的消息就是精準營銷,傳遞的信息就是有用的信息,而不是垃圾信息。這實際上對我們大數據企業,對技術和演算法提出了更高的要求。如何通過大數據分析方法尋找數據中隱藏的,還沒有被發現的價值和知識。
楊明剛:其實所謂大數據,大價值,大數據應該不是大忽悠,我為什麼這么說?因為我在過去一段時間,有一個地方政府,某一個行業部門在使用大數據,但是建完的大數據系統無法滿足他們的業務需求。我們傳統的大數據,一部分是對現有數據的發現,這就是數據檢索,傳統的數據方法就可以做到,對已知的東西,已知的問題,每個數據單元都是了解的,這時候無論是結構化數據,還是非結構化數據,我們可以帶著問題找到蛛絲馬跡,問題存在什麼地方。另外一部分應該是預測的部分,就像海爾孫總談到的問題,其實可以預測。業務管理專家和業務模型建構專家需要有一個緊密結合。大數據其實是一件奢侈品,對華為這樣的產品,對我們海爾這樣的企業,對殼牌這樣的企業是可以投得起資金的,大數據是奢侈品,但是絕大部分的中小企業也需要科學決策,也需要了解市場需求,這時候面臨很重要的選擇,要面臨高昂的成本建立系統,這是不可能的。但是絕大多數的大數據企業都需要高投資,中小企業怎麼通過在數據時代不被淘汰,需要大數據解決方案提供商,或者需要大數據研究者提供一種更典範的,或者更普世的大數據解決方案,不是依託與傳統的數據檢索,或者傳統的數據包裝實現大數據的方案,而是需要跳出傳統的大數據分析方法之外,能不能有另外一種更科學,更普世的方法,讓我們很多中小企業都能享受到當今的大數據服務,需要我們在座的一起探討。實際上個人也需要大數據服務。
葛涵濤:跟簡單,更方便使用的大數據產品,方便企業減少這方面的預算,讓更多的人使用大數據帶來的便利。
楊明剛:中國的天氣預報部門利用大數據是最好的,把過去一百多年的歷史數據拿過來進行預報。真正的大數據是對未來可能的知識的發現,通過大數據發現潛在的數據之間的關聯。
葛涵濤:實際上我們剛才提到了各個不同的行業和企業對大數據的應用,因為你在北大做了十年CIO方面的培養,你們對CDO這方面的人才培養有什麼樣的動作和支持。
魯四海:我們也在探討,剛才我們在PPT裡面分享,首先為什麼會有這樣的角色存在,驅動力是什麼?然後再說需要什麼楊得技能?我覺得CDO有一部分的東西需要從課堂學習的,偏技術這塊的,能涵蓋技術和基礎管理這塊。CDO需要有一些經濟學的基礎在裡面。大數據更大的是告訴我們未來是什麼樣,告訴我們一些未知的東西。不是提一個假設,拿數據進行分析證明這個假設是對的或者是錯的,這個意義不大。真正的意義能夠告訴你未來是這樣的。我覺得CDO在培養過程當中,除了課堂學習以外,還要跟內部的業務部門進行內部的學習和交流。因為我們面臨著未知的世界,更多的需要廣闊的舞台,像CDO聯盟一樣,未來我們做一些交流性的東西,各個行業,不同行業的方式方法進行跨界整合,因為數據在這個時代就是跨界。
葛涵濤:下面我們請我們在座的各位嘉賓,用簡單的一兩句話展望一下大數據時代下,我們這些數據管理人才,CDO們如何在整個大數據背景下做好我們的工作,能在工作上出新出彩,在我們業務設計上有相應的業務創新。
魯四海:應該說任何一個行業任何一個企業的數據都是資產,每個企業都將擁有將數據變成核心競爭力的能力,這個能力可能是自建也可以購買服務獲得。
楊明剛:大數據應用成為未來決策的核心推動力,今天的大數據不能成為大忽悠。
董昕:我們談了很多技術方面的話題,我覺得一個CDO第一應該有大數據的理念,未來主要的價值都是數據。另外一點,我們認為作為一個CDO,一定要跟我們業務相聯系,懂我們的業務,知道我們的收入從哪裡來,成本在哪裡,效率從哪裡提升,這樣CDO才能落地。
徐斌:數據本身有沒有價值,我個人認為數據是沒有價值的,雖然我今天講了很多大數據。只有當數據能幫助企業產生價值的時候才能成為有價值的資產。我經常說數據資產,每個公司都有大量的數據,他們不是資產,因為它沒有用。數據只有成為有用的信息,成為知識,變成智慧,它才是真正的數據資產。不要神話大數據,大數據產生業務的價值,產生商業的價值才叫大。第二我們企業有CDO,或者有虛擬CDO職位,通過其他的CIO、CMO承擔。最主要的是腳踏實地,循序漸進,如果你不把企業的數據用好,談何大數據。如果企業沒有從數據支持決策的文化,大家做任何事情不用客觀數據幫我們做分析,給你再多的數據也沒用。首先是企業文化。第二把現有的數據用好,然後循序漸進引用更多的數據做分析。通過數據發現未知東西,這是偽命題。因為你發現未知東西,因為你不知道,原因是什麼。當形成智慧知道為什麼會發生,這是我們追求的目的,只不過我們現在不知道,所以通過相關的分析找到了相關性,但是不知道原因。未來當我們有足夠多的知識積累,我們就知道原因了。未知領域是大數據的使用階段。
劉冬冬:大數據這塊沒有找到盈利模式,沒有找到市場,推不動。現在大家找到了盈利模式才推下去了,這才是有用的,大數據有用才是硬道理。對於CDO來說,我認為跨界才是最重要的。不光要有知道企業內部的小數據,同時也要知道外部的數據如何和企業內部的數據相結合。比如說做銷售的,系統能不能很快的告訴員工,這個公司銷售額有多大的產能,以及其他合作公司等等的情況,有價值才是最重要的。
以上是小編為大家分享的關於大數據在企業中的應用的相關內容,更多信息可以關注環球青藤分享更多干貨
C. 京東分享 企業大數據的新認識與應用
京東分享:企業大數據的新認識與應用
大數據和我們每個人日常生活已經非常緊密地聯系在一起了。
隨便舉個場景的例子,比如說,早上醒來的時候我通過智能手錶的數據,發現昨晚的睡眠質量並不是太好,早上洗臉刷牙吃過早飯,步行1000多步來到六道口地鐵刷卡坐地鐵,兩站3塊錢到達奧林匹克公園,在地鐵上我通過京東手機客戶端發現一雙我之前瀏覽過的Nike籃球鞋降價了,京東將這條商品信息主動推送過來,我立馬下單購買,節省了100多塊錢,並且我把這條信息通過微信分享到了朋友圈。
在這個過程中,我個人生產了睡眠數據、步行距離數據、地鐵刷卡消費數據、地鐵起點終點地理數據、京東購物數據、微信朋友圈數據,所以作為大數據生產者我一下子生產了這么多數據。而作為大數據消費者,在我以後瀏覽京東商城或app的時候,系統可能會向我推薦改善睡眠智能的枕頭、籃球鞋或與籃球鞋相關的其他商品,而我朋友圈的朋友看到我的分享信息後,他們也可能因為我的分享而去購買。
而我們生產的這些數據,企業尤其是互聯網公司拿到後,通過數學統計和挖掘的演算法將其進行聚類、拆分和預測得到更多相關數據,通過這些數據對我們每個人進行標簽化的描述。如性別,婚姻狀況,興趣愛好,收入情況,是否喜歡運動,促銷敏感度等等,這樣就得到了我們每個人的很多屬性,如人口基本屬性、購買能力、行為特徵、社交網路、心理特徵、興趣愛好等等。
企業掌握了這些數據之後,他們如何來利用這些數據呢?是通過這些數據來做營銷,如精準營銷,廣告的精準投放,商品的精準推薦?還是通過這些數據精細化企業內部運營管理?又或是通過這些數據改善生產工藝流程、指導產品的二次研發?那就看企業大數據修行的層次了。大數據應用的好,可以真正提升到戰略高度,用的不好,大數據也就是錦上添花,可有可無的東西。
按照數據挖掘的聚類思維,企業數據可以分為內部數據和外部數據,內部數據又可以簡單分為財務數據和供應鏈數據(大供應鏈概念)。當然不同行業的企業經營內容差別很多,如金融行業,涉及到投資、融資、現金管理等財務方面可能多一些,涉及到供應鏈很少,而生產製造或流通服務行業,涉及供應鏈的數據就會多一些。
財務數據主要是以財務報表,尤其是財務發布的三大報表為主,資產負債表、利潤表以及現金流量表。之後是總帳,總帳裡面記賬會涉及到科目、科目不夠用我們也會設置輔助核算,還有大多企業每年都會做預算,預算大多也是圍繞財務指標制定的,或者是以財務預算為主倒推業務預算。當然財務管理中其中一大塊還有資金管理。
供應鏈的數據種類就會更多一些,從供應鏈上游的供應商到下游的消費者,包括采購,倉儲,物流,生產,銷售,售後等數據。當然每個環節我們還是可以再進一步去細化。
另外,相信沒有一家是自己關起來門來做生產,做營銷的,都要積極地去參考外部數據,這其中就包括國家政策、經濟環境、股市行情、競爭對手、主要原材料價格等。
大數據整體架構大多數企業應該實施了BI系統或報表自動化系統,如果這些系統是由乙方單位負責規劃建設,他們在規劃或者實施過程中制定的系統方案架構圖無非就是分三個層次頂多四個層次。
從下往上說,第一個層次元數據層或者數據源層,就是我們業務應用系統的數據,財務,供應鏈,人力資源,預算等等。
第二層次叫做大數據存儲層,就是把下面每個層次的數據源採集到一個數據倉庫裡面去,之後就到了第三個層次,分析模型層,基於數據倉庫構建分析模型,有的方案甚至將分析模型層直接省略掉,直接到了最後一個層次數據展示層,將分析模型中的數據展示出來。根據筆者多年從業經驗,這樣的組織形式頂多稱之為BI系統,還不能稱之為大數據系統。
京東大數據並不是一個單獨的系統或產品,京東大數據應用已經融入到每個業務應用系統當中了。我們的大數據採集平台在不影響系統或產品效率以及客戶體驗的前提自動將所有數據定時、實時採集到Hadoop平台上,以大數據平台為核心,將經過加工、處理、分析和挖掘後的結果分發後各個業務系統以及數據產品中,如商城、采銷、數據羅盤、領航等。下圖僅供參考:
企業大數據應用層次不是每家企業都是京東,也不是每家企業都是互聯網公司,不是每家企業的業務都必須需要大數據的支撐。在滿足自己業務需求的前提下,企業是不是也能玩一玩小數據應用呢?答案是肯定的,大數據應用也是可以分層次的,每個層次滿足企業對數據不同層次的需要。大致分為5個層次,每個層次是逐級遞進的關系。
1.業務監測
這是大數據應用的初級階段,即傳統的DW/BI階段。在這個階段,企業部署商業智能(BI)解決方案,其實就是一套自動化報表系統,用以監測現有業務的運行狀況。
業務監測,有時也被稱為業務績效管理(Business Performance Management),指企業使用基本的分析手段,來預警業務運行低於或高於預期的情況,並自動發送相關警示信息給相應業務和管理人員。企業業務和管理人員可以根據之前制定的預警規則,提前掌握業務經營情況,實現提前預警,幫助他們有針對性、有預見性的採取一些措施和手段,來防範於未然。
這個階段最關鍵有兩個要點,一個是預警規則的設計,經常採用的方法包括參照方法(同期比較、同類營銷活動比較、同業標桿比較)或指標方法(品牌開發、客戶滿意度、產品績效、財務分析),指標分析法就是選擇合理的指標,當然這里合理指標的選擇說起來容易,其實做起來也要費一番腦筋的,給大家舉個我之前碰到的例子,當時是給一個做離散製造的企業做方案設計,他們在庫存管理方面績效考核一個非常重要的指標就是存貨周轉率或存貨周轉天數,這本來是一個非常正常也是經常使用的指標,但是這家單位的庫存管理存在假出庫、假入庫的情況,這種情況就造成了存貨周轉率這個績效指標看起來非常好看,後來我們經過考慮改用動銷比,存銷比作為指標,將庫存指標和銷售指標聯合起來組合使用,就避免了假出庫、假入庫的情況。舉這個例子的目的,就是想說明我們在做業務監控的時候,指標選擇很重要,既要准確、公正地反映出該塊業務運營情況,同時還要避免人為造假的情況。
2.業務洞察
業務洞察意味著系統不只是提供數據報表,而是「智能」報表或「智能」儀表盤,需要根據歷史數據進一步預測、挖掘出我們通過前面多維分析還不知道的一些數據了。
比如說,筆者以前在給杭州某家連鎖酒店做項目的時候,我們需要根據該酒店在全國范圍內投資過酒店的經營情況數據來做些更好玩的東西出來,如我們需要根據之前投資過的酒店的裝修投入情況,不同檔次當前出租率,酒店餐飲部門的上座率和翻台率,營業收入,成本費用以及當地城市競爭對手酒店情況來預測新投資一家酒店的投資回報率和投資回收期。另外,還有就是財務分析中經常會用到的杜邦分析,簡單說下杜邦分析,杜邦分析就是從財務的角度對整個企業財務績效情況進行綜合分析的一個模型,他基本原理就是頂端是ROE,針對ROE我們可以分解為ROA×權益乘數,ROA又可以分為銷售凈利率×資產周轉率,之後再次分解,最後成一個全是財務指標的樹形結構。由於這些財務指標都是通過財務報表項目,會計科目和輔助核算計算出來的,所以他們之間存在著非常緊急的邏輯關系,這樣的話,我們可以計算一些技術手段實現模擬預測,如做下一年預算或規劃的時候,想讓某些財務指標達到什麼水平,我們事先將其進行調整,和他相關的指標也會聯動,比如將凈利潤提高1%,銷售收入、營銷成本、管理費用等其他指標就需要達到什麼程度?這樣可以幫我們做到事先預測,更好地做規劃和預算。
當然這個階段可以做預測的還有很多,比如零售行業,大多品類的銷售是有銷售周期的,基於銷售周期我們可以對銷售進行預測。也可以根據歷史用戶對不同營銷方式的響應程度、營銷費用、營銷商品以及營銷效果之間的關系,較為准確的鎖定目標人群進行有針對性的營銷,提高營銷效率,降低營銷成本。
3.業務優化
業務優化對於絕大多數企業來說還是很具備吸引力的,這也是很多企業日思夜想的目標。其實在這個階段我們可以一步步來,一點點來做,至少企業是有能力將分析技術嵌入到業務運營之中。這里舉個我們之前給傳統企業做過一個案例,像大多數企業一樣, 這家企業也有ERP系統,在采購環節,我們可以將供應績效模型引入進來,當然這個供應商績效模型可能要考慮的因素會比較多,如供貨質量、供貨效率,次品率,售後服務等等很多因素,采購人員在進行采購的時候可以根據供應商績效模型自主選擇合適的供應商,這是一個例子,另外還可以將主要原材料的市場價格進行實時接入到采購界面,讓采購管理人員可以自己掌握采購周期,合理安排采購計劃。
在零售行業我們都知道,商品和商品之間,用戶和用戶之間,用戶和商品之間是存在著很強的關聯關系,就像大夥常說啤酒和尿布的例子,巧克力和避孕套的例子。這里可以大家稍微說下,大多電商是怎麼做的,我們通過這些商品在被購買的記錄中找出每兩個商品之間的關聯關系,這種關聯關系並不是對等的,比如說購買了手機的用戶一般也會同時購買手機殼,而買手機殼的人不一定也買手機,這就說明手機和手機殼之間是有關系的,而且是強關系。手機殼和手機之間關系是弱關系,這里關系的強弱我們用系數來說明。所以商品和商品之間的這種關系,我們就形成一個商品模型。基於這個商品模型,我們就可以更好向用戶推薦他瀏覽過、購買過、收藏過、評論過的商品了。說完商品,我們再說用戶,用戶通過類似的瀏覽行為,搜索行為,評論行為以及購買行為,我們可以找到用戶和用戶之間的關系。基於用戶之間的行為關系,我們可以向用戶推薦其他和他相關度很強的用戶購買或感興趣的一些商品。這也就是好多互聯網公司做廣告推薦,商品推薦,促銷信息推薦等常用的做法。
4.數據盈利
數據盈利也就是我們經常談到數據變現,數據盈利的一種方式就是數據產品化。目前有很多數據服務類公司,可以採集到移動端游戲, app使用情況,用戶行為等數據,通過他們數據挖掘和分析的技術,再通過產品或服務的行為進行輸出即可實現變現的目的。另外,手機廠商,如小米、華為等,他們都擁有幾億的活躍用戶,掌握一手用戶在手機的行為數據,甚至包括支付數據。能變現的方面就有很多了,限制他們的就是他們的想法了。另外也越來越多的傳統廠商將產品數據化了,如汽車+大數據 變成了特斯拉,家居+大數據變成了智能家居,當然這里能舉的例子還有很多。
5.業務重塑
業務重塑應該是大數據成熟度模型的最高階段。在這個階段,某些企業希望利用對客戶使用方式、產品效能行為及總體市場趨勢的分析,將商業模式轉換到新市場的新服務,例如:京東的新開展的業務,京東金融、京東智能。此外,我們可以發揮一下想像力,BAT有哪些業務是以主營業務數據為基礎開拓出來的,是不是能想到很多?
中國乃至世界真正擁有大數據的企業不多,我們是幸運的,擁有電商全價值鏈的大數據,如何挖掘這座金礦?限制我們的只有我們自己的想法。
以上是小編為大家分享的關於京東分享 企業大數據的新認識與應用的相關內容,更多信息可以關注環球青藤分享更多干貨
D. 什麼是大數據的40頁ppt免費下載
不要用設計模板,用修改背景的方法1、在幻燈片空白地方單擊右鍵選擇背景,可以選擇填充效果 2、在填充效果立選擇你需要的圖片背景或者其他 3、最後選擇全部應用就可以了
E. 企業如何應用大數據分析
企業應用大數據分析就要藉助一些數據分析工具,比如商業智能軟體FineBI,有了工具就專等於完成了一屬半。一般數據分析工作可分為以下三個步驟:
1、明確業務需求
按業務驅動的角度,了解業務部門需要解決什麼樣的問題,業務范圍是什麼,所要達成的效果又是怎樣,依據這些需求來實施部署商業智能工具。
2、數據結合與關聯
由於企業數據海量的特點和多元化的結構形式,需要商業分析工具具有海量的數據探索和分析能力,能夠實時有效的與已有數據結合,產生精確的行動方向。
此外,企業數據的價值最終體現在客戶的消費上,因此,對於能直接產生價值的數據要和客戶關系和交易數據進行結合和關聯,從而做出直接導向效益的決策。
3、培養數據分析人才
企業的數據分析,商業智能系統的部署是關鍵,但業務人員數據分析水平也同樣重要。這就要求人員在信息過程管理當中要逐漸培養科學化管理數據的意識,企業上下也要統一共識,從而形成對企業數據的綜合管理。