『壹』 大數據未來的發展前景怎麼樣
現狀大數據的前景十分的好,隨著大數據應用於各行各業,並正在改變運鎮著各行各業,同時也引領大數據人才的變革,在國家及當地政府支持下,大數據在快速發展,企業日後發展將旁蠢粗基於大數據計算分析、數據挖掘、數據分析等數據產業的發展,我國也將更加需要檔州更多的數據人才。
『貳』 大數據市場未來將呈現三大發展趨勢
大數據市場未來將呈現三大發展趨勢
隨著移動互聯網、物聯網等的迅速發展,新數據源不斷出現,而中國數據總量的不斷增長,使大數據成為一種重要資源,有利於推動零售、旅遊、醫療、金融、電信、政府公共服務各個領域的業務創新。
大數據轉變企業商業模式
來自於線下大數據市場(IT企業的大數據應用及大數據平台業務市場)中IT巨頭和單一大數據業務的廠商開始行動,優化產品和服務路線圖;線上大數據市場(互聯網用戶數據市場,以及以互聯網金融為主的線上金融市場)的成熟度逐漸提高,以金融和零售為核心的線上大數據應用走向成熟,市場體量進一步擴大。企業著力培育數據資產,積極探討數據變現,行業大數據多集聚、少融合。
大數據產業鏈整體布局完整,但局部環節競爭程度差異化明顯。數據採集環節,綜合型大數據源市場處於結構化整合階段,垂直型大數據源市場處於布局階段;數據存儲和數據挖掘環節市場結構穩定,國際巨頭壟斷,寡頭格局已經形成,國內企業短期內很難超越;數據應用環節是國內企業的機會,但技術仍不成熟。
各環節產業鏈正在影響企業商業模式的轉變。模式一:利用存儲能力進行運營,滿足企業和個人面臨海量信息存儲的需求;模式二:對數據進行挖掘分析後預測相關主體的行為,以開展業務;模式三:直接進行信息租售或提供信息租售平台;模式四:IT服務提供商提供大數據空間出租模式,通過出租一個虛擬空間,從簡單的文件存儲,逐步擴展到數據聚合平台;模式五:針對企業需求,為運營某一環節或某一業務問題提供解決方案,實施單點技術,例如向零售商提供大數據分析技術,獲得營銷點子;模式六:針對企業系統需求,提供整體解決方案;模式七:BDaaS (Big data as a service),數據應用即服務的模式,通過雲服務提供在線大數據技術或者解決方案。
根據易觀智庫2014年中國大數據市場行業投資結構數據顯示,金融、通信、零售為前三大行業,投資佔比分別為16.0%、15.6%和13.9%。政府、醫療、旅遊投資比例分別為12.7%、9.0%和4.1%。六大行業累計佔比71.3%。其他行業包括教育、製造、能源、媒體、互聯網等,累計佔比28.7%。大數據產業集群逐漸形成,即針對企業而言,以雲端大數據集聚為前提條件,以行業雲服務為平台,共享企業間核心競爭力。
大數據市場三大趨勢漸顯
大數據市場未來將呈現以下發展趨勢:
其一,數據生態系統復合化程度加強。大數據的世界不只是一個單一的、巨大的計算機網路,而是一個由大量活動構件與多元參與者元素所構成的生態系統,終端設備提供商、基礎設施提供商、網路服務提供商、網路接入服務提供商、數據服務使能者、數據服務提供商、觸點服務、數據服務零售商等等一系列的參與者共同構建的生態系統。而今,這樣一套數據生態系統的基本雛形已然形成,接下來的發展將趨向於系統內部角色的細分,也就是市場的細分;系統機制的調整,也就是商業模式的創新;系統結構的調整,也就是競爭環境的調整等等,從而使得數據生態系統復合化程度逐漸增強。
其二,數據管理成為核心競爭力,直接影響財務表現。當「數據資產是企業核心資產」的概念深入人心之後,企業對於數據管理便有了更清晰的界定,將數據管理作為企業核心競爭力,持續發展,戰略性規劃與運用數據資產,成為企業數據管理的核心。數據資產管理效率與主營業務收入增長率、銷售收入增長率顯著正相關;此外,對於具有互聯網思維的企業而言,數據資產競爭力所佔比重為36.8%,數據資產的管理效果將直接影響企業的財務表現。
其三,產業核心要素的掌控者主導數據生態體系。數據生態體系中的核心環節是產業的核心要素,例如電商的支付、物流、信息(信用)。掌握產業核心要素環節的企業若順勢而為,把握大數據時代的機遇,將企業自身的核心競爭力優勢進一步釋放,運用互聯網思維,通過產業核心要素的大數據掌控數據生態的主要生態鏈,從而最終實現在數字經濟時代的再一次騰飛。
大數據應用推動各行業發展
進一步通過數據驅動經營和營銷,各零售企業會以會員為核心進行管理優化,通過以人為中心的數據驅動,實現決策優化及精準營銷。行業會探索越來越多的大數據營銷新模式,各類零售企業會積極嘗試新機會,如微店等,尋找消費者偏好的新潮流。不斷豐富外部數據源,在企業自身線下數據採集能力不斷提高的同時,與更豐富的外部數據源合作將快速提升營銷的精準度,包括權威市場研究機構、領先互聯網巨頭等。
旅遊大數據的應用,是盡快建立數據統一化標准,建立統一數據交換標准,區域旅遊數據一體化,全國旅遊數據一體化。實現大數據的三屏統一(旅遊監管大屏、景區公告大屏、遊客手機屏)。
通過利用醫療服務的EHRs數據、醫院與醫保的結算與費用數據、醫學研究的學術、社會、政府數據、醫療廠商的醫葯、醫械、臨床實驗數據、居民的行為與健康管理數據、政府的人口與公共衛生數據、公共社會經濟生活中網路產生的數據等方面,為醫療行業的葯品研發、疾病治療、公共衛生管理、居民健康管理、健康危險因素分析提供精準數據支撐。
在傳統金融運作模式下,金融機構評估消費者的信用狀況、消費能力、消費意願的能力不強,導致部分金融領域產品服務定價過高,部分領域成為剩餘市場,這與實際的金融要求還存在一定差距。大數據將有助於推動金融和銀行產業中的數據聚合,基於產業整體數據挖掘價值,推動產業的發展,推動業務模式的創新。金融業大數據目前應用的主要價值在於金融風險管理、消費智能、智能運營等。
電信企業從傳統數據時代走向大數據時代。由於電信企業生產運營所需,自身生產管理系統已經具備海量以客戶為中心組織的統一的視圖數據資源。大數據可為電信業提升網路服務質量,增強管道智能化;更加精準的洞察客戶需求,增強市場競爭力;升級行業信息化解決方案,提升客戶價值;提供數據安全服務,在大數據市場建立差異化競爭優勢。
大數據不僅是一種海量的數據狀態及其相應的數據處理技術,更是一種思維方式,一項重要的基礎設施,一個影響整個國家和社會運行的基礎性社會制度。它是治理交通擁堵、霧霾、看病難、食品安全等「城市病」的利器,更將為政府打開了解社情民意的政策窗口,打造平台的政府、服務導向的政府、開放的政府,即智慧政府。其應用價值是:加強統籌規劃,優化大數據形成機制;加強數據收集和信息感知,提高智慧城市感知水平;推進大數據應用,提高經濟社會智慧化水平。
以上是小編為大家分享的關於大數據市場未來將呈現三大發展趨勢的相關內容,更多信息可以關注環球青藤分享更多干貨
『叄』 自學大數據難不難,就業前景怎樣
任何知識自學都是比復較困哪的,首先很制多人因為無法堅持而半途放棄,含有就是遇到問題無法解決而產生厭學情緒從而放棄。當然自學也有成功的,但確實少之又少,所以最好還是參加培訓。
目前很多公司都在招大數據相光崗位,向網路,騰訊,華為都在招,而且工資基本都在10K以上的。所以學了大數據基本不愁找工作!
『肆』 大數據快步邁進實用門檻
大數據快步邁進實用門檻
近年來,深圳出入境檢驗檢疫局依託大數據、物聯網、雲計算等新興信息技術,打造「智慧口岸」。圖為食檢中心的工作人員在處理抽檢食品的檢驗數據。
寧夏吳忠市供熱公司打造信息化供熱平台,通過對供熱管網能耗、室內外溫度、用戶需求熱量等進行大數據分析,實現了傳統粗放式供熱模式向精準供熱的轉變。 新華社記者 王 鵬攝 新華社記者 魯 鵬攝
鏡頭一:「傳統唱片公司選擇線上直播演唱會,不僅是為了增加傳播渠道。網友預定演出時留下自己的QQ號,通過數據挖掘,我們就可以知道某個藝人歌迷的地域分布,最喜歡聽什麼歌,關注什麼新聞等。有的公司據此調整了藝人線下演唱會的安排。」騰訊視頻live music音樂總監鄧林海說。
鏡頭二:互聯網服裝品牌裂帛副總裁大禹說:「柔性供應鏈的底氣就是大數據,我們投入3000多萬元開發了一整套系統,能隨時看到任何一個品牌某一天某個品類的價格、售罄率,以及自己品牌服裝的毛利率和消費者反饋,這樣每單只要下300到500件,然後根據預測不斷快速翻單。」
鏡頭三:2015年12月底,《關於認真做好2016年春運工作的通知》中特別提出,要探索利用大數據分析旅客出行規律,創新春運組織,提高服務品質,使廣大旅客不僅「走得了」,還要「走得好、走得滿意」。
這些都是大數據在垂直行業中的創新應用,而在2015年這個「大數據元年」,類似的應用不勝枚舉。這一年,頂層設計出爐,《促進大數據發展行動綱要》發布,「十三五」規劃建議中明確提出實施國家大數據戰略;這一年,交易體系逐漸形成,貴陽大數據交易所掛牌運營,各地紛紛跟進;這一年,大數據應用更是「生根開花」,來自市場研究機構IDC的報告顯示,2012年中國總體數據量佔世界的13%,而到2020年將提高到21%。這些數據正在釋放能量。
《2015年中國大數據發展調查報告》顯示,2015年中國大數據市場規模達到115.9億元,增速達38%。中國銀行[0.00% 資金 研報]副行長朱鶴新表示:「大數據在我國已具備了從概念到應用落地的成熟條件,迎來了飛速發展的黃金機遇期。大數據將在打造社會治理新模式、經濟運行新機制、民生服務新體系、創新驅動新格局、產業發展新生態等方面發揮重要作用。」
「游戲規則」漸成體系
在2015年兩會上,騰訊董事會主席馬化騰的一份建議有關政府數據開放,他表示:「公共數據的開放成為數據基礎設施的基石,相互連接和數據共通的重要渠道,當務之急是打破各領域的信息孤島,推動全社會對信息資源的開發利用。」不到一年的時間里,這一「瓶頸」正隨著「游戲規則」的快速建立得以突破。
在諸多游戲規則中,提綱挈領者自然是國務院2015年9月發布的《促進大數據發展行動綱要》(以下簡稱「《綱要》」),這一頂層設計被視為解決政府數據開放共享不足、產業基礎薄弱、缺乏統籌規劃、創新應用領域不廣等一系列問題的「抓手」。拿政府開放數據來說,《綱要》提出,2017年底前形成跨部門數據資源共享共用格局;2018年底前建成國家政府數據統一開放平台,率先在信用、交通、醫療、衛生、就業、社保等重要領域實現公共數據資源合理適度向社會開放。國家信息中心信息化研究部副主任單志廣認為:「這體現出政府促進大數據開放與共享的決心。」
綱舉目張,2015年也由此成為各部委和各地政府的「數據開放年」。農業部在2015年底發布的《關於推進農業農村大數據發展的實施意見》中提出,「農業部各類統計報表、各類數據調查樣本和調查結果、通過遙感等現代信息技術手段獲取的數據、各類政府網站形成的文件資料、政府購買的商業性數據等在國家農業數據中心平台共享共用。」在地方,北京、上海、佛山、青島、貴州等多個省市的數據開放平台已紛紛上線,拿上海來說,目前已初步建立實有人口庫、法人庫、空間地理等三大基礎信息庫,累計編制資源目錄數1.1萬條、數據項14.58萬個,政務數據資源目錄體系逐漸成型。
不過,開放只是應用的基礎。在浪潮集團董事長孫丕恕看來,數據要體現價值,還必須走市場化的道路,在政府開放數據之外,還要使數據交易和交換「常態化」。大數據交易平台也由此應運而生。
2015年4月,全球第一個大數據交易所貴陽大數據交易所掛牌,7月,長江大數據交易所(籌)和東湖大數據交易中心在武漢成立,12月華東江蘇大數據交易中心平台上線運營。貴陽大數據交易所執行總裁王叄壽介紹說,截至2015年底,貴陽大數據交易所交易金額突破6000萬元;會員數量超過300家,接入的數據源公司超過100家,數據類型涵蓋貿易通[-3.19%]關大數據、專利類大數據、企業徵信大數據、企業工商大數據等,數據總理超過10PB。
創新應用縱深發展
「2015年下半年,不少多年無法執行到位的案件的被執行人會突然找到法院來,要求還清欠款,把自己從『老賴』名單中抹去,這就是執法創新結合互聯網大數據所體現出的能量。」廣東省中山市第一人民法院法官王念頗為感慨。
「老賴」是對拒不執行判決、裁定的被執行人的形象稱呼。2015年7月,最高人民法院與芝麻信用合作,開創了通過互聯網聯合信用懲戒的先河。在與芝麻信用合作的各平台商家中,「老賴」無法預訂機票、軟卧車票、三星級以上酒店甚至度假產品。半年裡,共計5300多名失信被執行人因此還清債務,其中1500多名失信被執行人是長達三四年、一直逃避執行的「老賴」。
這正是互聯網大數據創新應用的一個縮影,其基礎是我國高度成熟的消費互聯網。與「真金白銀」掛鉤,這也成為大數據創新應用最活躍的領域。
電子商務、物流配送、互聯網金融、O2O,垂直領域的大數據應用正在切實幫助企業提升效率,創新模式。在電商領域,京東目前數據總存儲量達到50+PB,年增長300%。大數據已經全面用於用戶消費行為的深度挖掘、精準營銷、銷量預測與庫房自動補貨、搜索推薦系統的持續優化等環節。滴滴出行戰略負責人朱景士則表示:「滴滴每天數據分析量級是50TB,大約是5萬部高清電影,每天連續上傳的定位數據是50億次。根據這些數據,滴滴可以不斷提高演算法精度,優化路線,比如我們在上海為乘客推薦上車地點,設立了滴滴車站,就能讓司機更容易找到乘客。」
而在消費互聯網之外,大數據應用還在向產業互聯網延伸。一方面,為用戶「畫像」,讓企業對用戶進行細分,提升業務精準度成為熱門。2015年12月23日,大數據服務商百分點發布用戶標簽管理系統。百分點董事長蘇萌告訴記者,通過這樣的系統,企業能夠根據業務需求定義用戶標簽,並且直接利用組合功能創建新標簽,從而迅速找到目標用戶,「支撐企業快速對接大數據技術及數據服務,實現智能化的業務應用」。
在另一方面,在生產端,大數據的「流動」同樣幫助企業提升智能製造水平。軟控股份有限公司總裁鄭江家表示:「輪胎製造的密煉環節像『和面』,通過打通數據流,可以實現上下工序的智能互動。如果『水』多『面』軟,這些數據就會被傳輸到下一步壓膠環節,就能自動把『餃子皮』擀得厚一點,不再需要人工處理。產品品質也就提升了。」山東省青島市經濟和信息化委員會主任項陽青也認為:「數據驅動是智能製造的關鍵,這才能帶來基於互聯網思維下的全生命周期創新。」
『伍』 大數據智能分析的特徵有哪些
一、差異性
與單一來源數據智能分析相比,大數據實現了集多埠、多行業、多來源的綜合性數據融合,在數據來源、數據結構、產生時間、使用場所、代碼協議等方面具有較大的差異性。
二、共享性
大數據技術能夠打破信息孤島困境,打通信息流通動脈,盤活數據潛在價值,推動各行業、部門之間形成統一高效、互聯互通的數據和資源共享布局。
三、准確性
以大數據為核心的多源數據融合,進一步提高數據內容的系統性,確保數據來源的完整性和可靠性。
四、技術性
大數據實現了多源數據多埠接入,同時垂直領域的應用需求嵌入不同多源數據融合處理技術,是個“技術活”。
“維度雲”數據資源管理平台
五、權威性
依託權威、合法、多源的一手數據資源,進行多源數據智能分析結果的展示內容、發布數據具備權威性,具有一定的指導意義。
六、前瞻性
大數據智能分析能夠有效地補充傳統單一來源數據分析手段的缺陷,通過數據清洗和處理技術,加之合理的建模,充分挖掘和掌握運行規律,具備較強的前瞻性。
關於大數據智能分析的特徵有哪些,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。
『陸』 大數據的發展前途怎麼樣
大數據的就業前景目前來看是不錯的,隨著大數據往各垂直領域延伸發展,對統計學、數學專業的人才,數據分析、數據挖掘、人工智慧等偏軟體領域的需求加大,大數據領域從業人員薪資水平將持續增長,人才供不應求。
大數據就業方向
1、大數據開發方向。所涉及的職業崗位為:大數據工程師、大數據維護工程師、大數據研發工程師、大數據架構師等;
2、數據挖掘、數據分析和機器學習方向。所涉及的職業崗位為:大數據分析師、大數據高級工程師、大數據分析師專家、大數據挖掘師、大數據演算法師等;
3、大數據運維和雲計算方向。對應崗位:大數據運維工程師;
三個方向中,大數據開發是基礎。以Hadoop開發工程師為例,Hadoop入門月薪已經達到了8k以上,工作1年月薪可達到1.2w以上,具有2-3年工作經驗的hadoop人才年薪可以達到30萬—50萬,一般需要大數據處理的公司基本上都是大公司,所以學習大數據專業也是進大公司的捷徑。從近兩年大數據方向研究生的就業情況來看,大數據領域的崗位還是比較多的,尤其是大數據開發崗位,目前正逐漸從大數據平台開發向大數據應用開發領域覆蓋,這也是大數據開始全面落地應用的必然結果。
從近幾年招聘情況來看,大數據開發崗位的數量明顯比較多,而且不僅需要研發型人才,也需要應用型人才,所以本科生的就業機會也比較多。
當前大數據技術正處在落地應用的初期,所以此時人才招聘會更傾向於研發型人才,而且擁有研究生學歷也更容易獲得大廠的就業機會,讀研之後在崗位選擇上可以重點考慮一下大數據平台開發,在5G通信的推動下,未來雲計算會全面向PaaS和SaaS領域覆蓋,這個過程會全面促進大數據平台的發展。
『柒』 移動互聯網在大數據時代有哪些垂直方向的創業機會
主要有三個方面,僅供您參考:
一、是圍繞智能城市建設的相關機會,如回政府的智答能交通、智能路牌、網格化管理等;
二、是圍繞健康醫療領域的相關機會,如構建個人健康資料庫、如醫療衛生系統圍繞治療本源的雲中心和雲數據。
三、是圍繞移動用戶的精準營銷,如移動支付、資訊個性化定製等!
垂直領域的機會更適合中小型企業的創新發展,這幾年是好時機,建議好好把握!
『捌』 對大數據的全方位解讀
對大數據的全方位解讀
大數據是當下非常火爆的一個詞,人人都在談論大數據。但大數據的定義是什麼?它到底是如何出現的?它有什麼特別之處?它最大的應用領域在哪裡?它的發展方向是什麼?對於以上問題,其實大多數人是弄不清楚的。
1)大數據時代出現的必然性
大數據和雲計算這兩個詞經常被同時提到,很多人誤以為大數據和雲計算是同時誕生的、具有強綁定關系。其實這兩者之間既有關聯性,也有區別。雲計算指的是一種以互聯網方式來提供服務的計算模式,而大數據指的是基於多源異構、跨域關聯的海量數據分析所產生的決策流程、商業模式、科學範式、生活方式和關聯形態上的顛覆性變化的總和。大數據處理會利用到雲計算領域的很多技術,但大數據並非完全依賴於雲計算;反過來,雲計算之上也並非只有大數據這一種應用。
雲計算的起源可以追溯到 2003 年末 Amazon 公司工程師 Chris Pinkham 提交給 CEO Jeff Bezos 的一篇論文中的一個設想:將 Amazon 內部使用的計算基礎設施開放給全世界的開發者。次年 11 月,Amazon 發布了第一版雲計算服務:Simple Queue Service。Simple Queue Service 再往後發展至 2006 年,演變成立今天著名的 AWS(Amazon Web Sercice)。同在 2006 年,Google 公司 CEO Eric Schmidt 首次公開提出了「雲計算」(Cloud Computing)的這一概念,雲計算也在這一年開始變得廣為人知。
大數據這個詞的流行卻晚了好幾年——直到 2009 年,大數據這個說法才逐漸開始在互聯網圈內傳播。但僅僅在互聯網領域流行,仍然不足以引起普遍關注,因為純互聯網經濟畢竟只佔全球經濟總量的很小一部分。而大數據概念真正變得火爆,卻是因為美國奧巴馬政府在 2012 年高調宣布了其「大數據研究和開發計劃」——美國政府希望利用大數據解決一些政府部門面臨的非常重要的問題,該計劃由橫跨 6 個政府部門的 84 個子課題組成。這標志著大數據真正開始進入主流的傳統線下經濟。
大數據出現的時間點自有它深刻的原因。2009 年至 2012 年這段時間正是電子商務在包括中國在內的全球全面開花的幾年。眾所周知,互聯網領域有 3 大類商業模式:廣告、游戲和電子商務。而電子商務又是第 1個真正將純互聯網經濟與傳統經濟嫁接在一起誕生的混合模式。准確地說,正是互聯網與傳統經濟的碰撞,才真正催生出了今天幾乎全民關注的「大數據」。大數據橫跨了互聯網產業與傳統產業,而且大數據真正廣闊的應用領域其實也正是比純互聯網經濟大得多的傳統產業。
從數據量的角度來看,在電子商務模式出現以前,傳統企業的數量增長緩慢。傳統企業的數據倉庫中的數據大多數來自於交易型數據,而交易這種行為處於用戶消費決策漏斗的最底部,這就決定了交易前的各種瀏覽、搜索、比較等用戶行為數據的都量遠遠超過交易數據。電子商務模式使得企業可以採集到用戶的瀏覽、搜索、比較等行為,這就導致企業的數據規至少提升了一個數量級。現在日益流行的移動互聯網以及將來會流行的物聯網又必將使數據量提高兩三個數量級。從這個角度來講,大數據時代是必然會出現的。
從IT產業的發展來看,第一代IT巨頭大多是 2B 的,比如 IBM、Microsoft、Oracle、SAP 這類傳統IT企業;第二代IT巨頭大多是 2C 的,比如 Yahoo、Google、Amazon、Facebook 這類互聯網企業。一個有意思的現象是:大數據時代前,這兩類公司彼此之間基本是井水不犯河水,我們很少看見這兩類公司的老闆們在一起坐而論道;但在當前這個大數據時代,這兩類公司已經開始直接競爭。比如 Amazon 已經開始提供雲模式的數據倉庫服務,直接搶占 IBM、Oracle 的市場。這個現象出現的本質原因是:在互聯網巨頭的帶動下,傳統IT巨頭的客戶普遍開始從事電子商務業務,正是由於客戶進入了互聯網,所以傳統IT巨頭們不情願地被拖入了互聯網領域。如果他們不進入互聯網,他們業務必將萎縮。所以第三代IT巨頭可能會是 2B 與 2C 融合的IT公司。
2)大數據的核心內涵
大數據概念雖然非常火爆,但少有人真正理解大數據的核心內容。一個普遍而且嚴重的誤解就是:大數據= 數據大,即大數據就是量大的數據。事實上,除了數據量大這個字面意義,大數據還有兩個更重要的特徵:
1) 跨領域數據的交叉融合。相同領域數據量的增加是加法效應,不同領域數據的融合是乘法效應
2) 數據的流動。數據必須流動,流動產生價值
對於第 1) 點,百分點推薦系統研究中心實驗結果顯示:百分點公司有 3 家客戶,分別是從事服裝、化妝品和箱包銷售的電商,百分點向這 3 家客戶提供個性化商品推薦服務,即:百分點挖掘用戶的偏好,不同的用戶上同一家電商網站時,向他們展現不同的服裝、化妝品或箱包,從而提高電商的轉化率和客單價。我們做過兩種測試:
a) 將每家網站的數據隔離。當每家網站自身的數據量增加到以前的 4 倍時,推薦效果大約能提高 5%;
b) 將三家網站的數據在去除敏感信息之後進行某種融合。融合後的數據大致是與單家網站的數據的 3 倍,比第一種情況數據量還少。但利用融合後的數據進行數據挖掘時,推薦效果能提升 30%,而且推薦商品並未發生變化,仍然是:用戶上服飾類網站時只看見服裝、上化妝品網站時只看見化妝品、上箱包網站時只看見箱包。
解釋得詳細一點,上述實驗說明:對同一個消費者,如果我們要向其推薦服裝。第一種方法是我們根據他過去的 4 次購買服裝的行為來預測其下一次可能會購買的服飾;第二種方法是我們根據他過去分別購買服裝、化妝品和箱包的各 1 次行為來預測其下一次可能會購買的服飾。兩種方法的基於的用戶行數分別是 4 次和 3 次,但第二種方法的效果明顯更好。
對於第 2) 點,其實 10 多年前傳統企業開始做數據倉庫時,數據倉庫從業者經常強調一個觀點:企業級數據倉庫的目標是讓不同部門的數據流動起來,各個部門數據割裂,數據的價值就得不到發揮。到了今天的互聯網時代,我們發現即使企業已經打通了內部各個部門之間的數據,但與整個互聯網比起來,數據量仍然微乎其微,數據應該以互聯網為媒介在企業之間某種形式的流動。參照「企業級數據倉庫」的概念,現在已經開始出現了「互聯網數據倉庫」的概念:就是企業通過互聯網渠道將與自己相關的外部數據與內部數據進行整合,從而形成「互聯網數據倉庫」。百分點已經在零售與媒體領域比較成功地打造了「開放數據聯盟」,該聯盟的成員可以在公允、安全的情況下基於該聯盟建立起自己的「互聯網數據倉庫」,從而享用海量數據的價值。
3)大數據的應用領域
大數據的起源要歸功於互聯網與電子商務,但大數據最大的應用前景卻在傳統產業。一是因為幾乎所有傳統產業都在互聯網化,二是因為傳統產業仍然占據了國家 GDP 的絕大部分份額。
哪些傳統企業最需要大數據服務呢?至少有 3 類企業:
1) 對大量消費者提供產品或服務的企業
2) 做小而美模式的中長尾企業
3) 面臨互聯網壓力之下必須轉型的傳統企業
第 1) 類企業都需要利用大數據精準分析不同消費者的偏好,提高營銷和服務的質量;第 1) 類企業都需要利用大數據分析精準定位自己的客戶群;第 3) 類企業主要指哪些正在遭受來自互聯網的新玩家沖擊的傳統企業,此類企業自然都需要利用互聯網和大數據作為自我進化的工具。當然,第 3) 類企業與前 2 類企業有重疊。
具體來講,中國最需要大數據服務的行業就是受互聯網沖擊最大的產業,首先是線下零售業,其次是金融業。
受電商的沖擊,國內很多零售巨頭都增長嚴重放緩,甚至遭遇負增長,線下零售已經到了不得不變革的危機關頭。我們也看到了銀泰百貨、王府井百貨、萬達集團這些具有創新意識的傳統巨頭開始利用互聯網和大數據來改造線下商業。其中銀泰百貨以手機為載體、利用 O2O 方式進行雙線數據挖掘的創新非常值得借鑒。
而金融行業就更加特殊:金融業並不銷售任何實體商品,它自誕生起就是基於數據的產業。由於國家管制,金融業在前幾年享受了非常好的政策紅利,內部變革動力不足。而目前金融業已經逐漸開始放鬆管制,新興的金融機構必將利用互聯網以及大數據工具向傳統金融巨頭發起猛烈攻擊。而傳統金融機構在互聯網方面的技術積累和數據積累都不足,要快速應對新進入者的挑戰,必然需要大數據服務。我們也看到了中信銀行信用卡中心、招商銀行信用卡中心已經在開始利用互聯網大數據進行創新。
那麼傳統產業需要什麼樣的大數據服務呢?這主要包括 3 層:
1) 基於大數據的行業垂直應用。每個行業都有自己的特點,所以自然會存在行業應用的需求;
2) 顧客標簽與商品標簽的整理。不管什麼行業,都需要精細化整理自己顧客的屬性標簽以及商品屬性標簽,而且這些標簽必須能夠細化到單個顧客和單個商品。標簽是行業應用的基礎;
3) 企業內部和外部數據的整合與管理。要給顧客和商品打標簽,首先必須整合企業內部和外部數據,尤其是日益重要和龐大的外部數據。
圖:傳統企業需要的大數據服務
第 3 層和第 2 層的方法相對比較通用,行業特殊性相對較少。百分點已經在第 3 層和第 2 層做出了比較成熟的產品,並且也開始在第 1 層做出了一些具體的行業應用產品,比如針對服飾行業的時尚服飾搭配系統。
4)大數據的發展方向
大數據產業未來會向什麼方向發展?隨著數據逐漸成為企業的一種資產,數據產業會向傳統企業的供應鏈模式發展,最終形成「數據供應鏈」。拿鋼鐵產業來講,鐵礦石公司從礦場中挖出礦石,經過粗加工,賣給鋼鐵企業;鋼鐵企業再進行精細一點的加工,將板材、鋼條賣給下游製造業公司;這些製造業公司做出汽車、飛機、門窗、電腦等產品賣給下游公司。這個產業鏈中存在找礦、運輸、加工等諸多環節,每個環節都有對應的企業。
圖:傳統企業的供應鏈
在「數據供應鏈」中,存在數據、數據整合與挖掘工具以及數據應用這 3 大環節。數據就好比礦場的礦石;數據整合與挖掘工具就好比鋼廠的冶煉爐;而精準營銷、服飾搭配等數據應用就好比汽車、電腦等可以出售給消費者的產品。企業在數據供應、數據整合與挖掘、數據應用等所有環節都需要專業的服務。這里尤其有兩個明顯的現象:
1) 外部數據的重要性日益超過內部數據。在互聯互通的互聯網時代,單一企業的內部數據與整個互聯網數據比較起來只是滄海一粟;
2) 能提供包括數據供應、數據整合與加工、數據應用等多環節服務的公司會有明顯的綜合競爭優勢。
5) 什麼樣的大數據企業會勝出
常有大數據從業者以及投資人和我們探討一個問題:大數據產業中,什麼樣的企業會最終勝出?這是一個很難回答的問題,而且即使回答了,三五年內可能都無法判斷其正確性。但從「數據供應鏈」中的各個環節來分析,還是可以得出一些具有參考價值的結論。
1) 數據供應。在互聯網沒有流行的時代,企業做數據倉庫、商業智能、數據挖掘等系統時採用的數據基本都來自於企業內部,企業幾乎無法獲取外部數據,所以很少有專業的數據供應商。互聯網改變了這一局面,將來會有專業的數據供應商。但既然是因為互聯網的出現導致了數據供應商的出現,那麼反過來數據供應商就必須具有很強的互聯網基因;
2) 數據整合與挖掘。數據挖掘工具供應商在非互聯網時代就早已存在。但互聯網時代使得企業的數據量激增、數據類型發生極大變化(不同於傳統的來自於單一領域的結構化數據,互聯網數據以跨域的非結構化數據為主),傳統的數據挖掘工具供應商的技術和方法已經很難適應。要跟上時代的變化,數據挖掘技術與工具應用商必須具備互聯網公司的海量數據處理和挖掘的能力;
3) 數據應用。具體的行業應用與傳統行業的業務關系密切,要做好行業應用,最好需要有服務傳統行業的經驗,了解傳統行業的內部運作模式。這時候僅僅具有 2C 經驗的互聯網基因的公司又稍顯不足。
綜合起來看,如果一家大數據從業公司同時兼備互聯網數據獲取能力、互聯網技術、互聯網執行力,又有做 2B 服務的經驗,那麼這家公司將比較容易取得領先優勢。這個結論其實一點也不奇怪:如本文開篇所述,大數據本來就是互聯網與傳統產業碰撞時的產物。
用「方興未艾」這個詞來形容大數據產業的發展階段都還為時過早,目前的大數據產業只能說是小荷才露尖尖角。國內企業在第 1 代IT產業(硬體和軟體產業)中是明顯落後國外企業的;在第 2 代IT產業(互聯網產業)中,國內企業已經與國外企業差距不大甚至在很多方面超過了國外企業;希望在第 3 代IT產業(雲計算和大數據)浪潮中,國內企業能夠完全趕上並且超過國外企業,我們也認為這是很有可能的。