❶ 大數據在各行各業幾乎都站穩了腳跟
大數據時代的到來,改變的不僅僅是傳統的商業模式,更深入到人們的生活、工作等各個環節,以及人們的傳統觀念之中。隨著互聯網的發展,信息交流也在不斷加速,大數據在各行各業幾乎都站穩了腳跟,特別是越來越多的政府機構與公司組織都已經把大數據應用作為了重要的一環。
大數據不僅是一場顛覆性的技術革命,更是一種思維方式、行為模式與治理理念的全方位變革。那麼,大數據在社會生活中都有哪些運用與實踐呢 在瞬息萬變的時代,行業信息也顯得愈發重要,數據猿編輯在此為您做詳細解析。
大數據助推金融機構的戰略轉型
隨著互聯網特別是移動互聯網的爆發式增長,未來將迎來一個大數據浪潮。在宏觀經濟結構調整和利率逐步市場化的大環境下,目前國內的金融機構主要表現出盈利空間收窄、業務定位亟待調整、核心負債流失等問題。而大數據技術正是能夠幫助金融機構深入挖掘既有數據,找准市場定位,明確資源配置方向,推動業務創新的重要手段。
國務院頒布的《推進普惠金融發展規劃(2016-2020年)》中更是直接提到「鼓勵金融機構運用大數據、雲計算等新興信息技術,打造互聯網金融服務平台。」國內外各金融與類金融機構、互聯網金融企業紛紛開始探索大數據的應用,希望大數據可以帶來技術與應用上的突破,實現現有風控模型體系的升級,探索基於場景化的新消費金融市場,並提升催收效率、建設互聯網深層次大面積獲客能力,從而徹底提升國家金融行業的國際競爭力。
大數據提升科技管理系統升級
「在物聯網產生之前,或者大的感測器產生之前,我們的採集數據來源於訪談、測量或者是記錄在紙上,那個時候我們的數據量比較少,而如今,主要靠科學儀器獲取大量源源不斷產生的數據,數據產生的量非常大,而且復雜度非常高。」正如中國科學院計算機網路信息中心大數據部主任、CODATA中國委員會秘書長黎建輝所言,從手工記錄到儀器採集,大數據正發生著翻天覆地的變化。
在智能汽車研發方面,重要的一項工作就是大數據分析。福特汽車早已把大數據應用到了公司生產的每一個環節裡面,無論是商品的價格、消費者理想的汽車狀態,還是公司應該生產的車型以及這種車型采購的零部件,抑或汽車應有的設計構造,福特汽車已將大數據應用深入骨髓。車聯網時代的到來,讓大數據應用於汽車領域越來越廣泛。
大數據促進政務大數據共享進程
如今,政務大數據共享還沒真正落實,有些政府部門基於風險考慮而不敢將管理數據拿出來與其他部門共享。主要原因是擔心共享會帶來負面影響和不利後果,要麼害怕共享時暴露出本部門原有數據不真實、不精確而問責,要麼認為「數據安全與保密比共享更重要」、採取封閉行為更妥當。
大數據時代的到來,給政府管理變革帶來了新的契機。2015年8月國務院印發《促進大數據發展行動綱要》明確提出「推動政府數據開放共享」;2016年12月國務院通過了《「十三五」國家信息化規劃》,提出要打破各種信息壁壘和「孤島」,推動信息跨部門、跨層級共享共用。如何推動政府部門數據共享,打破信息壁壘和「數據煙囪」,優化政府管理流程和提升協同治理能力,已經成為當務之急。
大數據加速能源產業發展及商業模式創新
能源大數據理念是將電力、石油、燃氣等能源領域數據進行綜合採集、處理、分析與應用的相關技術與思想。不僅是大數據技術在能源領域的深入應用,也是能源生產、消費及相關技術革命與大數據理念的深度融合,將加速推進能源產業發展及商業模式創新。隨著信息化的深入和兩化的深度融合,大數據在石油石化行業應用的前景將越來越廣闊。
大數據與能源行業的結合目前主要體現在三個行業:(1)石油天然氣產業鏈與大數據的結合。在油氣勘探開發的過程中,可以利用大數據分析的方法尋找增長點,利用大數據平台可以幫助煉油廠提高煉化效率,也可幫助下游銷售挖掘消費規律,優化庫存,確定最佳促銷方案。(2)智能電網:利用大數據實時監測技術監測家庭用電量特徵,幫助電力公司調配電力供給,為客戶提供最佳用電方案。(3)風電行業:進行風電場分布式風機的在線監測,周期性及瞬時的實時數據採集和在線分析,生成警報、允許維護人員可視化和管理數據,簡化大規模監測系統的部署。
大數據推動天文學、微生物研究邁入新階段
天文學作為一個典型的大數據應用領域,同樣需要通過標准化和一系列規范實現全球的天文科學數據的共享與交易。為了解決國際上天文大數據的開放、共享以及數據間的操作問題,天文學家提出了虛擬天文台的構想,這是一個通過先進的信息技術將全球范圍內的研究資源無縫透明連接在一起而形成的數據密集型網路化天文研究與科普教育平台。
在談及大數據對天文學方面的貢獻時,中國科學院國家天文台信息與計算中心主任崔辰州表示,探索宇宙的奧秘,大數據正在發揮越來越重要的作用。目前,中科院微生物所正在通過研究和開發雲環境下微生物數據存儲和計算等一系列關鍵技術,形成完善的微生物數字資源體系、知識發現平台和大數據服務平台,建立具有國際影響力的微生物資料庫,實現我國微生物領域數字資源建設的突破。
大數據助推國家健康醫療服務新模式
當前,隨著經濟社會發展和人民生活水平的提高,人民群眾在健康方面的需求更加迫切和多元化,這就為健康產業和醫療服務新模式新業態構造創造了良好的生態條件,健康醫療大數據以其廣泛的應用性和特殊性未來將對經濟發展產生重大貢獻,必將成為我國國民經濟的重要支柱產業。
據悉,6月20日,國家衛生和計劃生育委員會副主任金小桃透露,組建以國有資本為主體的三大健康醫療大數據集團公司主要是為了落實黨中央「沒有全民健康就沒有全面小康」及「推進健康醫療大數據應用」的精神,落實國務院辦公廳47號文件要求,推動國家健康醫療大數據應用發展。這三大集團將以國家隊的形式來承擔國家健康醫療大數據中心、區域中心、應用發展中心和產業園建設任務,努力為提高群眾獲得感、深化醫改新動力和增強經濟發展新動能作出新貢獻。
大數據構建智能交通和推動智慧城市發展
「智能交通」概念的提出,源於日益嚴重的交通擁堵和出行需求的復雜多元化。但是,在交通數據資源充足的情況下,如何才能真正讓數據變「活」 網路地圖的智能路線規劃、實時路況、路況預測是交通數據價值的最佳體現。
6月14日,WGDC2017全球地理信息開發者大會進入到第二天,網路地圖開放平台總經理李志堂、主任架構師張紹文、內容生態總經理劉斌共同出席「空間大數據+智能交通峰會」,從地圖大數據、人工智慧導航、數據內容升維表達等角度闡述了網路地圖在構建智能交通和推動智慧城市發展中的作用。
大數據讓人們的生活更加方便快捷
日常生活中,大數據幫助電商平台打造更極致的用戶體驗,尤其是網購狂歡節,電商由於提前對消費者需求做了充分調研,因此更能抓住消費者的心理,通過大數據優化產品的質量。而方興未艾的智慧旅遊,避免了旅遊旺季各大旅遊景點人數太多從而降低遊客的好感度,特別是網路大數據通過數據分析,及時了解景區內的狀況,幫助遊客合理安排出行、提供智能服務。
而據經濟之聲《天下財經》報道,在今年的亞洲消費電子展上,京東、蘇寧等企業攜大數據與人工智慧,打造智慧物流產業鏈。伴隨著電商行業的迅猛發展,消費型物流需求激增,智慧物流有望成為快遞業下一個重要的突破口。這些都必將在一定程度上改變人們的生活,成為大數據帶給大家最直接的福利。
技術的不斷更新發展,讓數據的價值被重新發現和定義,進而帶來整個社會的變革。如今的大數據行業,正顯示出朝氣蓬勃的生命力,我們在享受這個時代賦予便利的同時,也將對其進行改變與創新。大數據,想說愛你真不容易。
❷ 華為大數據解決方案是什麼
現在有好多公司在做大數據,不僅僅只有華為。比如北京開運聯合信息技術股份有限公司大數據解決方案是要根據您所需要的行業,來定製的。
❸ 大數據專業都需要學習哪些軟體啊
大數據處理分析能力在21世紀至關重要。使用正確的大數據工具是企業提高自身優勢、戰勝競爭對手的必要條件。下面讓我們來了解一下最常用的30種大數據工具,緊跟大數據發展腳步。
第一部分、數據提取工具
Octoparse是一種簡單直觀的網路爬蟲,可以從網站上直接提取數據,不需要編寫代碼。無論你是初學者、大數據專家、還是企業管理層,都能通過其企業級的服務滿足需求。為了方便操作,Octoparse還添加了涵蓋30多個網站的「任務模板 (Task Templates)」,操作簡單易上手。用戶無需任務配置即可提取數據。隨著你對Octoparse的操作更加熟悉,你還可以使用其「向導模式 (Wizard Mode)」來構建爬蟲。除此之外,大數據專家們可以使用「高級模式 (Advanced Mode)」在數分鍾內提取企業批量數據。你還可以設置「自動雲提取 (Scheled Cloud Extraction)」,以便實時獲取動態數據,保持跟蹤記錄。
02
Content Graber
Content Graber是比較進階的網路爬網軟體,具有可用於開發、測試和生產伺服器的編程操作環境。用戶可以使用C#或VB.NET調試或編寫腳本來構建爬蟲。Content Graber還允許你在爬蟲的基礎上添加第三方擴展軟體。憑借全面的功能,Content Grabber對於具有基本技術知識的用戶來說功能極其強大。
Import.io是基於網頁的數據提取工具。Import.io於2016年首次啟動,現已將其業務模式從B2C轉變為B2B。2019年,Import.io並購了Connotate,成為了一個網路數據集成平台 (Web Data Integration Platform)。憑借廣泛的網路數據服務,Import.io成為了商業分析的絕佳選擇。
Parsehub是基於網頁的數據爬蟲。它可以使用AJax,javaScript等等從網站上提取動態的的數據。Parsehub提供為期一周的免費試用,供用戶體驗其功能。
Mozenda是網路數據抓取軟體,提供企業級數據抓取服務。它既可以從雲端也可以從內部軟體中提取可伸縮的數據。
第二部分、開源數據工具
01Knime
KNIME是一個分析平台,可以幫助你分析企業數據,發現潛在的趨勢價值,在市場中發揮更大潛能。KNIME提供Eclipse平台以及其他用於數據挖掘和機器學習的外部擴展。KNIME為數據分析師提供了2,000多個模塊。
02OpenRefine(過去的Google Refine)是處理雜亂數據的強有力工具,可用於清理、轉換、鏈接數據集。藉助其分組功能,用戶可以輕松地對數據進行規范化。
03R-Programming
R大家都不陌生,是用於統計計算和繪制圖形的免費軟體編程語言和軟體環境。R語言在數據挖掘中很流行,常用於開發統計軟體和數據分析。近年來,由於其使用方便、功能強大,得到了很大普及。
04RapidMiner
與KNIME相似,RapidMiner通過可視化程序進行操作,能夠進行分析、建模等等操作。它通過開源平台、機器學習和模型部署來提高數據分析效率。統一的數據科學平台可加快從數據准備到實施的數據分析流程,極大地提高了效率。
第三部分、數據可視化工具
01
Datawrapper
Microsoft PowerBI既提供本地服務又提供雲服務。它最初是作為Excel附加組件引入的,後來因其強大的功能而廣受歡迎。截至目前,它已被視為數據分析領域的領頭羊,並且可以提供數據可視化和商業智能功能,使用戶能夠以較低的成本輕松創建美觀的報告或BI儀錶板。
02
Solver
Solver專用於企業績效管理 (CPM) 數據可視化。其BI360軟體既可用於雲端又可用於本地部署,該軟體側重於財務報告、預算、儀錶板和數據倉庫的四個關鍵分析領域。
03
Qlik
Qlik是一種自助式數據分析和可視化工具。可視化的儀錶板可幫助公司有效地「理解」其業務績效。
04
Tableau Public
Tableau是一種互動式數據可視化工具。與大多數需要腳本的可視化工具不同,Tableau可幫助新手克服最初的困難並動手實踐。拖放功能使數據分析變得簡單。除此之外,Tableau還提供了入門工具包和豐富的培訓資源來幫助用戶創建報告。
05
Google Fusion Tables
Fusion Table是Google提供的數據管理平台。你可以使用它來收集,可視化和共享數據。Fusion Table與電子表格類似,但功能更強大、更專業。你可以通過添加CSV,KML和電子表格中的數據集與同事進行協作。你還可以發布數據作品並將其嵌入到其他網路媒體資源中。
06
Infogram
Infogram提供了超過35種互動式圖表和500多種地圖,幫助你進行數據可視化。多種多樣的圖表(包括柱形圖,條形圖,餅形圖和文字雲等等)一定會使你的聽眾印象深刻。
第四部分、情感分析工具
01
HubSpot』s ServiceHub
HubSpot具有客戶反饋工具,可以收集客戶反饋和評論,然後使用自然語言處理 (NLP) 分析數據以確定積極意圖或消極意圖,最終通過儀錶板上的圖形和圖表將結果可視化。你還可以將HubSpot』s ServiceHub連接到CRM系統,將調查結果與特定聯系人聯系起來。這樣,你可以識別不滿意的客戶,改善服務,以增加客戶保留率。
02
Semantria
Semantria是一款從各種社交媒體收集帖子、推文和評論的工具。Semantria使用自然語言處理來解析文本並分析客戶的態度。通過Semantria,公司可以了解客戶對於產品或服務的感受,並提出更好的方案來改善產品或服務。
03
Trackur
Trackur的社交媒體監控工具可跟蹤提到某一用戶的不同來源。它會瀏覽大量網頁,包括視頻、博客、論壇和圖像,以搜索相關消息。用戶可以利用這一功能維護公司聲譽,或是了解客戶對品牌和產品的評價。
04
SAS Sentiment Analysis
SAS Sentiment Analysis是一款功能全面的軟體。網頁文本分析中最具挑戰性的部分是拼寫錯誤。SAS可以輕松校對並進行聚類分析。通過基於規則的自然語言處理,SAS可以有效地對消息進行分級和分類。
05
Hootsuit Insight
Hootsuit Insight可以分析評論、帖子、論壇、新聞站點以及超過50種語言的上千萬種其他來源。除此之外,它還可以按性別和位置對數據進行分類,使用戶可以制定針對特定群體的戰略營銷計劃。你還可以訪問實時數據並檢查在線對話。
第五部分、資料庫
01
Oracle
毫無疑問,Oracle是開源資料庫中的佼佼者,功能豐富,支持不同平台的集成,是企業的最佳選擇。並且,Oracle可以在AWS中輕松設置,是關系型資料庫的可靠選擇。除此之外,Oracle集成信用卡等私人數據的高安全性是其他軟體難以匹敵的。
02
PostgreSQL
PostgreSQL超越了Oracle、MySQL和Microsoft SQL Server,成為第四大最受歡迎的資料庫。憑借其堅如磐石的穩定性,它可以處理大量數據。
03
Airtable
Airtable是基於雲端的資料庫軟體,善於捕獲和顯示數據表中的信息。Airtable提供一系列入門模板,例如:潛在客戶管理、錯誤跟蹤和申請人跟蹤等,使用戶可以輕松進行操作。
04
MariaDB
MariaDB是一個免費的開源資料庫,用於數據存儲、插入、修改和檢索。此外,Maria提供強大的社區支持,用戶可以在這里分享信息和知識。
05
Improvado
Improvado是一種供營銷人員使用自動化儀錶板和報告將所有數據實時地顯示在一個地方的工具。作為營銷和分析領導者,如果你希望在一個地方查看所有營銷平台收集的數據,那麼Inprovado對你再合適不過了。你可以選擇在Improvado儀錶板中查看數據,也可以將其通過管道傳輸到你選擇的數據倉庫或可視化工具中,例如Tableau、Looker、Excel等。品牌,代理商和大學往往都喜歡使用Improvado,以大大節省人工報告時間和營銷花費。
❹ 大數據改變世界的五種方式
大數據改變世界的五種方式
隨著電腦科技的發展,計算能力不再是像以前那樣的「奢侈品」。現在的我們就彷如暢泳在一個巨大的數據水庫,而這個資料庫包羅萬象:從繁忙時段一個明尼蘇達州小鎮的表現至在葉門成功使用無人飛機轟炸的可能性。大數據的到來意味著公司,機構以及政府等可以同過收集,挖掘並利用這些龐大的數據區完成神奇的事情。
讓我們看看神奇的大數據如何改變世界:
1.數據化身致命武器:
信息作為大數據時代最有效最具殺傷力的武器同時也正在被大量用於該時代的軍備競賽,但現今的軍事技術數據來源正受限於衛星,無人飛行旗以及更多傳統方式得到的數據。美國國防部啟動一項名為XDATA的方案,其作為奧巴馬政府發布的大數據倡議的一部分主要致力於以2.5億美元研發一個分析大數據的系統。隨著越來越多的有效運算,美軍能夠將PB級的數據運用到尖端優勢上,例如讓無人轟炸機變得前所未有的智能以及致命。
2.拯救地球:
除了讓捕食者無人機更有威力和增加零售利潤外,大數據更能造福世界。以開源的大數據平台Google Earth引擎為例,研究人員可利用它繪制出第一張莫斯科森林的高解析度的地圖。如果僅利用傳統的電腦計算方法繪制需要3年時間,對比之下使用Google Earth僅需一天時間。
像這種大規模的數據集合能夠讓人類在系統層面上理解生態危機。我們知道越多地球生態系統以及天氣形態變化數據,就越容易模型化未來環境的變遷,因而也能夠在我們力所能及的時候去阻止不好的轉變發生。
3.預測購物趨勢:
消費者的購物趨勢能夠在以前的購物記錄大數據挖掘中得出,銷售公司不論大少均有可能預測到你需要買什麼,他們甚至比你自己更懂你。因而從消費者當前購物數據中從大數據中能夠獲得大利潤。網上零售商如亞馬遜正在大量收集我們的購物以及網上購物數據,甚至線下零售商也開始緊跟這一趨勢著手收集消費者的消費數據。一些聰明的公司看準這點,以RetailNext為例,它是為Brookstone 以及American Apparel等公司提供購物者瀏覽以及購物時的錄像記錄。 RetailNext將一個購買者在店鋪移動的軌跡轉化為上萬數據點,就可以得到購物者在店內瀏覽商品的移動過程,停留點以及其與銷售的相關性。
4.加速科學研究發展速度:
一直以來數據都是科學發現的支柱,現在由於大數據的發展以及高運算力的支持,科研步伐也正飛速向前。
以人類歷史上科學成就指標性的 人類基因組計劃為例,當時花費達30億美元,耗時13年才完成大約含25000個基因的人類基因組測序及分析。若應用當代先進的數據收集分析方法,使用一個如U盤大小的裝置區完成這項工作僅需幾小時就足矣,其花費也僅僅是1000美元。
5.大數據導致更大的隱私威脅:
你也許只是從大「據」考慮,但是這句格言不再像以前一樣好用了。若說大數據與廣度攸關是正確無誤的,但是深度對大數據來說也是同等重要的。
網路巨頭如Facebook和Google不單單積累了廣度上的數據—大量的用戶(FB擁有9.55億用戶),他們對深度上的數據–用戶(使用網路的)數據也了如指掌。譬如,他們知道你搜索的內容,你點擊了什麼頁面以及你認識什麼人。最大的網路大鱷擁有足以讓他們無所不知的大量的數據。
在這里的技術力量,文化進步和利潤的相交之處,有一件事是確定的:數據越大責任越大(蜘蛛俠中槍)。
❺ 「大數據」的根本是為了價值創造
「大數據」的根本是為了價值創造
前面什麼是「大數據」我就很快的過一下,我們看到了「大數據」的一些想法。更重要的是我們怎麼看待「大數據」,怎麼影響到業務模式的變革,我們也會提到一些案例,我們看到我們的客戶在整個「大數據」的變革中會做一些什麼東西。在當中最重要的,剛剛吳老師也提到,不但是獲取數據,而是如何用它,不管是組織、流程、能力各方面怎麼做很好的准備,怎樣去挖掘這樣的一個機會。
首先剛才大家也提到了,現在進入到了一個「大數據」的時代,如果大家看我們這里做了一個很快的統計,在全球幾百個主要的媒體上面,看到在一些標題,或者是在一些主要的段落裡面,談到「大數據」的這個字的話,其實十年前就已經開始有了,但那時候還不是太多。其實在比如說2005、2007年的時候,看最火的字可能是電子商務,看得更加多。2001年時候看到的最多的字是雲計算。看最近兩三年,「大數據」就突然間增長的非常快了。當然不是說電子商務、雲計算已經落後了,這些還是經常看到的自眼,但「大數據」會看到非常高的比例。
「大數據」剛才大家都談到了一些不同的定義,「大數據」是什麼東西,剛才也提到了,其實十多年前、二十多年前,我們就已經會挖掘客戶的信息了,會做分析了。但是究竟「大數據」和以前有什麼不一樣?首先在量上面,是海量的數據,是本來一些的方法、工具,這些是分析不了的,是做不了的,這個量是非常多的。給大家一個概念,現在世界上所有的數據,90%是在過去兩年產生出來的,所以你會看到,我們的時間再過一年的話,信息量的增長完全是一個爆炸性的增長。比如說另外一個,可能剛才談到視頻分享網站,有人做過一個統計,比如說你現在坐在一個電腦面前一直看這個視頻的話,可能需要一兩千年才能夠看完。這些數據量這么多,當中對你有用的不一定會太多,怎麼挖掘海量的數據,這個量是一個很大的重要的一點。
除了以外,另外一點就是現在不同種類的數據,以前的話,可能在網上你看到了一些文字的資料,現在找東西的話,你會找圖片,會找不同的視頻,有時候還會有很多不同的模式,比如說你的PUO這些東西,或者是其他的很多不同的種類的信息,這個也越來越多。
其實很多時候,剛才已經提到了,我們要分析,客戶分析的數據不但是分析自己的數據,很多時候是要把怎麼樣和外部的數據結合起來。比如說大家一直可能會談到沃爾瑪,怎麼樣挖掘沃爾瑪自己的客戶,他買了什麼東西,對未來會買什麼東西做一個預期,或者是對未來的什麼折扣感興趣。但是有一個有趣的事情,沃爾瑪不但看自己的數據,還會把這些數據和天氣的數據放在一起看。比如說下雨的時候哪些貨品要多做一點,或者是有台風的時候,客戶會來多買什麼東西。把不同種類的數據和不同來源的數據做一個很好的分析的話,這個也是「大數據」時代的一個挑戰。
另外一點,在媒體裡面常常談到的「大數據」是實時,這個是很重要的,不但是量、種類,要實時的應對,比如說十年前客戶做調研和客戶細分,需要兩三個月的時間來做分析,來做出結果怎麼服務好客戶。但是現在客戶的需要已經不一樣了,怎麼實時給出應對是重要的一點。
其實我們對「大數據」的理解也有一定的定義,就剛才提到的,其中首先一點是怎麼樣收集,怎麼樣去分析,怎麼樣去理解這些大數據,這當然是很重要的一部分,這裡面很重要的一點,不單單是獲取,因為我們常常看到一些客戶可能覺得浪費時間,外面有那麼多的數據,怎麼多拿一點進來,但是更加重要的是你有沒有這個能力,怎麼用這個數據,這個能力非常重要。
這裡面提到兩個另外的點,一個是「大數據」不是為了獲取分析來做,更重要的一點是對於公司價值的創造,如果到最終這個數據你拿到了很多,分析了很多的數據,根本影響不了你的業務的話,這個也沒有什麼意思,所以價值創造是根本的一點。在這個過程中,我們相信「大數據」對業務的模式是一個很大的變革。所以我們在後面也會提到。
這裡面我們隨便看不同行業裡面的經驗。今天早上和一些同事聊的時候,大家也在談,其實「大數據」究竟對什麼行業有最大的影響呢?其實我覺得這個問題是很難回答的。因為我們看到很多客戶一直問我們「大數據」對他們有什麼影響,電子商務對他們有什麼影響。這裡面不單單是消費者的公司,或者是B2B的公司,或者是醫葯的種種的公司,主要是看怎麼應用「大數據」,一方面是他們的數據量,數據的來源越來越多了。還有就是剛才提到的,就是怎麼和外部的數據結合起來,做到對你業務有價值的幫助。現在價值創造往往上上億美元的收入,或者是成本方面的增長。
剛剛提到其實不同的行業裡面會有不同的應用,這一頁是我們幾個月之前做的,這上面可能有一些還沒有做「大數據」的公司現在已經開始做了,這個變化是非常快的。舉一個例子,一個保險(放心保)方面的,過去可能看不同人的年齡,以前開汽車有沒有遇到過意外,然後決定你的保險要付多少錢。現在是有一個儀器放你車裡面,看你開車是否安全,這個就可以給不同客戶更加個性化的定價。這個就是一個「大數據」的應用。另外一種,我覺得也很有趣的例子,大家知道現在是歐債危機,很多政府都遇到了這樣的挑戰,比如說義大利政府,義大利政府不但是考慮有沒有人逃稅,不但是要看報上來的數據,在法律允許的情況下,結合了很多消費的帳單、電話費的帳單,比如說你有沒有去外地旅遊等等,你沒有那麼高的收入,為什麼可以有這么高的消費,把這些數據和他們報上來的收入比較,發現20%納稅人是高風險的逃稅人。這個也是一個「大數據」的應用,不但是在業務裡面、商業裡面,也在政府裡面,很多行業裡面都會有不同的應用。
這裡面談一下背景,因為很多客戶常常問我們,什麼叫做商業模式,我們有沒有一個好的定義。這個也是我們很多客戶比較接受和認可的定義。商業模式,在這裡面有兩個大的方面,一個是價值主張,比如說從所提供的產品服務究竟是什麼東西,目標客戶群是誰,收入的模式,比如說定價、商業模式怎麼樣在裡面賺錢的,收入是怎麼樣來的,這也是一部分,我們叫做價值主張。
另外一方面是在運營模式方面,比如說在整個的價值鏈當中,怎麼控制這個價值鏈,或者我們在價值鏈的哪個部分去玩,其中組織的架構,也會影響到商業模式,最終也有成本的模型、成本了模式。我們對於商業模式的變革,商業模式的改造裡面,定義在這六個模式裡面至少有兩個是在改變,才叫做商業模式的改變。比如說你只是改變了目標客戶群,其他沒有什麼改的,這個只是客戶群的改變,如果只是多了一點服務和產品,在其他方面也沒有改的話,這個也不是根本的商業模式的改變。但是我們後面談到例子中就會看到,很多客戶在運用「大數據」的時候,有兩方面的改變和影響,這個就是根本上的商業模式的變革。
「大數據」如何影響到商業模式的變革。這裡面有幾個大的方面,首先是數據的來源,根據提到數據越來越多,在中間怎麼樣影響總體的經濟鏈,或者是總體價值鏈。右邊是結果了,剛才提到,可能是六個方面影響我們的商業模式。但是如果大家看一下左邊的數據方面,其實數據來源,或者是量越來越多,這個當然是一個很重要的一點,但是剛才吳老師和殷總也提到,獲取數據的成本,或者是儲存數據的成本越來越低,這個是使得大家願意越來越多的使用「大數據」。但是更加重要的是要有越來越先進的分析工具,來幫助大家做這些分析,不然的話,如果還是用十年前,十五年前的工具,雖然數據多了很多很多,但是也做不住很好的結果。比如說我們自己內部,過去5年也建立了一個團隊,專門看地理方面的數據,全球不同地方的地理數據,比如說中國國內,什麼地方有餐廳,什麼地方有零售店,其實現在有很好的數據做分析的,十幾年前沒有這樣的資料庫,現在有了,我們也有這樣的能力。我們也有團隊,比如說看全球零售方面的數據分析。比如說幾年前我們用很簡單的工具來做分析,因為數據少,很容易做。而現在我們自己的咨詢公司也會建立這樣的能力。
最後當然是客戶他們,這些消費者也很願意的和大家分享這些數據,當然在隱私這些方面可能還是一定的挑戰,但是對於他們來說,他們貢獻的這種數據,獲得了這種便利,比如說在亞馬遜上面可以提供書的建議,或者我到沃爾瑪裡面,有特價的折扣給我,比較個性化,這些是他們比較願意用他們的數據來換取一些價值。這些種種方面就是為什麼現在數據越來越多,怎麼樣影響到業務模式的變革。
在當中,我們一會兒會談到比較大的一點,就是中間談到怎麼樣真正的影響價值鏈。比如說現在有了那麼多的數據,而且流通性那麼好的話,大大增加了在交易、客戶、產業之間的透明度。其中還談到了交易成本都有一定的降低。比如說以前一家公司要做針對性的營銷的話,以前可能是很難做的,以前做營銷,打一個廣告,面對很大的受眾,但是不一定很有針對性。而現在用比較低的成本,你有了這個能力,有了這個數據,就可以給客戶很個性化的優惠和產品。這個以前是不可能發生的。
在價值鏈不同部分的規模變革,或者是客戶的期望值,這個也是很重要的部分,為什麼這些公司要根本的改善業務模式,很重要的一點是客戶的期望值在改變。大家覺得現在有那麼多的數據,我只看到競爭對手做了那麼多的東西,但是我們對於公司的期望會越來越高。
剛才談到業務模式的六大方面。
我在這裡面就不多提這些例子了,我後面會比較仔細的談在企業和「大數據」當中怎麼樣去競爭。
在這個方面,首先我們很多時候當客戶在看這個問題的時候,會從幾個大的方面看。其中最重要的,就是最上面的,就是整個他們對「大數據」方面的整體的定位,或者是戰略是怎麼樣的。這個是很重要的。剛才也說了,不是為了獲取數據而獲取數據,不是為了分析數據而分析數據,最終希望你怎麼樣去使用,這個在你的業務裡面是希望達到什麼樣的效果,這個是很重要的一點。這個整體的方向,高層、領導層方面的一些大力的資源方面的支持之外,下面我們會從幾個大的緯度看。
第一個,怎麼樣利用這些數據。這是很重要的部分。數據的用途在哪裡。
第二個,我們叫做數據的引擎,其實就是數據基礎的建設。
第三個,生態的系統,整個生態系統怎麼樣去看。
這裡面很快把每一點說一下。首先在上面怎麼樣利用這個數據,我們這裡面看到兩個大的方面,一個是在機會方面,一個是信任方面。機會方面就是要了解用這些數據會達到什麼目的,會有什麼樣的機會,比如說要挖掘一點對業務方面的洞察,還是希望對整個公司的流程有更加好的完善,更加好的改進呢,還是說你希望給客戶提供一些新的產品,以前可能是沒有辦法提供的,比如說你本來有不同的業務,本來是獨立的提供業務,現在不同單元可以分享提供業務,提供新的數據。怎麼樣利用這些數據,就是要看機會方面,有哪些機會。第二方面叫做信任。這裡面其實有兩大部分,一個是剛才提到的數據是不是也願意的提供一些數據給你,就是說讓你獲得一定的便利,獲得一定的優惠,然後客戶能夠信任你,讓你收集這樣的數據。另外一部分就是你怎麼樣建立這個形象,就是在整個的過程中,客戶願意給你,但是慢慢的你要建立一個可信任的形象,就是大家覺得給你這個信息是安全的,就是這個信任。所以怎麼樣利用和獲取信任是很重要的部分。
第二個部分是數據的引擎。第一個是在技術方面,怎麼樣建立這個平台,這個當然很重要。右邊是組織的架構,內部的話,你的組織需要什麼樣的能力,需要什麼樣的人才,比如說組織架構,比如說剛才殷總提到在一個公司裡面有一個CBO,除了這個之外,有一群人在總部,可能對「大數據」分析比較了解。但是在每一個業務單元裡面,是不是也要有人確定這些數據怎麼用,怎麼獲取這些數據,日常和客戶的溝通過程中,怎麼收集和利用這些數據,這也是很重要的一點。這個是第二個部分。
第三個部分是數據的生態系統了,其實看到了很多的公司,他們不單單是看自己的數據,他們是很好的怎麼樣確保和他們整個生態系統,或者是第三方的夥伴,他們怎麼樣分享這些數據,這個總體來說是非常重要的一部分。所以很多時候,我們在過去好幾年做了有上百個不同行業的「大數據」的項目之後,總結出來我們客戶常常遇到的問題,可能都是這樣,很多時候客戶一開始來談的時候,可能都談上面的機會,究竟什麼是大數據,給我們什麼樣的機會,但是他們慢慢了解之後,知道了這個還不是最大的問題,有了系統和做分析的人,這些都OK了,但是更多是在組織、流程、生態系統方面是更加的挑戰。
在其中,我這里准備了兩個例子,一個是谷歌,大家也是比較知道的,在運用數據方面是一個比較大、比較領先的公司。在當中會看到我也會從剛才提到的六個方面,怎麼樣使用數據,裡面是怎麼樣挖掘不同的機會,怎麼樣得到客戶的信任。第二個方面是數據引擎方面、平台方面、組織方面是怎麼樣做的,最後是怎麼樣參與生態系統,建立和不同夥伴的關系。
谷歌也很有戰略,看到了很多大家還沒有看到的機會,他們很早的時候就已經先做了,這個也是客戶裡面現在比較大的改變,現在有很多東西你要嘗試的,因果關系你還沒有看到很清楚,但是看到了關聯性,雖然看不到因果關系,但是看到了就要嘗試。谷歌是比較領先的一個。在當中會看到,在數據用途方面,比如說左邊這里,他們常常有很多不同的應用,不管是地圖,不管是在其他方面,比如說視頻種種方面,有很多不同的應用,有上百種不的應用,就一直在試。它的資料庫並不一定有很多,可能是有單一的資料庫,在這個資料庫裡面可以讓你做很多不一樣的東西,這個就是客戶在想的,其實更加重要的不是要獲取更加多的數據,其實很多時候客戶已經有太多的數據了,甚至有時候他們覺得自己的數據不夠,一定要到外面找,其實他們沒有想清楚自己的數據怎麼用,單一的資料庫已經可以讓你做很多不同的東西出來,讓你嘗試不同的東西。
另外一方面,和客戶怎麼建立信任,比如說一個方面,客戶要慢慢的、很快的感受到他們在這些數據方面裡面獲得的一些好處在哪裡。另外一方面,他們收集了這些數據,谷歌這方面做得挺好的,比如說社會責任、社會形象、捐款,這方面他們做得也是很多的,這是為公司建立起比較正面的形象,這方面讓客戶覺得和你分享這些數據,你也是比較可信的公司。在怎麼獲取,怎麼使用方面,其實很多客戶是會考慮非常清楚的。
第二個方面是數據引擎,在整個基礎建設方面。首先是技術方面,技術方面我當然不是懂很多。首先是要有統一的自己的資料庫,然後在當中擴充性也是比較大的,剛才提到,拿了那麼多的數據,怎麼把資料庫擴充、擴容,這個是非常重要的一點。另外一點是在組織方面,比如說這裡面提到,當然你需要一些,我們這里說到數據的工程師,在很多公司裡面,這個量不一定很多的,不是一家公司可能有上萬人,就要有幾百個這樣的數據工程師,很多時候有十幾個人的小的團隊,但是能力都是比較強的,知道怎麼進行數據挖掘,怎麼把系統建立起來,這個是非常重要的一點。另外一個是在當中右下角,吳老師提到的一點,不是說要根因這方面的東西,其實他們挖掘這個東西的時候,最重要是看關聯性,兩個動作有一定的關聯,然後就知道要去嘗試這個東西,然後慢慢的看究竟為什麼有這個原因,這個是和傳統做一些商業決定是很不一樣的。
對生態系統,這個也都不用說了,這裡面比如說谷歌通過參與不同生態系統裡面,和很多第三方夥伴一起來合作。有一些,比如說上面的是整個搜索的生態系統,下面可能地圖也有生態系統,不同裡面,和不同的很多人在合作,在工作。
後面我很快的說另外一個例子,這個是寶潔。也是從剛才的六個緯度看一下,怎麼使用這些數據,基礎怎麼建立起來,最終怎麼樣建立很好的生態系統。這個是剛才提到的上面的三角形,對於大數據整體的戰略和定位是怎麼樣的,可以看到在過去可能幾十年的歷程中,很多時候,比如說七八十年代、八九十年代,不但是寶潔,很多公司都在想生產力怎麼提升,流程怎麼做得更加好,或者是比較根本的業務方面的東西,但是會看到在過去幾年,有很多大的投入,都是在「大數據」、運用電子商務的機會等,在公司的高層是有很大的決心要做這個工作。所以你會看到,在數據的用途方面是有很多不同的例子,這裡面只是有幾個例子而已。第一個是在社交媒體方面,其實有一些不單單是他自己的數據,還有外部的數據,他們進行分析,分析之後看到不同客戶群的趨勢,客戶在看什麼品牌。後來看到了一個客戶很認同的品牌,買了進來這個品牌,然後客戶增加了10倍,這個是很重要的一部分。
第二部分是流感方面的葯,剛剛第一個是談到客戶端的數據,第二個是在庫存上,怎麼樣提供給零售商足夠的庫存。這個葯可能30%的存貨的機會,就是你買這個產品,很多時候是70%的時間是缺貨的,但是慢慢經過所有數據的挖掘,就把線下的庫存做得更加好了,所以會看到是不同緯度來做「大數據」。第三個方面是怎麼挖掘這些「大數據」。每一天收到的電郵,或者是服務中心收到的電話大概是15萬個,每天都挖掘這些信息,這些人打電話進來到底是問什麼問題,發郵件來到底是問什麼東西,把這些理念灌輸到不同的業務單元裡面。右邊也是,要給消費者一個很有信任的感覺,大家才會比較信任的願意分享和讓你使用這些數據。
另外總體的引擎,左邊談到了平台,前面談的比較多的是技術平台方面,但是也很重要的一個,就是在管理的平台上怎麼樣去做。比如說這裡面提到一個例子,首先要有統一的數據展示的方式,每周一全球的經理開會,就是要把統一資料庫裡面的發現、展示做一定的使用和研究。然後影響力,在大數據的分析等方面都為高層做很透明的信息平台。
在右邊,就整體的組織方面,首先是很清晰的,在集團領導的層面,他們把重要性放得最高的,剛才聽到,過去可能是流程提升、效率優化等,現在「大數據」和電子商務這塊最重要,這個是組織方面。
剛才也提到,在中央,在集團的層面有一個小的團隊,這些可能都是最聰明的PHD、MBA,然後讓他們主導在數據方面的戰略,是同一時間不但是在集團的層次,在不同業務層面,有專門人談數據挖掘和談「大數據」的。
最後是生態系統,雖然以為寶潔是很大的公司,他們有很多的資源和數據,但是要看到和外部,不管是零售商還是經銷商,有很多方面的配合是他們要做的。內部有很多的合資公司,怎麼樣把他們的系統、數據和零售商等做一個聯系,這是很重要的一點。右邊也是有一些,和主要的合作夥伴,比如說谷歌,還有零售終端,比如說沃爾瑪等,這些也是要分析的合作的夥伴。整個的生態系統裡面,究竟要做什麼東西,這個也是很重要的,不是有了數據就可以了,最重要的是要把生態系統打造起來。
❻ 下一代百度地圖,正在讓數據的價值爆發
大數據的價值越來越明顯,但是長期以來公眾一直認為大數據僅僅只能提升效率而已。但實際上隨著時間的推移,大數據的作用開始變得更加多元,而其價值逐漸開始釋放。
當前,大數據的智能化生產、數據開放共享、挖掘數據多元價值正在成為大數據行業增長的全新能力,也正在為行業帶來更大的想像空間。
在商業層面,網路地圖則聯合了萬達、王府井百貨嘗試了LBS場景營銷,通過創新的方式幫助萬達和王府井百貨更加精準地引流注冊會員。此外,網路地圖大數據還能夠具有商業預測、分析價值,例如網路地圖的大數據選址能力,以及此前通過蘋果旗艦店的排隊數據,成功預測其銷售額下降。網路曾表示自己掌握的大數據還可以用來預測中國的其他經濟指標,這些功能對於需要及時獲取可靠數據來做出決策的市場參與者和政府機構來說具有重要價值。
所以數據的價值並非是單一的,而是極為復合,而隨著不斷的增長,還有著更多維的價值潛力。
結語:
隨著大數據的不斷擴充,其價值也越來越大。而智能化生產數據、數據開放共享以及挖掘數據多元價值,將會成為其增長的全新焦點。網路地圖此次的生態大會,則給了行業非常好的啟示。
作者微信公眾號:「首席發言者」
❼ 常用的大數據工具有哪些
1. 開源大數據生態圈
Hadoop HDFS、Hadoop MapRece, HBase、Hive 漸次誕生,早期Hadoop生態圈逐步形成。
開源生態圈活躍,版並免費,但Hadoop對技術要求權高,實時性稍差。
2. 商用大數據分析工具
一體機資料庫/數據倉庫(費用很高)
IBM PureData(Netezza), Oracle Exadata, SAP Hana等等。
數據倉庫(費用較高)
Teradata AsterData, EMC GreenPlum, HP Vertica 等等。
數據集市(費用一般)
QlikView、 Tableau 、國內永洪科技Yonghong Data Mart 等等。
前端展現
用於展現分析的前端開源工具有JasperSoft,Pentaho, Spagobi, Openi, Birt等等。
用於展現分析商用分析工具有Cognos,BO, Microsoft, Oracle,Microstrategy,QlikView、 Tableau 、國內永洪科技Yonghong Z-Suite等等。
❽ 大數據平台是什麼什麼時候需要大數據平台如何建立大數據平台
首先我們要了解Java語言和Linux操作系統,這兩個是學習大數據的基礎,學習的順序不分前後。
Java :只要了解一些基礎即可,做大數據不需要很深的Java 技術,學java SE 就相當於有學習大數據基礎。
Linux:因為大數據相關軟體都是在Linux上運行的,所以Linux要學習的扎實一些,學好Linux對你快速掌握大數據相關技術會有很大的幫助,能讓你更好的理解hadoop、hive、hbase、spark等大數據軟體的運行環境和網路環境配置,能少踩很多坑,學會shell就能看懂腳本這樣能更容易理解和配置大數據集群。還能讓你對以後新出的大數據技術學習起來更快。
Hadoop:這是現在流行的大數據處理平台幾乎已經成為大數據的代名詞,所以這個是必學的。Hadoop裡麵包括幾個組件HDFS、MapRece和YARN,HDFS是存儲數據的地方就像我們電腦的硬碟一樣文件都存儲在這個上面,MapRece是對數據進行處理計算的,它有個特點就是不管多大的數據只要給它時間它就能把數據跑完,但是時間可能不是很快所以它叫數據的批處理。
Zookeeper:這是個萬金油,安裝Hadoop的HA的時候就會用到它,以後的Hbase也會用到它。它一般用來存放一些相互協作的信息,這些信息比較小一般不會超過1M,都是使用它的軟體對它有依賴,對於我們個人來講只需要把它安裝正確,讓它正常的run起來就可以了。
Mysql:我們學習完大數據的處理了,接下來學習學習小數據的處理工具mysql資料庫,因為一會裝hive的時候要用到,mysql需要掌握到什麼層度那?你能在Linux上把它安裝好,運行起來,會配置簡單的許可權,修改root的密碼,創建資料庫。這里主要的是學習SQL的語法,因為hive的語法和這個非常相似。
Sqoop:這個是用於把Mysql里的數據導入到Hadoop里的。當然你也可以不用這個,直接把Mysql數據表導出成文件再放到HDFS上也是一樣的,當然生產環境中使用要注意Mysql的壓力。
Hive:這個東西對於會SQL語法的來說就是神器,它能讓你處理大數據變的很簡單,不會再費勁的編寫MapRece程序。有的人說Pig那?它和Pig差不多掌握一個就可以了。
Oozie:既然學會Hive了,我相信你一定需要這個東西,它可以幫你管理你的Hive或者MapRece、Spark腳本,還能檢查你的程序是否執行正確,出錯了給你發報警並能幫你重試程序,最重要的是還能幫你配置任務的依賴關系。我相信你一定會喜歡上它的,不然你看著那一大堆腳本,和密密麻麻的crond是不是有種想屎的感覺。
Hbase:這是Hadoop生態體系中的NOSQL資料庫,他的數據是按照key和value的形式存儲的並且key是唯一的,所以它能用來做數據的排重,它與MYSQL相比能存儲的數據量大很多。所以他常被用於大數據處理完成之後的存儲目的地。
Kafka:這是個比較好用的隊列工具,隊列是干嗎的?排隊買票你知道不?數據多了同樣也需要排隊處理,這樣與你協作的其它同學不會叫起來,你干嗎給我這么多的數據(比如好幾百G的文件)我怎麼處理得過來,你別怪他因為他不是搞大數據的,你可以跟他講我把數據放在隊列里你使用的時候一個個拿,這樣他就不在抱怨了馬上灰流流的去優化他的程序去了,因為處理不過來就是他的事情。而不是你給的問題。當然我們也可以利用這個工具來做線上實時數據的入庫或入HDFS,這時你可以與一個叫Flume的工具配合使用,它是專門用來提供對數據進行簡單處理,並寫到各種數據接受方(比如Kafka)的。
Spark:它是用來彌補基於MapRece處理數據速度上的缺點,它的特點是把數據裝載到內存中計算而不是去讀慢的要死進化還特別慢的硬碟。特別適合做迭代運算,所以演算法流們特別稀飯它。它是用scala編寫的。Java語言或者Scala都可以操作它,因為它們都是用JVM的。