導航:首頁 > 網路數據 > 2012teradata大數據峰會

2012teradata大數據峰會

發布時間:2023-07-29 20:47:45

A. 大數據時代分析變革即將來臨

大數據時代分析變革即將來臨

日前,Teradata首席分析官Bill Franks在北京與部分業內媒體記者舉行了一次關於大數據分析的圓桌會議,在這次會議上,Bill Franks帶來了他的新書《數據分析變革》,並就大數據分析的最新發展趨勢發表了精闢見解。

Bill Franks表示,經常會有人問這樣的問題,大數據是不是存在泡沫,這種泡沫會不會破裂?比如,前段時間一個記者問我,說他們估計差不多一年半之後,大數據泡沫就會破裂。他當時問我大數據是否有泡沫的時候,我的答案是這樣的,從某種方式來說是有泡沫,從另一種方式來說沒有泡沫。

為什麼說有泡沫呢?確實現在市場上有一些過多的炒作,認為通過大數據能夠獲得所需要的一切。如果不能實現這些目標,有可能標志著大數據泡沫會破裂。如果不是泡沫的話,再過多少年之後進行回顧,會覺得當時對大數據的看法是非常滑稽的。

我們所經歷的真正的互聯網泡沫,是大家非常熟悉的,從1999年到2000年。當時並不是說互聯網本身缺少價值,而是認為這種價值的獲得太容易、太快速,所以造成了當時的泡沫。但是看一下目前的情況,互聯網已經深入到社會的方方面面,給人們的工作、生活帶來了非常深遠的影響。目前,大數據也是這種情況,現在大數據的發展非常艱難,人們有各種各樣的說法。如果再過五年或者十年,我們會看到大數據可以帶來非常好的影響。過去大數據都是在企業裡面,各個領域都有大數據。前幾年,Teradata提出企業級數據倉庫,就是如何把這些數據源整合在一起,來挖掘企業內部的數據價值。

Franks說,我們要避免重蹈覆轍,目前看到在企業里有很多單獨的大數據部門,大數據分散在各個地方,這些數據也由不同的人員加以管理。我們應該避免過去傳統數據管理問題,要把數據都統一集中在一起。我們會提供相關的工具、技術、專業服務,幫助客戶更多地挖掘數據價值。我們能夠幫助挖掘客戶的業務問題所在,給他們找到具體方法,能夠提供具體的工具和技術,更大地發揮大數據的作用。一方面我們能夠在前端幫助客戶發現數據的價值,另一方面在後台也能進行跟蹤,給它進行量化,發現數據價值所在。

Bill Franks認為,我們現在面對著數據分析的變革,通過一種「手工定製」的辦法,針對企業具體的問題,做一些大數據的分析,給他們提供定製化的解決方案。這里涉及高價值的問題或者低價值的問題,一般都要探索哪些是屬於高價值的問題,需要有一些定製的或者深層的分析。對於那些低價值的問題,可以部署一些業務流程等進行解決。企業可以在技術、業務流程里,嵌入一些解決方案的數據分析,能夠自動實施,不需要太多的人工參與就能實現。

談到電信領域的高級分析,Bill Franks說,從電信商運營的角度來說,也需要大量的高級分析,比如一些無線的基站和鐵塔,什麼時候會出現問題。包括一些網路上傳送的速率情況,都傳輸什麼內容,是電子郵件還是什麼?這些分析與傳統的分析是不一樣的。傳統的分析是這個電話是誰打給誰的,而現在的分析更多一些,包括基礎設施、網路、基站等,很多環節都需要這樣的高級分析。

以上是小編為大家分享的關於大數據時代分析變革即將來臨的相關內容,更多信息可以關注環球青藤分享更多干貨

B. 當製造遇上大數據

當製造遇上大數據
大數據如今已經影響到企業生產製造、運營、管理的方方面面,本文從客戶管理、優化生產以及供應鏈管理三方面窺探大數據的無限可能。
小調查:大數據如何改造製造業?
由湯姆·克魯斯主演、斯皮爾伯格導演的影片《少數派報告》描述了在2054年,利用科技讀取「先知」腦波的畫面來偵察出人的犯罪企圖,從而准確預測犯罪行為,並在罪犯犯罪之前就能將其逮捕的場景。片中的「先知」是擁有超能力的「人類」,但在現實世界中,「先知」就是近年來我們經常提及的—大數據分析。專注於大數據分析的全球性軟體公司Teradata(天睿公司)國際集團總裁赫爾曼·威摩(HermannWimmer)認為大數據主要包含三大塊:一是傳統的數據,例如企業原來的交易系統、網路系統以及ERP系統等數據倉庫;二是感測器生成的數據;三是社交媒體上的數據。
「現在越來越多的行業都要適應大數據的趨勢,不僅限於原來的高科技、互聯網企業,現在包括通訊、金融、製造、能源等行業都在順應趨勢培養這方面的競爭力。」Hermann Wimmer 說,「用數據來驅動業務增長」是未來的方向。「例如,市場部門如何利用真實的數據來幫助制定市場成長策略;怎樣提升客戶體驗或者客戶滿意度;怎樣通過降低倉儲、物流的運營成本等讓企業運營得更智慧、更有效率;怎樣結合生產部門和其他部門的數據優化生產和運營能力,這些都是大數據的『用武之地』。」Teradata( 天睿公司) 大中華區首席執行官辛兒倫(AaronHsin) 舉例道。
對於傳統製造業來說,大數據能在哪些方面進行「顛覆」和「改進」?麥肯錫咨詢公司在近日發布的《如何利用大數據改進製造業》的報告中列舉了10 條大數據顛覆製造過程的路徑,涉及優化生產進度;提高製造績效;精確供應商管理;追蹤產品質量,改進工作流程;以銷定產,制定生產計劃;量化產能,追蹤設備運轉效率;以及提供生產設備預防性維護建議等方面。
可以說,大數據影響到生產製造、運營、管理的方方面面,而從目前大數據在製造業的應用范圍來看,我們想從客戶關系管理(CRM)、優化生產以及供應鏈管理三方面窺探大數據的無限可能。
「大海撈針」成為可能
在當今經濟環境中,良好的客戶服務和客戶體驗至關重要。越來越多的企業通過挖掘客戶|數據提升客戶關系,了解客戶需求。今天的CRM 數據分析能力已經不止局限於客戶郵件、電話等數據,而是能夠識別客戶購買行為,了解客戶情緒。辛兒倫切身感受到數據分析在客戶管理方面應用的變化趨勢:「過去更多是在數據倉庫針對客戶關系的管理和體驗,特別是對客戶|數據和CRM數據進行分析和探索促進營銷增長的途徑和手段。隨著技術和數據架構的演進,現在的數據已經延伸到很多范圍,比如位置數據、基站數據、還有通話記錄和移動互聯網上的消費者行為等。利用這些來自多渠道的數據建立分析模型,以便從360 度去觀察客戶的興趣、愛好,並預測未來的行為,從而制定個性化的營銷策略。」
發生在海爾的一個營銷故事可以從這方面揭示大數據的「神奇」。2012 年,海爾推出帝樽空調,如何精準地預測有哪些用戶可能選購帝樽空調?如何送去個性化的服務方案?海爾從SCRM 會員資料庫中提取了數萬名用戶數據,與中國郵政的名址資料庫匹配,建立「look-alike」模型。此外,海爾SCRM會員平台還同旅遊、健康類雜志有合作。海爾通過查詢訂閱名|錄,發現北京一小區有人訂閱旅遊雜志,其中有位陳先生。海爾得出「他對環境、自然應該感興趣」的結論,於是推測,他極有可能對帝樽空調除PM2.5功能感興趣。接著,陳收到了海爾投遞的一封直郵單頁,除了公益環保知識外,重點介紹了帝樽空調的除PM2.5 功能。接下來的故事就水到渠成了,陳帶著直郵單頁,到附近的商超購買了空調,並且還登錄海爾官方網站,自主注冊成為海爾會員。
從這個案例可以看出,在客戶管理方面,企業營銷的對象不僅是一群人、一類人,而是具體的某個人。其次,跨領域數據的整合也很重要,當然企業應當首先明確需要哪些領域的數據和如何獲取這些數據。Hermann Wimmer 例舉了兩個行業之間的數據共享帶來的商業價值—汽車行業和保險行業。「買車的人都要上保險,每一個司機由於自己的駕駛習慣不一樣,保險公司對於他們的評估也是不一樣的。如何才能更准確地評估一個司機到底屬於高風險還是低風險駕駛習慣,就取決於他所開的車。通過車上所裝載的100多個感測器傳回的數據,可以了解他的駕駛習慣,然後判斷他屬於什麼級別的風險類別。比如,他不超速、駕駛平穩,就屬於低風險,反之,開的很快就屬於高風險類別。」Hermann Wimmer 說,這兩個行業密切的聯系就是由感測器帶來的數據連接起來的
數字化、智能化的生產過程
在傳統的製造企業中,大量的數據分布於企業中的各個部門中,要想在整個企業內及時、快速提取這些數據存在一定的困難。譬如,企業資源規劃系統(ERP) 數據、製造執行系統(EMS) 數據等分別位於各自的系統中,除此之外,在一些智能化的工廠里,設備、原材料等都被嵌入微型處理器、感測器,這些裝置產生大量的數據。人們在將製造過程數字化的同時也為數據處理和分析提出了難題。如何將這些數據放置到一個技術處理平台上對於優化生產流程等有重要意義。Teradata( 天睿公司) 大中華區大數據事業部總監孔宇華指出,新的技術可以把人和人、物和物及事件之間的關聯性找出來,但是前提是這種大數據分析是建立在一個統一、可以實現數據流通的平台上。這個可供訪問的平台,能夠整合不同系統內的數據。
最簡單直接的方法就是創建產品生命周期管理(PLM) 平台,它也是一種企業管理軟體,但好處在於可以充分整合來自研發、工程、生產部門的數據,對工業產品的生產進行虛擬模型化,優化生產流程,確保企業內的所有部門以相同的數據協同工作,從而提升組織的運營效率,縮短產品的研發與上市時間。西門子工業軟體( 上海) 有限公司的高級業務顧問周克虎說:「拿汽車行業為例,汽車研發是個極其復雜的過程,一方面,它需要多個職能團隊的通力合作。另一方面,所有這些團隊還要處理大量的數據。為了避免溝通不力,確保生產過程的順暢運行,工程團隊不僅要管理團隊內的數據,還必須時刻掌握生產部門的質量控制團隊的工作進展。」
PLM 匯集從初稿到詳細設計過程、再到實際生產的所有相關信息。因此,企業可以通過PLM 收集的此類數據來優化設計和生產過程。例如,奇瑞汽車利用PLM 平台, 將生產規劃、模擬和實際生產,把製造和產品研發聯系起來。例如,尺寸分析在車身設計中具有重要作用,奇瑞的研發人員利用PLM 工具進行尺寸分析,能夠在設計的早期階段就能確定設計結構和生產方法是否符合技術規范,以便及早制定解決方案來優化這些因素。同時利用這些模擬程序,還可以進行各種汽車安全性能的測試等。
舉例, 西門子的PLM 軟體平台上可以做的差異分析,它能在計算機生成的三維模型的輔助下模擬生產工藝,能夠在執行實際生產之前洞察生產工藝中的薄弱點。奇瑞就曾利用它查出某車型頭燈生產中的問題,為公司避免了十多萬美元的損失。因為能夠在虛擬的環境中模擬產品設計、生產流程,工廠規劃效率得以提升,生產線生產效率也會提高。
大數據是製造業智能化的基礎,進而實現大規模的定製。由於消費者人數眾多,每個人需求不同,導致需求的具體信息也不同,加上需求不斷變化,就構成了產品需求的大數據。製造業企業對這些數據進行處理,進而傳遞給智能設備,進行數據挖掘、設備調整、原材料准備等步驟,才能生產出符合個性化需求的定製產品。「未來的製造將是數據驅動的。」Hermann Wimmer 說。
高效、科學的供應鏈管理
大數據所具備的預測功能使得大數據在供應鏈管理上的作用大大提高。製造業從供應鏈渠道,以及生產現場的儀器或感測器網路收集了大量數據。利用大數據對這些資料庫進行更緊密的整合與分析,可以幫助改善庫存管理、銷售與分銷流程的效率,以及對設備的連續監控。大數據可以使供應鏈中的物流業變得更高效:卡車內的電子車載錄像機可以提供卡車的位置;如何快速驅動感測器和射頻標簽等,幫助滿載的卡車更有效地結合道路狀況、交通信息和天氣條件以及客戶的位置,從而大大節省時間和費用。
孔宇華說,供應鏈上的大數據分析可以讓企業科學地制定銷售策略,而不是像過去那樣靠經驗和冒險。比如,一個生產羽絨服的品牌,在全國有幾千家店,10萬件貨品如何分配到全國的各個店裡。平均每個店1,000套?顯然不夠科學。因為南北方的供需市場不一樣,北方需求大但競爭品牌也多;此外,不同地域裡衣服的號碼需求也不一樣,南方人穿衣的號碼就小一點,北方人則可能大一點。通過大數據分析,對歷史數據、天氣信息等做分析可以給企業合理的建議:哪些貨運到哪裡最合適,從而避免了積壓或缺貨的庫存問題。
零售商在大數據的應用上處於領先地位。零售巨頭沃爾瑪開發了一個大數據工具,通過這個工具供應商可以事先知道每家店的賣貨和庫存情況,從而可以在沃爾瑪發出指令前自行補貨,極大地減少斷貨的情況和供應鏈整體的庫存水平。在這個過程中,供應商還可以控制商品在店內的陳設,而沃爾瑪也減少了這項的人力和資金投入,可謂雙贏。因此,對於製造企業來說,借鑒這些經驗優化供應鏈管理,從原料采購,到物流配送環節都非常有意義。根據大數據和相應的分析工具及時甚至事先選擇合適的供應商和物料投入生產加工,並且到物流階段可以選擇合理的配送方案,以及銷售策略。在大數據的支持下,一切都科學、合理,不僅提高了生產效率、服務質量,同時也降低了成本。

C. 全球最具影響力的大數據企業排行榜

全球最具影響力的大數據企業排行榜

目前全球大數據企業主要分為兩大陣營。一部分屬於單純以大數據技術為核心的新興企業,希望為市場帶來創新方案並推動技術發展。另有一些原本打理資料庫/數據倉儲業務的老牌廠商,他們打算利用自身優勢地位沖擊大數據領域,將現有安裝基礎及產品線口碑推廣到新一輪技術浪潮當中。下面我們就一起來看今天的十五家大數據企業名單,其中十家早已名滿天下、另外五家則屬初來乍到。

1、IBM
根據Wikibon發布的報告,作為2012年大數據業務營收成績最好的公司,IBM過去一年從大數據相關產品及服務中獲得了13億美元收益。其具體產品包括伺服器與存儲硬體、資料庫軟體、分析應用程序以及相關服務等。在IBM圍繞大數據開發出的產品中,DB2、Informix與InfoSphere資料庫平台、Cognos與SPSS分析應用可謂最為知名。IBM同時也為Hadoop開源數據分析平台提供支持。

2、惠普
惠普在2012年獲得的大數據營收名列第二,總值為6.64億美元。這家供應商還提供與之相關的硬體、軟體以及服務,其最為知名的方案當數Vertica分析平台。

3、Teradata
Teradata在2012年獲得全球第三大大數據廠商頭銜,其營收總額達4.35億美元。Teradata憑借自家硬體平台、資料庫以及分析軟體而聲名遠播。它同時針對零售及運輸行業推出了專門的分析工具。

4、甲骨文
盡管在大家眼中,甲骨文一直以其冠絕群雄的資料庫產品聞名,但事實上他們也是大數據領域的主要競逐者之一。其甲骨文大數據設備將英特爾伺服器、Cloudera Hadoop發行版以及甲骨文的NoSQL資料庫結合到了一起。2012年甲骨文名列大數據企業榜單第五位,營收總額為4.15億美元。

5、SAP
SAP推出了一系列分析工具,但其中知名度最高的當數其HANA內存內資料庫。2012年該公司在大數據企業競爭中位居第六,營收總額為3.68億美元。

6、EMC
EMC一方面幫助客戶保存並分析大數據,另外也充當著大數據分析智囊「營銷科學實驗室」的所在地——這家實驗室專門分析營銷類數據。EMC推出的最新爆炸性消息是與VMware及通用電氣一道支持Pivotal公司。Pivotal將對Hadoop與EMC的Greenplum資料庫與HAWQ查詢工具進行整合。EMC在2012年的大數據企業排行榜中位列第七,營收總額為3.36億美元。

7、Amazon
Amazon向來以企業雲平台聞名於世,但同時也推出過一系列大數據產品,其中包括基於Hadoop的Elastic MapRece、DynamoDB大數據資料庫以及能夠與Amazon Web Services順利協作的Redshift規模化並行數據倉儲方案。

8、微軟
微軟的大數據發展戰略可謂雄心勃勃,包括與Hortonworks建立合作關系、建立一家大數據新興企業以及推出基於Hortonworks數據平台的HDInsights工具。微軟的SQL Server資料庫也頗具知名度,且於2012年的大數據企業比拼之中位列第九,營收總額為1.96億美元。

9、谷歌
谷歌公司推出的大數據產品包括BigQuery——一款基於雲的大數據分析平台。該公司在過去一年中拿下3600萬美元大數據營收。

10、VMware
VMware向來以雲計算及虛擬化解決方案著稱,不過近來也開始逐步踏入大數據領域。今年六月虛擬巨頭公布的VMware vSphere大數據擴展版就很說明問題,這套方案使得vSphere能夠控制Hadoop部署並幫助企業用戶簡化大數據項目啟動流程。VMware在過去一年中獲得3200萬美元大數據營收,幾乎與谷歌公司持平。

11、業界新生代:Cloudera
相信目前已經沒人敢在列舉頂級大數據供應商時漏掉Cloudera。這家新興企業獲得1.41億美元風險投資,支持陣營中甚至包括谷歌、Facebook、甲骨文以及雅虎等在大數據領域赫赫有名的老將。該公司於2008年首次為企業客戶帶來Apache Hadoop平台。

12、Hortonworks
Hortonworks是另一家Hadoop供應商,並在2011年從雅虎公司分離出來之後獲得超過7000萬美元的風險投資支持。它在發展中將矛頭直指Cloudera,這位年輕選手背後則站著微軟、Rackspace、紅帽、Teradata等多家戰略合作夥伴。

13、Splunk
根據WIkibon的統計,Splunk是目前純大數據供應商中占據市場份額最大的企業,2012年全年營收總額達1.86億美元。該公司主要關注機器數據分析業務。

14、10Gen
10Gen最具影響力的得意佳作要數其開源MongoDB——一款業界領先的NoSQL資料庫。該公司的戰略投資夥伴包括英特爾、紅帽以及In-Q-Tel。10Gen去年在純Hadoop及NoSQL業務企業中名列第三,營收總額為3600萬美元。

15、MapR
大家想必聽說過MapR推出的NoSQL資料庫M7,這家公司與Amazon的雲平台及谷歌計算引擎達成了協作關系。去年MapR在純Hadoop與NoSQL業務企業中位列第四,營收總額為2300萬美元。

以上是小編為大家分享的關於全球最具影響力的大數據企業排行榜的相關內容,更多信息可以關注環球青藤分享更多干貨

D. 五年後,大數據會怎樣改變我們的生活

五年後,大數據會怎樣改變我們的生活
全球大數據和數據分析領導企業Teradata天睿公司(紐交所上市公司,2007年從母公司 NCR 公司剝離獨立)每年舉辦一次全球用戶大會(Teradata Partners),我們討論大數據不過三五年的事情,但是這場業內規模最大的數據分析峰會已經開了30年了。你能想到想不到的最資深的行業、商業智能、數據倉庫和大數據專家,而且全球大名鼎鼎的數據驅動型企業的用戶代表也都在這兒了。
會議間隙,記者采訪了Teradata天睿公司首席執行官兼總裁Mike Koehler、首席技術官Stephen Brobst,以及大中華區首席執行官辛兒倫(Aaron Hsin),他們從不同方面分享了大數據是怎樣改變和即將改變我們的生活,尤其是商業生活。

記者:中國公司已經開始從大數據中獲得立竿見影的商業收益嗎?
辛兒倫:其實,不管是立竿見影,還是潛移默化,就像本屆大會的主題Breaking Big所闡述的一樣,我們要積極擁抱大數據,在應用中要「打破束縛和限制」,不管是企業還是個人應該探索和追求「創新、差異化、勇氣、重大進展和卓越表現。」
所以,企業要在大數據上獲得收益,就必須堅持創新和追求創新,不管在技術上尋找突破,還是從業務流程、組織架構、企業的分析文化上,都要進行積極的創新。在國內,有十多個行業的客戶選擇Teradata做了很多創新的項目,包含政府與公共服務、地鐵、交通運輸、航空、通信行業、銀行、保險、證券、物流、快遞行業、製造行業、汽車、零售、電子商務、電力能源等行業。
比如在國內的快遞行業,我們幫助一家領先的快遞公司建立其數據收集和分析系統,協助完善其業務流程。通過找到它們業務流程中的「跑冒滴漏」環節,將業務環節的各種數據,例如掃描數據、車隊的運營數據等跨部門的數據整合起來,改善計費流程系統,實現關聯分析等高級分析功能,杜絕了以前流失的收入。據這家快遞公司測算,在項目結束的第一年,如果假設部署Teradata解決方案和服務的費用為1塊錢,那客戶由此帶來的收益就達到80塊錢,這就是非常顯著的改變。
在保險行業,大部分保險公司都以為客戶會在周末查詢有關保險的相關信息,所以投放網路廣告都選擇周末時段。其實,通過我們的大數據分析證明,其實應該是周一!就是大家最忙的工作日的第一天。所以,通過大數據分析,將廣告資源投放在適合的時間、適合的人群就是幫助企業獲得真正的受益。
針對營銷方面,我們經常會接到各種「騷擾」的推銷電話,其實這就是在不正確的時間、不正確的地點、用不正確的方式來提供給不恰當的人。企業應該基於客戶的數據分析,用更加智能的方式來服務,我認為這種不精確的服務應該會越來越少。
其實,不管是已經在駕馭大數據中受益的企業,還是那些剛剛開始征程的組織,很多企業曾經面對大數據項目的投資時都出現過猶豫、徘徊。當然,這就需要更大的勇氣支持。Teradata以及廣大客戶的調查已經看到,我們是時候積極行動了。我們也理解,文化上的轉變可能比技術和分析流程上的轉變歷時更久,但是我們一直強調,大數據從小做起,相信企業也能很快看到大數據的價值,看到數據分析在商業變革中帶來的不可替代的驅動力。
記者:大數據在技術層面的發展已經有了很大的突破,到底有哪些因素影響到大數據的技術進步真正投入到應用當中去?
Stephen Brobst:人們只是假裝熱愛技術進步,哈哈!實際上,人類希望看到的是一步步的改變,而不是翻天覆地的變化。
比如,像無人駕駛汽車技術早已存在,但是,現在直接讓大眾接受無人駕駛還是困難的,改變將會是循序漸進的。現在的汽車已經實現了自動泊車功能,這就是邁出了無人駕駛的第一步。無人駕駛更多是因為法規、監管、保險公司、律師之間存在的問題,現在還沒有很快大規模應用。
另外,盡管人的生命非常珍貴,但你的汽車上的感測器數量比人身上的可穿戴感測器多的多。通過佩戴感測器,大數據可以提供很多健康方面的數據分析。例如根據你個人的基因狀況,提供個性化的葯物和治療方案。這也是未來的一個發展趨勢。但是很多人害怕,因為個人隱私的原因,不希望把自己的基因組數據放在大資料庫裡面。
在大數據領域,目前發展非常迅速而且想像前景最為豐富可能是物聯網數據。Teradata公司認為大數據分析的未來圖景就是「萬物皆可分析」(Analytics of Everything)。此外,在Gartner公司的分析預測中,發布了2016 年可能影響企業的十大技術趨勢,其中萬物信息化以及物聯網等技術入選。
其實,這些預測正是技術發展現實的寫照。實現萬物皆聯網或者萬物皆可分析,最主要的是靠感測器技術。在我們目前生活的時代,感測器技術結合大規模並行處理能力,使我們能夠測量並整體分析幾乎所有現象。先進的儀器使我們能夠跟蹤萬物的變化,例如天氣變化模式、汽車駕駛習慣、乃至快餐店冰箱的溫度、醫院里(或家裡)病人的生命體征。將這些數據採集至資料庫,並運用廣泛的統計、分析及可視化工具對這些數據進行細致的分析。
正是由於這些感測器,我們的生活、工作中產生了新的數據源。例如,通過射頻識別讀取器,我們能夠進行零售庫存跟蹤與控制、醫療測試采樣跟蹤、預防欺詐行為等;通過GPS定位跟蹤器,能夠進行車隊管理和交通運輸和貨運管理;通過數據採集感測器,我們就能在製造業、環境保護、交通運輸系統中採集到實時的數據用於分析。
但是,物聯網之所以沒有快速發展起來主要有三個原因:第一,我們還需要更加廉價的感測器。第二,物聯網需要一個統一的標准,這點非常關鍵。例如,針對物聯網數據的分析,我們發布了Teradata Listener軟體,就是為了解決數據規格和實時分析的難度。第三,安全因素。物和物之間的聯網涉及安全,如果有不良數據傳送,比如說飛機、汽車、油泵等被黑掉就會造成事故,必須慎重。
記者:在您看來,五年之後大數據會讓我們的日常生活發生哪些改變?
Mike Koehler:根據IDC最新的報告,全球聯網設備的數量在2014年是103億,發展到2020年將會增長到295億。這將帶來社會和人類生活的巨大變化。我們不會像分析師一樣去預測未來,但是可以分享幾個大數據應用的非常實在的例子。
未來五年,雖然有很多東西已經實現了互聯,但是將還有更多的物品被連接到一起,導致新的大數據源不斷涌現,同時帶來新的洞察和前所未有的機遇。例如,在農業領域,大數據可以幫助葡萄酒庄酒庄,讓他們自動控制給葡萄澆水、施肥的時間,甚至進行針對性的管理。
我們的每架飛機、每列火車和地鐵、每輛車輛、甚至騎行的自行車等,都能夠通過感測器實現互聯,我們可以實時地了解到知道它們潛在的問題在哪裡,解決方案是什麼,怎樣去進行維修等。
對當前和未來發展,大家雖然都認識到大數據的價值或者帶來的改變,但是我更要強調大數據分析的價值!在一定程度上說,只是擁有數據並不能成為企業真正的競爭力,只擁有數據並不能給你的日常生活帶來太多便利。Teradata公司的客戶,美國全國保險公司客戶管理副總裁Kathy Koontz 女士指出:"重要的不是數據,而是如何使用數據。企業必須改變它們的經營方式,學會從數據中洞察事實並做出反應,否則數據整理得再有條理,也沒什麼價值。"
通用電氣公司首席執行官Jeff Immelt曾說,「今天,數據分析時代已經來臨,數據分析不再是未來願景。每家實業公司都將圍繞數據與分析技術以某種方式進行變革。」所以,我們可以看出,數據和分析正在徹底改變各個行業,徹底改變消費者,並帶來新的競爭對手,但更重要的是,數據和數據分析使得我們的社會開始了前所未有的轉型。

E. oracle和teradata對比

待遇的話要看你做什麼領域,做到什麼位置。。。Oracle公司可不止資料庫,BI,DW也都有。Teradata是一家硬體和數據咨詢服務公司,有一套完善的數據倉庫方法論,很多國內外大型的商業銀行都在用它的DW模型。請找准自己的方向,單純比較哪個公司更強沒意義。

F. teradata與華為Gauss的差異

同屬華為高斯資料庫。
Teradata可連接到通道連接的系統,如主機或網路連接的系統。AI原生資料庫是Gauss的主要特點之一。華為將AI引擎內置到GaussDB全系產品中,使其具備一定的自運維、自管理、自調優、故障自診斷和自愈的能力。
Teradata是比較比較受歡迎的資料庫管理系統,定位就是大數據倉庫系統,定位比較高,主要應用於數據存儲和數據處理,處理速度比Hive要高10倍左右。華為的Gauss資料庫是一個開源資料庫,基於PostgreSQL9.2開發。我們知道PostgreSQL本身就是一個開源資料庫品牌。現在除了OracleDB、微軟的SQLServer等傳統老牌數據產品之外,目前新開發的資料庫產品,開源資料庫佔比較大的部分。

G. 大數據分析的未來圖景 萬物皆可分析

大數據分析的未來圖景:萬物皆可分析

在雲計算、大數據之後物聯網成為新晉熱點話題,物聯網改變了我們看待世界的方法,改變了我們做業務的方法,甚至改變我們的生活方式。但是即使是最精通技術的企業也承認,從物聯網生成的數據中獲取價值非常困難,需要大量技巧。

Teradata認為的數據分析未來圖景是「萬物皆可分析」,所以在本次大會上也發布了Teradata Listener,其是一款具有實時「聽取」功能的自助式智能軟體,對客戶而言可跟蹤他們世界各地存放的多條感測器和物聯網數據流,並將該數據傳送到分析生態系統中的多個平台,使得我們能夠在數據源的發生地就可以進行分析。

Teradata天睿公司大中華區首席執行官辛兒倫

同時Teradata也強調,在建設數據分析系統中,要避免數據孤島。由於單一技術無法解決全面數據分析的需求,必須簡化各種技術難度,創建統一生態數據管理系統。簡化是非常重要的需求,任何數據分析系統都要使得架構簡化。所以,在本次大會上,Teradata還更新了其統一數據架構(UDA),推出了在單一機箱內整合Teradata數據倉庫、Teradata Aster Analytics和Hadoop系統,使用戶能夠在更小的數據中心空間內發揮整個分析生態系統管理的優勢。

在本次大會上,ZDNet采訪了Teradata天睿公司大中華區首席執行官辛兒倫,以下為訪談實錄:

ZDNet:2015年的大會以Breaking Big為主題,請問其寓意是什麼?這是否代表Teradata對於大數據認知在概念上的顛覆?

辛兒倫:Breaking Big這個主題,我理解最核心的應該是「打破束縛和限制」,不管是企業還是個人應該探索和追求「創新、差異化、勇氣、重大進展和卓越表現。」

第一,在大數據時代,企業必須堅持創新和追求創新,不管技術上尋找突破,還是從業務流程、商業模式、組織架構、企業的分析文化上,都可進行積極的創新。例如,去年我們剛剛收購的Think Big公司,幫助我們增強對Hadoop的咨詢、顧問和實施能力, 以及與其它分析平台的交互能力。在本次大會上,我們剛宣布Think Big成為業內首個能夠為Hadoop數據湖(數據資源池)提供全面的管理服務,這將幫助企業非常便利地創建數據分析的生態系統,確保數據質量、可靠性、實時性以及日常的運營任務。

我強調一下,我們的Think Big公司支持主要的Apache? Hadoop?,包括Cloudera、Hortonworks、MapR、Spark、Kafka、NoSQL以及其他開源技術,非常全面。而且更重要的是,我這里也是首次宣布,我們的Think Big業務已經確定引入到大中華區,目前已經在完成人員的配備。

第二,我覺得企業中在數據分析上的務實和積極進取的文化非常重要。其中,這個主題中提到「勇氣」是企業實現大數據項目成功的重要保證。很多的企業,曾經面對大數據項目的投資猶豫、徘徊,其實這就需要更大的勇氣支持。Teradata以及廣大客戶的反饋已經看到,我們是時候積極行動了。我們也理解,文化上的轉變可能比技術和分析流程上的轉變歷時更久,但是我們一直強調,大數據從小做起,相信你也能很快看到大數據的價值,看到大數據分析在商業變革中帶來的不可替代的驅動力。

ZDNet:每年的全球用戶大會,Teradata都會發布業界注目的新產品。今年發布的產品中,您認為哪些是最具亮點的?

辛兒倫:今年,我們在大數據技術、開源技術的支持以及咨詢服務上都有重要的更新和發布。這里,我特別強調一下,本次大會上最亮點的應該是針對物聯網的感測器數據的分析能力,甚至實現了萬物皆可分析(Analytics of Everything)。Teradata Listener技術能夠通過整合開源技術,幫助客戶分析物聯網中不計其數的數據源,簡化數據分析的難度。Teradata QueryGrid技術能在統一數據架構上快速有效地進行主題分析或查詢多元化的大數據,以取得業務需要的信息。

同時,Teradata Aster新的版本能直接交互Hadoop數據資源池或數據倉庫平台,幫助客戶進行實時的數據探索,例如高效營銷中進行客戶路徑和消費模式分析,等等.

ZDNet:最近,Gartner發布了2016年可能影響企業的十大技術趨勢,其中萬物信息化以及物聯網等技術入選。在目前發展出現這些趨勢之時,您怎們看技術的發展趨勢?如果時間放長遠一點,據您觀察未來5年甚至10年,那些技術可能會成為影響企業比較顯著的技術趨勢?

辛兒倫:我們看到這些十大技術趨勢,這些都是戰略性大趨勢,其中包括Information of Everything(萬物信息化)以及物聯網架構和平台。其實,我認為這不僅是趨勢,而是新的IT現實。

關於萬物信息化,可以理解為我們身處在一個數字網格之中,這個環境會產生、使用其產生的無計其數的信息。在這些數據和信息的海洋中,不管是企業還是個人,必須學會判斷和識別哪些信息能夠帶來戰略性的價值,掌握如何訪問這些不同的數據源,並通過各種分析方法和演算法找出其中的業務價值。

其實,這些預測也是真實IT現實的寫照。實現萬物皆聯網或者信息化,最主要之一靠感測器技術。在我們目前生活的時代,感測器技術結合大規模並行處理能力,使我們能夠測量並整體分析幾乎所有現象。先進的儀器使我們能夠跟蹤萬物的變化,例如天氣變化模式、汽車駕駛習慣、乃至快餐店冰箱的溫度、醫院里(或家裡)病人的生命體征。將這些數據採集至資料庫,並運用廣泛的統計、分析及可視化工具對這些數據進行細致的分析。

正是由於這些感測器,我們的生活、工作中產生了新的數據源。例如,通過射頻識別讀取器,我們能夠進行零售庫存跟蹤與控制、醫療測試采樣跟蹤、預防欺詐行為等;通過GPS定位跟蹤器,能夠進行車隊管理和交通運輸和貨運管理;通過數據採集感測器,我們就能在製造業、環境保護、交通運輸系統中採集到實時的數據用於分析。

例如,西門子公司就通過部署Teradata技術提升其製造流程及產品質量。西門子首次實現了整合來自感測器、製造流程、機器生成數據,以及各種源系統的數據。西門子技術領域商業分析及監測總監Michael May博士對此說:「現在,我們可以更快、更有效地獲得數據中的價值。把大數據轉換為智能數據,我們將能夠優化產品質量,為客戶提供更加優質的服務。」

關於物聯網我提兩點:《2014-2015年中國物聯網發展年度報告》中指出,物聯網技術與雲計算、大數據、移動互聯網等新興一代信息技術的協同創新進一步深化,與農業、製造業、服務業等傳統產業,與新能源、新材料、先進製造業等新興產業的「雙向融合」不斷加強。物聯網加快向經濟、社會、生活眾多領域滲透,不斷催生新變革、新應用和新業態。這些都是非常可喜的發展成績。現在快速發展的物聯網,以及未來的「萬物皆聯網」,任何人、事、物之間將能實現連接,這將帶來溝通模式的變化、業務模式的變化,甚至發展模式的變化。

但是,我們更要強調,要想讓物聯網發揮出價值,企業必須對感測器數據進行整合和分析,並把分析結果利用到生產流程中來,而由大數據驅動的物聯網才是有價值的物聯。

由於物聯網數據都是非結構化數據,這種JSON數據的分析都非常復雜。在今年5月,我們就宣布首次在同一資料庫實現三大JSON數據格式的原生存儲,這將為客戶提供更強的查詢性能。通過對Teradata資料庫升級,能夠幫助業務用戶充分利用網頁應用、感測器和物聯網機器生成JSON數據的商業價值。而Teradata資料庫具備分析JSON數據、操作數據和歷史業務數據的強大功能,而這一頂級查詢性能使其成為物聯網分析樞紐。此外,本次大會上發布的Teradata Listener是一款自助式智能軟體,具有實時「聽取」功能,可協助客戶跟蹤他們世界各地存放的多條感測器和物聯網數據流,並將該數據傳送到分析生態系統中的多個平台,這些都是巨大的技術突破。

針對未來更長時間的趨勢預測,如果從更加宏觀的角度看,我們先梳理一下整個IT 行業的發展,然後就能看到未來的發展趨勢。過去從70或者80年代開始,對整個IT產業的關注,不管是產業給予的專注,還是IT供應商的專注,或是企業對於成立自己的IT部門的專注,更多的是一種小I大T的專注,什麼叫小I大T?小的專注於Information能夠體現的價值,而大量專注於運用用和研發Technology方面的議題。這就是小I大T,更多地認為IT就只是Technology這個課題,但是我們要注意IT不僅僅是Technology,IT是兩個課題,是Information和Technology。

隨著技術的發展,現在的技術能夠承載的Information的價值度是迅速提升的,,未來更多的機會會更多在Information這個主題,延伸出來未來10年、20年、30年的前景。特別是未來這30年,這個時代將會是大I小T的時代,更多的主軸是在Information主題。,

ZDNet:從Teradata以及服務客戶的經驗看,如果讓您建議一個企業要建立起自己的大數據戰略,應該要去准備什麼戰略?

辛兒倫:首先建議客戶要先問自身幾個問題,那就是為什麼要建立自己的大數據戰略?是什麼業務發展方向需要數據驅動型戰略?。大數據戰略要針對具體的業務場景,有了明確的業務場景目標,建設駕馭大數據的能力才有針對性性和使命感。

例如某企業要提升他的客戶價值貢獻度,希望建立起大數據戰略,能夠通過與客戶的多種互動渠道的信息中獲得洞察例如通過360度的統一客戶視圖等,在正確的時間、正確的地點、適當的方式,提供這位客戶需要的服務或產品。又如金融機構通過建立起針對風險控制的大數據戰略,能夠發現和判斷自己企業面對的風險以及危害程度,如擔保圈分析等。如電信運營商可以通過建立針對客戶服務品質優化的大數據戰略,發現即將離網的用戶等,提高自己的業務支持並挽留用戶。

但是,在這里我要強調一點,數據驅動型戰略不等同於數據收集戰略,目前企業應盡量避免「存而不用」,建立大數據能力絕不是收集數據、存數據。

根據我們協助全球許多客戶建設高效的大數據戰略呢?,我想分享幾個成功的關鍵:

第一,全面。企業需要採取宏觀視角來識別構成高效體系的諸多不同要素,將不同的數據集(比如內部和外部數據流,或來自企業不同職能部門的信息)鏈接起來,通過關聯分析,找出富有意義的信息。

第二,以業務為核心。針對大數據的戰略規劃應當以業務為導向,大數據戰略並非科學項目,而是必須以滿足實際的業務需求為核心。

第三,靈活。必須考慮到未來的使用情形,大數據戰略和大數據分析方法論應避免常見的限制,比如過多地依賴於單一技術或單一平台模式或過於制式的流程等;由於數據驅動的轉型不會一步到位或立刻傳遍整個企業,因此在制定戰略時,必須認識到價值是逐步創造出來的,並將整個演變過程考慮在內。

第四,有條理且可擴展。要確保大數據戰略能夠得到全面貫徹,而不是導致另一大群數據孤島的產生。

第五,數據分析、科學決策。形成以分析為導向的思維方式,並培養真正的數據驅動文化。

以上是小編為大家分享的關於大數據分析的未來圖景 萬物皆可分析的相關內容,更多信息可以關注環球青藤分享更多干貨

H. 什麼是大數據時代

大數據時代

(巨量資料(IT行業術語))
編輯
最早提出「大數據」時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:「數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。」 「大數據」在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。
中文名
大數據時代
外文名
Big data
提出者
麥肯錫
類 屬
科技名詞
目錄
1 產生背景
2 影響
▪ 大數據
▪ 大數據的精髓
▪ 數據價值
▪ 可視化
3 特徵
4 案例分析
5 產業崛起
6 提供依據
7 應對措施

產生背景
編輯

進入2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數
大數據時代來臨
據,並命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。[1]
數據正在迅速膨脹並變大,它決定著企業的未來發展,雖然很多企業可能並沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。
正如《紐約時報》2012年2月的一篇專欄中所稱,「大數據」時代已經降臨,在商業、經濟及其他領域中,決策將日益基於數據和分析而作出,而並非基於經驗和直覺。
哈佛大學社會學教授加里·金說:「這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。」[2]

影響
編輯

大數據
現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。[3]
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapRece一樣的框架來向數十、數百或甚至數千的電腦分配工作。[2]
在現今的社會,大數據的應用越來越彰顯他的優勢,它佔領的領域也越來越大,電子商務、O2O、物流配送等,各種利用大數據進行發展的領域正在協助企業不斷地發展新業務,創新運營模式。有了大數據這個概念,對於消費者行為的判斷,產品銷售量的預測,精確的營銷范圍以及存貨的補給已經得到全面的改善與優化。[4]
「大數據」在互聯網行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的用戶網路行為數據。這些數據的規模是如此龐大,以至於不能用G或T來衡量。
大數據到底有多大?一組名為「互聯網上一天」的數據告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當於美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當於《時代》雜志770年的文字量);賣出的手機為37.8萬台,高於全球每天出生的嬰兒數量37.1萬……[1]
截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當於全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。[5] 每一天,全世界會上傳超過5億張圖片,每分鍾就有20小時時長的視頻被分享。然而,即使是人們每天創造的全部信息——包括語音通話、電子郵件和信息在內的各種通信,以及上傳的全部圖片、視頻與音樂,其信息量也無法匹及每一天所創造出的關於人們自身的數字信息量。
這樣的趨勢會持續下去。我們現在還處於所謂「物聯網」的最初級階段,而隨著技術成熟,我們的設備、交通工具和迅速發展的「可穿戴」科技將能互相連接與溝通。科技的進步已經使創造、捕捉和管理信息的成本降至2005年的六分之一,而從2005年起,用在硬體、軟體、人才及服務之上的商業投資也增長了整整50%,達到了4000億美元。[5]

大數據的精髓
大數據帶給我們的三個顛覆性觀念轉變:是全部數據,而不是隨機采樣;是大體方向,而不是精確制導;是相關關系,而不是因果關系。[6]
A.不是隨機樣本,而是全體數據:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(隨機采樣,以前我們通常把這看成是理所應當的限制,但高性能的數字技術讓我們意識到,這其實是一種人為限制);
B.不是精確性,而是混雜性:研究數據如此之多,以至於我們不再熱衷於追求精確度;之前需要分析的數據很少,所以我們必須盡可能精確地量化我們的記錄,隨著規模的擴大,對精確度的痴迷將減弱;擁有了大數據,我們不再需要對一個現象刨根問底,只要掌握了大體的發展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力;
C.不是因果關系,而是相關關系:我們不再熱衷於找因果關系,尋找因果關系是人類長久以來的習慣,在大數據時代,我們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系;相關關系也許不能准確地告訴我們某件事情為何會發生,但是它會提醒我們這件事情正在發生。

數據價值
大數據時代,什麼最貴?
十年前,葛大爺曾說過,「21世紀什麼最貴?」——「人才」,深以為然。只是,十年後的今天,大數據時代也帶來了身價不斷翻番的各種數據。由於急速拓展的網路帶寬以及各種穿戴設備所帶來的大量數據,數據的增長從未停歇,甚至呈井噴式增長。[7]
一分鍾內,微博推特上新發的數據量超過10萬;社交網路「臉譜」的瀏覽量超過600萬……
這些龐大數字,意味著什麼?
它意味著,一種全新的致富手段也許就擺在面前,它的價值堪比石油和黃金。
事實上,當你仍然在把微博等社交平台當作抒情或者發議論的工具時,華爾街的斂財高手們卻正在挖掘這些互聯網的「數據財富」,先人一步用其預判市場走勢,而且取得了不俗的收益。
讓我們一起來看看——他們是怎麼做的。
這些數據都能幹啥。具體有六大價值:
●1、華爾街根據民眾情緒拋售股票;
●2、對沖基金依據購物網站的顧客評論,分析企業產品銷售狀況;
●3、銀行根據求職網站的崗位數量,推斷就業率;
●4、投資機構搜集並分析上市企業聲明,從中尋找破產的蛛絲馬跡;
●5、美國疾病控制和預防中心依據網民搜索,分析全球范圍內流感等病疫的傳播狀況;
●6、美國總統奧巴馬的競選團隊依據選民的微博,實時分析選民對總統競選人的喜好。[1]

可視化
「數據是新的石油。」亞馬遜前任首席科學家Andreas Weigend說。Instagram以10億美元出售之時,成立於1881年的世界最大影像產品及服務商柯達正申請破產。
大數據是如此重要,以至於其獲取、儲存、搜索、共享、分析,乃至可視化地呈現,都成為了當前重要的研究課題[1] 。
「當時時變幻的、海量的數據出現在眼前,是怎樣一幅壯觀的景象?在後台注視著這一切,會不會有接近上帝俯視人間星火的感覺?」
這個問題我曾請教過劉建國,中國著名的搜索引擎專家。劉曾主持開發過國內第一個大規模中英文搜索引擎系統「天網」。
要知道,劉建國曾任至網路的首席技術官,在這樣一家每天需應對網民各種搜索請求1.7億次(2013年約為8.77億次)的網站中,如果只是在後台靜靜端坐,可能片刻都不能安心吧。網路果然在提供搜索服務之外,逐漸增添了網路指數,後又建立了基於網民搜索數據的重要產品「貼吧」及網路統計產品等。
劉建國沒有直接回答這個問題,他想了很久,似乎陷入了回憶,嘴角的笑容含著詭秘。
倒是有公司已經在大數據中有接近上帝俯視的感覺,美國洛杉磯就有企業宣稱,他們將全球夜景的歷史數據建立模型,在過濾掉波動之後,做出了投資房地產和消費的研究報告。
在數據可視化呈現方面,我最新接收到的故事是,一位在美國思科物流部門工作的朋友,很聰明的印度裔小夥子,被Facebook高價挖角,進入其數據研究小組。他後來驚訝地發現,裡面全是來自物流企業、供應鏈方面的技術人員和專家,「Facebook想知道,能不能用物流的角度和流程的方式,分析用戶的路徑和行為。」

特徵
編輯
數據量大(Volume)
第一個特徵是數據量大。大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
類型繁多(Variety)
第二個特徵是數據類型繁多。包括網路日誌、音頻、視頻、圖片、地理位置信息等等,多類型的數據對數據的處理能力提出了更高的要求。
價值密度低(Value)
第三個特徵是數據價值密度相對較低。如隨著物聯網的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器演算法更迅速地完成數據的價值「提純」,是大數據時代亟待解決的難題。
速度快、時效高(Velocity)
第四個特徵是處理速度快,時效性要求高。這是大數據區分於傳統數據挖掘最顯著的特徵。
既有的技術架構和路線,已經無法高效處理如此海量的數據,而對於相關組織來說,如果投入巨大採集的信息無法通過及時處理反饋有效信息,那將是得不償失的。可以說,大數據時代對人類的數據駕馭能力提出了新的挑戰,也為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。[2]

案例分析
編輯
個案一
你開心他就買你焦慮他就拋[2]
華爾街「德溫特資本市場」公司首席執行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以「1」到「50」進行打分。根據打分結果,霍廷再決定如何處理手中數以百萬美元計的股票。
霍廷的判斷原則很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。
這一招收效顯著——當年第一季度,霍廷的公司獲得了7%的收益率。
個案二
國際商用機器公司(IBM)估測,這些「數據」值錢的地方主要在於時效。對於片刻便能定輸贏的華爾街,這一時效至關重要。曾經,華爾街2%的企業搜集微博等平台的「非正式」數據;如今,接近半數企業採用了這種手段。
●「社會流動」創業公司在「大數據」行業生機勃勃,和微博推特是合作夥伴。它分析數據,告訴廣告商什麼是正確的時間,誰是正確的用戶,什麼是應該發表的正確內容,備受廣告商熱愛。
●通過喬希·詹姆斯的Omniture(著名的網頁流量分析工具)公司,你可以知道有多少人訪問你的網站,以及他們呆了多長時間——這些數據對於任何企業來說都至關重要。詹姆斯把公司賣掉,進賬18億美元。
●微軟專家吉拉德喜歡把這些「大數據」結果可視化:他把客戶請到辦公室,將包含這些公司的數據圖譜展現出來——有些是普通的時間軸,有些像蒲公英,有些則是鋪滿整個畫面的泡泡,泡泡中顯示這些客戶的粉絲正在談論什麼話題。
●「臉譜」數據分析師傑弗遜的工作就是搭建數據分析模型,弄清楚用戶點擊廣告的動機和方式。
處理和分析工具
用於分析大數據的工具主要有開源與商用兩個生態圈。
開源大數據生態圈:
1、Hadoop HDFS、HadoopMapRece, HBase、Hive 漸次誕生,早期Hadoop生態圈逐步形成。
2、. Hypertable是另類。它存在於Hadoop生態圈之外,但也曾經有一些用戶。
3、NoSQL,membase、MongoDb
商用大數據生態圈:
1、一體機資料庫/數據倉庫:IBM PureData(Netezza), OracleExadata, SAP Hana等等。
2、數據倉庫:TeradataAsterData, EMC GreenPlum, HPVertica 等等。
3、數據集市:QlikView、 Tableau 、 以及國內的Yonghong Data Mart 。

產業崛起
編輯
越來越多的政府、企業等機構開始意識到數據正在成為組織最重要的資產,數據分析能力正在成為組織的核心競爭力。具體有以下三大案例:
1、2012年3月22日,奧巴馬政府宣布投資2億美元拉動大數據相關產業發展,將「大數據戰略」上升為國家意志。奧巴馬政府將數據定義為「未來的新石油」,並表示一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,未來,對數據的佔有和控制甚至將成為陸權、海權、空權之外的另一種國家核心資產。
2、聯合國也在2012年發布了大數據政務白皮書,指出大數據對於聯合國和各國政府來說是一個歷史性的機遇,人們如今可以使用極為豐富的數據資源,來對社會經濟進行前所未有的實時分析,幫助政府更好地響應社會和經濟運行。
3、而最為積極的還是眾多的IT企業。麥肯錫在一份名為《大數據,是下一輪創新、競爭和生產力的前沿》的專題研究報告中提出,「對於企業來說,海量數據的運用將成為未來競爭和增長的基礎」,該報告在業界引起廣泛反響。
IBM則提出,上一個十年,他們拋棄了PC,成功轉向了軟體和服務,而這次將遠離服務與咨詢,更多地專注於因大數據分析軟體而帶來的全新業務增長點。IBM執行總裁羅睿蘭認為,「數據將成為一切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。」
在國內,網路已經致力於開發自己的大數據處理和存儲系統;騰訊也提出2013年已經到了數據化運營的黃金時期,如何整合這些數據成為未來的關鍵任務。
事實上,自2009年以來,有關「大數據」 主題的並購案層出不窮,且並購數量和規模呈逐步上升的態勢。其中,Oracle對Sun、惠普對Autonomy兩大並購案總金額高達176億美元,大數據的產業價值由此可見一斑。[1-2]

提供依據
編輯
大數據是信息通信技術發展積累至今,按照自身技術發展邏輯,從提高生產效率向更高級智能階段的自然生長。無處不在的信息感知和採集終端為我們採集了海量的數據,而以雲計算為代表的計算技術的不斷進步,為我們提供了強大的計算能力,這就圍繞個人以及組織的行為構建起了一個與物質世界相平行的數字世界[1-2] 。
大數據雖然孕育於信息通信技術的日漸普遍和成熟,但它對社會經濟生活產生的影響絕不限於技術層面,更本質上,它是為我們看待世界提供了一種全新的方法,即決策行為將日益基於數據分析做出,而不是像過去更多憑借經驗和直覺做出。
事實上,大數據的影響並不僅僅限於信息通信產業,而是正在「吞噬」和重構很多傳統行業,廣泛運用數據分析手段管理和優化運營的公司其實質都是一個數據公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。而在零售業中,數據分析的技術與手段更是得到廣泛的應用,傳統企業如沃爾瑪通過數據挖掘重塑並優化供應鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。
最讓人吃驚的例子是,社交媒體監測平台DataSift監測了Facebook(臉譜) IPO當天Twitter上的情感傾向與Facebook股價波動的關聯。在Facebook開盤前Twitter上的情感逐漸轉向負面,25分鍾之後Facebook的股價便開始下跌。而當Twitter上的情感轉向正面時,Facebook股價在8分鍾之後也開始了回彈。最終當股市接近收盤、Twitter上的情感轉向負面時,10分鍾後Facebook的股價又開始下跌。最終的結論是:Twitter上每一次情感傾向的轉向都會影響Facebook股價的波動。
這僅僅只是基於社交網路產生的大數據「預見未來」的眾多案例之一,此外還有谷歌通過網民搜索行為預測流感爆發等例子。不僅在商業方面,大數據在社會建設方面的作為同樣令人驚嘆,智能電網、智慧交通、智慧醫療、智慧環保、智慧城市等的蓬勃興起,都與大數據技術與應用的發展息息相關。
「大數據」可能帶來的巨大價值正漸漸被人們認可,它通過技術的創新與發展,以及數據的全面感知、收集、分析、共享,為人們提供了一種全新的看待世界的方法。更多地基於事實與數據做出決策,這樣的思維方式,可以預見,將推動一些習慣於靠「差不多」運行的社會發生巨大變革。

應對措施
編輯
一個好的企業應該未雨綢繆,從現在開始就應該著手准備,為企業的後期的數據收集和分析做好准備,企業可以從下面六個方面著手,這樣當面臨鋪天蓋地的大數據的時候,以確保企業能夠快速發展,具體為下面六點。
目標
幾乎每個組織都可能有源源不斷的數據需要收集,無論是社交網路還是車間感測器設備,而且每個組織都有大量的數據需要處理,IT人員需要了解自己企業運營過程中都產生了什麼數據,以自己的數據為基準,確定數據的范圍。
准則
雖然每個企業都會產生大量數據,而且互不相同、多種多樣的,這就需要企業IT人員在現在開始收集確認什麼數據是企業業務需要的,找到最能反映企業業務情況的數據。
重新評估
大數據需要在伺服器和存儲設施中進行收集,並且大多數的企業信息管理體系結構將會發生重要大變化,IT經理則需要准備擴大他們的系統,以解決數據的不斷擴大,IT經理要了解公司現有IT設施的情況,以組建處理大數據的設施為導向,避免一些不必要的設備的購買。
重視大數據技術
大數據是最近幾年才興起的詞語,而並不是所有的IT人員對大數據都非常了解,例如如今的Hadoop,MapRece,NoSQL等技術都是2013年剛興起的技術,企業IT人員要多關注這方面的技術和工具,以確保將來能夠面對大數據的時候做出正確的決定。
培訓企業的員工
大多數企業最缺乏的是人才,而當大數據到臨的時候,企業將會缺少這方面的採集收集分析方面的人才,對於一些公司,特別是那種人比較少的公司,工作人員面臨大數據將是一種挑戰,企業要在平時的時候多對員工進行這方面的培訓,以確保在大數據到來時,員工也能適應相關的工作。
培養三種能力
Teradata大中華區首席執行官辛兒倫對新浪科技表示,隨著大數據時代的到來,企業應該在內部培養三種能力。第一,整合企業數據的能力;第二,探索數據背後價值和制定精確行動綱領的能力;第三,進行精確快速實時行動的能力。
做到上面的幾點,當大數據時代來臨的時候,面臨大量數據將不是束手無策,而是成竹在胸,而從數據中得到的好處也將促進企業快速發展。
望採納,謝謝

閱讀全文

與2012teradata大數據峰會相關的資料

熱點內容
iphone6sp發貨問題 瀏覽:197
手機迅雷BT文件已移除 瀏覽:766
文泰保存文件怎麼找不到 瀏覽:608
蘋果賬號沒有充值買了東西嗎 瀏覽:358
匯編中數據在內存中如何分布 瀏覽:308
資料庫單用戶模式 瀏覽:681
c生成utf8格式文件 瀏覽:40
電腦什麼app可以免費看電視 瀏覽:573
手機文件的後綴名 瀏覽:81
excel如何找到獲取數據按鈕 瀏覽:688
本電腦的所有共享文件夾在哪裡 瀏覽:444
網路營銷投資管理有哪些 瀏覽:665
手機java插件 瀏覽:598
mac編程文件為什麼文件位置找不到 瀏覽:273
手術教程APP有哪些 瀏覽:488
10歲女孩qq名字可愛 瀏覽:496
微信轉賬中轉專用帳戶5 瀏覽:355
vb獲取系統文件夾 瀏覽:345
iphone5越獄後開機花屏 瀏覽:875
linux虛擬機如何增加硬碟 瀏覽:936

友情鏈接