導航:首頁 > 網路數據 > 高德納大數據概念

高德納大數據概念

發布時間:2023-01-28 14:10:36

❶ 站在「大數據」的台風口,石油行業能起飛嗎三分鍾帶你全面了解

加大油氣勘探開發力度、保障國家能源安全是當前面臨的迫切任務。但隨著優質資源的不斷開發,剩餘資源開采難度越來越大,成本越來越高,迫切需要創新技術提升油氣勘探開發效率和效益。在大數據、人工智慧( artificial intelligence,AI)、5G、雲計算、物聯網等技術推動下,油氣田的智能化水平將會越來越高,這既是油田降本提質增效的有效途徑,也是油氣技術發展規律的必然趨勢。

1、大數據技術定義

2012年興起的「大數據」潮流,讓「Big Data」這個IT圈子裡的名詞一下風靡了各個行業。雖然大數據的重要性得到了大家的一致認同,但是對大數據的理解卻眾說紛紜。大數據是一個抽象的概念,除去數據量龐大這一特徵,大數據還有一些其他的特徵,這些特徵決定了大數據與「海量數據」和「非常大的數據」這些概念之間的不同。

高德納分析員Doug Laney曾於2001年在一次演講中指出,數據增長有3個方向的挑戰:數量(volume),即數據多少;速度(velocity),即資料輸入、輸出的速度;種類(variety),即多樣性,這3方面的特徵即大數據最先提出的3V模型。2011年,在國際數據公司(IDC)發布的報告中,大數據被定義為:「大數據技術描述了新一代的技術和架構體系,通過高速採集、發現或分析,提取各種各樣的大量數據的經濟價值。」大數據的特點可以總結為4個V,即volume(體量浩大)、variety(模態繁多)、velocity(生成快速)和value(價值巨大但密度很低)。這種4V定義得到了更廣泛的認同,指出了大數據最為核心的問題,就是如何從規模巨大、種類繁多、生成快速的數據集中挖掘價值。

2、大數據技術的發展

大數據是人工智慧的血液,當前大數據、雲計算、人工智慧以及區塊鏈技術之間的關系密不可分,也被稱作數據智能。比如,先進的工業互聯網,其中既有區塊鏈技術也有大數據技術,還有雲計算技術,三者合成一體,又衍生出了人工智慧和物聯網的概念。

在大數據基礎上的人工智慧,目前已進入數據智能的深度學習時代,其快速發展引起了 社會 和產業的顛覆性變化。從大數據和人工智慧技術全行業的發展來看,目前美國仍處於領先地位,中國緊隨其後,且具有趕超趨勢。中國在人工智慧相關的論文發表總數和高引論文數量實現對美國的超越,但在人工智慧理論發展和技術方向的引領方面美國還占據支配地位。

3、大數據技術流程

大數據處理的關鍵技術流程主要包括:數據採集、數據預處理(數據清理、數據集成、數據變換等)、海量數據存儲、數據分析及挖掘、數據的呈現與應用(數據可視化、數據安全與隱私等)。

4、大數據的核心演算法

大數據的核心演算法可以分為監督學習(有標簽)和無監督學習(無標簽)兩大類,其中:

監督學習分為回歸和分類:即給定一個樣本特徵,希望預測其對應的屬性值,如果是離散的,那麼這就是一個分類問題,反之,如果是連續的實數,這就是一個回歸問題。無論是分類還是回歸,都是想建立一個預測模型,給定一個輸入,可以得到一個輸出。不同的只是在分類問題中,是離散的;而在回歸問題中是連續的。

無監督學習分為聚類和降維:即如果給定一組樣本特徵,我們沒有對應的屬性值,而是想發掘這組樣本在維空間的分布,比如分析哪些樣本靠的更近,哪些樣本之間離得很遠,這就是屬於聚類問題。如果我們想用維數更低的子空間來表示原來高維的特徵空間,那麼這就是降維問題。聚類也是分析樣本的屬性,事先不知道樣本的屬性范圍,只能憑借樣本在特徵空間的分布來分析樣本的屬性。這種問題一般更復雜。而常用的演算法包括 k-means (K-均值),GMM(高斯混合模型)等。

5、大數據在油氣勘探開發領域的應用

目前大數據技術在地質分析、測井解釋、地震解釋、甜點預測、地質建模、油藏模擬、鑽井、壓裂、採油、產能預測等方面均開展了大量 探索 性研究,收到了良好的效果。但是目前,大數據與油氣行業相關領域的融合還處於起步階段,面臨來自數據、演算法和地下未知因素的諸多挑戰。未來在大數據、人工智慧、5G、雲計算、物聯網等技術推動下,油氣田的智能化水平將會快速發展,這既是油氣技術發展規律的必然趨勢,也是油田降本提質增效的有效途徑。在發展的過程中,智能油氣田建設需要油氣勘探開發與大數據、人工智慧、雲計算以及區塊鏈等技術的深度融合,進而催生一批油氣田領域的顛覆性技術,解決油氣勘探開發的技術需求,提升油氣田勘探開發的經濟和 社會 效益。

下期將向您詳細解讀大數據在油氣行業的具體應用 )。

註:本文部分參考資料來源如下:

李陽,廉培慶,薛兆傑,等.大數據及人工智慧在油氣田開發中的應用現狀及展望[J].中國石油大學學報(自然科學版),2020,44(4):1-11

Gantz J,Reinsel D.Extracting Value from Chaos. IDC iView Report,2011

Team O R. Big Data Now:Current Perspectives from O』Reilly Radar.Sebastopol:O』Reilly Media,2014

Grobelnik M. Big data tutorial. http://videolectures.net/eswc2015grobelnik big data/,2012

Walters, R. J., Zoback, M. D., Baker, J. W. 2015. Characterizing and Responding to Seismic Risk Associated With Earthquakes Potentially Triggered by Fluid Disposal and Hydraulic Fracturing. Seismol. Res. Lett. 86 (4): 1–9. https:// doi.org/10.1785/0220150048.

周松蘭.中美歐日韓人工智慧技術差距測度與比較研究[J].華南理工大學學報 ( 社會 科學版),2020,22(2):10-22.

HINTON G E,OSINDERO S,TEH Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2016,18: 1527-1554.

LECUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of IEEE,1988,86( 11) : 2278-2324.

BENGIO Y, SIMARD P,FRASCONI P.Learning longterm dependencies with gradient descent is difficult[J].IEEE Transactions on Neural Networks,1994,5(2) :157-166

❷ 工業製造大數據分析

工業製造大數據分析
大數據不僅僅是大量的數據的堆積。大數據的重要屬性之一,是人們設法收集並弄清楚不斷變化的數據類型。如果只是大量採集同一類型的數據,再大的數據量都不能稱之為大數據。
如何實現智能製造是大家都關心的問題。從哈佛商學院的邁克爾·波特到賓夕法尼亞大學沃頓商學院,有一個普遍的共識,即數字化轉型是智能製造實現的途徑。重要的是,這個共識也來自於眾多的世界級製造業企業與企業家們。
這一共識是基於無數技術趨勢的融合,例如,物聯網、賽博系統(CPS)、工業物聯網、移動技術、人工智慧、雲計算、虛擬/虛擬增強現實(VR/AR),以及大數據分析等。我們一定要保持清醒,不要簡單地認為有了這些技術,未來五年就是製造業的黃金時期。道理很簡單,這個新製造業文化的變革進程是相當復雜和艱難的,沒有行業、企業與用戶的融合推進,無法實現這次變革。數字化轉型不僅僅意味著企業簡單的數字化,而是把數字作為智能製造的核心驅動力,利用數據去整合產業鏈和價值鏈。
自工業革命以來,為了改進運營,製造商一直以來都在有意地採集並存儲數據。隨著時間的推移,數據在製造業分析的需求將越來越大。然而在過去的許多年間,利用數據的根本動因並沒有改變,數據的復雜性增強,數據轉化為情報的能力越來越大。
2012年高德納給出大數據定義,其中特別強調大數據是多樣化信息資產,不僅關注實際數據,更關注大數據處理方法。數據量大小本身並不是判斷大數據價值的核心指標,而數據的實時性和多元性對大數據的定義和價值更具直接的影響。
在討論工業大數據分析的時候,我注意到兩種不同的觀點:
第一種觀點認為,製造業向來都有大數據。幾十年來我們的企業一直在通過歷史記錄、MES、ERP、EAM等各種應用系統採集數據。在部分產業鏈環節,特別在市場營銷方面,大數據算是一個新的熱詞。
第二種觀點認為,從工業大數據角度看,製造業是一個尚未打開的市場或剛剛開啟的市場。存在大量不同類型的數據,但如今它們還未被應用到分析之中。
考慮到這些觀點,面對任何新的市場提法,包括名詞解釋、定義或分析框架,我們始終都應該保持適當的懷疑精神。這里我更多傾向於第二個觀點。我們的製造業的確有「大量數據」,但這並不是我們大多數人從市場上所理解的「大數據」涵義。在搞清楚工業大數據分析之前,我們應該如何定義製造業的大數據?這里可以通過大數據的三個特性,進一步了解大數據的特性。
數據來源
工業大數據的主要來源有兩個,第一是智能設備。普適計算有很大的空間,現代工人可以帶一個普適感應器等設備來參加生產和管理。所以工業數據源是280億左右大量設備之間的關聯,這個是我們未來需要去採集的數據源之一。
第二個數據來源於人類軌跡產生的數據,包括在現代工業製造鏈中,從采購、生產、物流與銷售內部流程以及外部互聯網信息等。通過行為軌跡數據與設備數據的結合,大數據可以幫助我們實現對客戶的分析和挖掘,它的應用場景包括了實時核心交易、服務、後台服務等。
數據關系
數據必須要放到相應的環境中分析,才能了解數據之間的關系。譬如,每一款新機型在交付給航空公司之前都會接受一系列殘酷的飛行測試。極端天氣測試就是測試之一。該測試的目的是為了確保飛機的發動機、材料和控制系統能在極端天氣條件下正常運行。
問題的處理關鍵在於找到可能產生問題的根源,消除已知錯誤,並確保解決方案的可靠有效。一旦找到並確定了根本原因,同時具備了可接受的應急措施,就可把問題當成一個已知錯誤來處理。問題調查的過程一定需要收集所有可用、與事件相關的信息,以確定並消除引起事件和問題的根本原因。數據採集與分析必須要事件/問題發生的環境數據結合。
數據價值
對於數字化轉型,大數據不僅要關注實際數據量的多少,最重要的是關注大數據的處理方法在特定場合的應用,讓數據產生巨大的創新價值。如果離開了收益考慮或投資回報(ROI)的設計,一味尋求大數據,則大數據分析既無法落地也無法為企業創造價值。
工業大數據分析的定義
發動機是飛機的心臟,也是關乎航空安全,生命安全的重中之重。為了實時監控發動機的狀況,現代民航大多安裝了飛機發動機健康管理系統。通過感測器、發射系統、信號接收系統、信號分析系統等方式採集到的數據,會經由飛機通信定址與報告系統,通過甚高頻或者衛星通信傳輸出來,這就是為何GE的發動機監控系統每天會獲取超過1PB數據的原因。
生產執行系統(MES)與飛機發動機健康管理系統如出一轍。我們可以從工廠的生產中,實時採集到海量的流程變數、測量結果等數據。基於大量數據集而生成的報表,或是基礎統計的分析並不足以稱為製造業的大數據分析。
數據類型的多樣性是工業大數據分析的重要屬性
大數據不僅僅是大量的數據的堆積。大數據的重要屬性之一,是人們設法收集並弄清楚不斷變化的數據類型。如果只是大量採集同一類型的數據,再大的數據量都不能稱之為大數據。
例如,生產環境中收集的時間序列模擬流程變數,數據的類型是單一的,很容易建立索引,即使存在千千萬萬,也不足以成為大數據。
數據必須包括高度可變性和種類多樣性。製造工廠中存在無數的大數據應用,但並不包括簡單地分類和展示一連串的流程測量結果,對這些工作,基本的統計展現就可以完成。一些大數據的資料庫或數據湖的構成部分也是文本信息、圖像數據、地理或地質信息和非結構信息,例如,通過社交媒體或其他協作平台獲得的數據類型。
製造業信息結構概括起來分為兩層,一個是管理層,一個是自動化層。從經營管理、生產執行與控制三個緯度來實現決策支持、管理、生產執行、過程式控制制以及設備的連接與感測。製造業中大數據分析是指利用通用的數據模型,將管理層與自動化層的結構性系統數據與非結構性數據結合,進而通過先進的分析工具發現新的洞見。
大數據分析對企業生產智能的意義
製造業創新的核心就是要依託大量的前沿科技。先進的技術是創新的手段。在新技術的支持下,可以通過一體化的製造運作管理系統MOM將企業管理應用系統,例如ERP、EAM等系統與工業自動化的相關系統整合為一體。在一體化製造運作管理的基礎上,我們可以實現集IT+MOM+MES+BI的一體化製造企業信息系統解決方案。
從兩化融合的角度來看,信息系統供應商要從企業的主信息系統提供商(MIV,MainInformation systems Vendor )定位來做好規劃、標准、功能設計、實施策略的統一性工作。協助企業做好風險控制,降低投資,降低操作維護成本,實現企業信息系統全集成。
特別需要注意的是,企業管理信息平台被普遍認為是製造企業管理的集成和儀錶板工具。許多供應商既大量投資其與ERP和自動化系統專有的集成,也投資開放式集成,還投資儀錶板和移動技術,希望隨時隨地為需要正確信息的決策者提供衡量標准。
製造業大數據分析的三種途徑
途徑一,利用開放技術與平台,將任何系統的數據移動到任何其他地方。
製造運作管理系統建設項目是系統工程,不僅僅是一套我們理解的傳統軟體系統,更多的是項目執行和服務的平台。這需要在項目管理與製造企業的策略「客戶服務」上,體現出製造企業的綜合管理能力與軟實力。
整個平台要從前期、工程實施以及售後服務這三個大的階段來架構。在前期規劃中,要重視標准、設計與實施,特別是與管理一體化的信息系統形成統一的對接。有了前期統一規劃的制定,工程實施的環節可把行業的經驗、集成能力、實施能力、軟體開發能力等融合。特別需要在組織上建立和形成超級團隊的制度。而持續服務、長期經營,將物聯網應用融入與「軟體+雲服務」的互聯網+戰略是後續服務的考慮重點。
在製造業大數據分析工作中,必須要加強通過物聯網科技的應用對後續持續服務的支撐作業。通過工業物聯網,實現的及時響應客戶、物聯網軟硬體系統定期巡檢、提供應急備件、提供易耗品、完善應用等功能來加強和鎖定與企業的供應鏈企業之間的長期合作。通過管理平台與物聯網數據,可以持續為客戶提供有價值的服務。
途徑二,投資工廠內外系統架構堆棧中能夠處理結構性和非結構性數據的數據模型。
新技術是創新革命的核心,其中很重要一個特點就是集成,即製造運作管理系統MOM與ERP、EAM、OA、商業分析的集成,包括一鍵登錄、界面集成、消息推送、工作流集成、主數據、應用集成匯流排與平台。
由於這些系統之間主數據全部統一,所有系統之間的數據交互依靠應用系統匯流排進行數據交互,整合了跨系統的業務流程、工作流、服務流程等之後即實現無縫集成和分析。對於企業管理者來說,一鍵登錄後,可以根據不同的崗位,個性化制定並且顯示與管理最相關的必要信息。這就是互聯網所帶給我們的分享思路。
途徑三,通過時間序列、圖像、視頻、機器學習、地理空間、預測模型、優化、模擬和統計過程式控制制等先進的分析工具與製造業企業內的大數據平台結合分析,從而洞見尚未顯現的情況。通過感測器、感應器、傳輸網路和應用軟體等物聯網數據,與管理應用軟體結合起來,將是今後製造業大數據分析的一大方向。
培養企業內部大數據分析專家
作為一個行業,我們需要有機地發展行業特定的大數據分析工具集,這樣才能讓現在的行業專家,從足夠的數據科學中實現數字化轉型。為了推動轉型,我們需要一大批優秀的企業利用這種方法,並向其他人或同行證明其價值。

❸ 大數據重要的意義

什麼是大數據,大數據的意義是什麼?
大數據的意思就是數據要在線,這樣你的數據才能有價值,用於分析或者處理。大量的數據在線後的分析才有意義。可能得到你想要的數據,電影里好多這種素材,比如人臉的搜索,人員的定位,人流的分析,運行的狀態等等都有使用。現在做這些應用的也很多,只是落地的還稍微少一點。還是為了創造價值。
什麼是大數據,大數據為什麼重要,如何應用大數據
空談數據沒有太大意義,要看數據的主要方向是什麼。1、從技術應用方向來說,我們的數據主要做傳播指導;2、數據研究過程中我們的數據主要來自互聯網的公共數據(媒體數據、自媒體數據、企業自營的媒體數據),通過數據解決用戶洞察問題、傳播效果問題、競爭情報獲取的問題,3、我們主要是在大數據的維度上的研究上,我們的維度更多更寬廣,維度的多少決定了效果。
大數據的意義
現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。 阿里巴巴創辦人馬雲來台演講中就提到,未來的時代將不是IT時代,而是DT的時代,DT就是Data Technology數據科技,顯示大數據對於阿里巴巴集團來說舉足輕重。 有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是成為贏得競爭的關鍵。 大數據的價值體現在以下幾個方面:1)對大量消費者提 *** 品或服務的企業可以利用大數據進行精準營銷2) 做小而美模式的中長尾企業可以利用大數據做服務轉型3) 面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值不過,「大數據」在經濟發展中的巨大意義並不代表其能取代一切對於社會問題的理性思考,科學發展的邏輯不能被湮沒在海量數據中。著名經濟學家路德維希·馮·米塞斯曾提醒過:「就今日言,有很多人忙碌於資料之無益累積,以致對問題之說明與解決,喪失了其對特殊的經濟意義的了解。」這確實是需要警惕的。在這個快速發展的智能硬體時代,困擾應用開發者的一個重要問題就是如何在功率、覆蓋范圍、傳輸速率和成本之間找到那個微妙的平衡點。企業組織利用相關數據和分析可以幫助它們降低成本、提高效率、開發新產品、做出更明智的業務決策等等。例如,通過結合大數據和高性能的分析,下面這些對企業有益的情況都可能會發生:1)及時解析故障、問題和缺陷的根源,每年可能為企業節省數十億美元。2)為成千上萬的快遞車輛規劃實時交通路線,躲避擁堵。3)分析所有SKU,以利潤最大化為目標來定價和清理庫存。4)根據客戶的購買習慣,為其推送他可能感興趣的優惠信息。5)從大量客戶中快速識別出金牌客戶。6)使用點擊流分析和數據挖掘來規避欺詐行為。
什麼是大數據,大數據為什麼重要,如何應用大數據
讀讀這本書吧。。

駕馭大數據 駕馭未來

大數據的流行,也引發了圖書業大數據出版題材的升溫。去年出版的《大數據》(塗子沛著)是從數據治國的角度,深入淺出的敘述了美國 *** 的管理之道,細密入微的闡釋了黃仁宇先生」資本主義數目式管理「的精髓。最近人民郵電出版社又組織翻譯出版了美國Bill Franks的《駕馭大數據》一書。

該書的整體思路,簡單來說,就是敘述了一個」數據收集-知識形成-智慧行動「的過程,不僅回答了」what「,也指明了」how「,提供了具體的技術、流程、方法,甚至團隊建設,文化創新。作者首先在第一章分析了大數據的興起,介紹了大數據的概念、內容,價值,並分析了大數據的來源,也探討了在汽車保險、電力、零售行業的應用場景;在第二章介紹了駕馭大數據的技術、流程、方法,第三部分則介紹了駕馭大數據的能力框架,包括了如何進行優質分析,如何成為優秀的分析師,如何打造高績效團隊,最後則提出了企業創新文化的重要意義。整本書高屋建瓴、內容恣意汪洋、酣暢淋漓,結構上百川歸海,一氣呵成,總的來說,體系完備、內容繁豐、見識獨具、實用性強,非常值得推薦,是不可多得的好書!

大數據重要以及不重要的一面

與大多數人的想當然的看法不同,作者認為「大數據」中的」大」和「數據」都不重要,重要的是數據能帶來的價值以及如何駕馭這些大數據,甚至與傳統的結構化數據和教科書上的認知不同,「大數據可能是凌亂而醜陋的」並且大數據也會帶來「被大數據壓得不看重負,從而停止不前」和大數據處理「成本增長速度會讓企業措手不及」的風險,所以,作者才認為駕馭大數據,做到游刃有餘、從容自若、實現「被管理的創新」最為重要。在處理數據時,作者指出「很多大數據其實並不重要」,企業要做好大數據工作,關鍵是能做到如何沙裡淘金,並與各種數據進行結合或混搭,進而發現其中的價值。這也是作者一再強調的「新數據每一次都會勝過新的工具和方法」的原因所在。

網路數據與電子商務

對顧客行為的挖掘早已不是什麼熱門概念,然而作者認為從更深層次的角度看,下一步客戶意圖和決策過程的分析才是具有價值的金礦,即「關於購買商品的想法以及影響他們購買決策的關鍵因素是什麼」。針對電子商務這一顧客行為的數據挖掘,作者不是泛泛而談,而是獨具慧眼的從購買路徑、偏好、行為、反饋、流失模型、響應模型、顧客分類、評估廣告效果等方面提供了非常有吸引力的建議。我認為,《駕馭大數據》的作者提出的網路數據作為大數據的「原始數據」其實也蘊含著另外一重意蘊,即只有電子商務才具備與顧客進行深入的互動,也才具有了收集這些數據的條件,從這點看,直接面向終端的企業如果不電子商務化,談論大數據不是一件很可笑的事?當然這種用戶購買路徑的行為分析,也不是新鮮的事,在昂德希爾《顧客為什麼購買:新時代的零售業聖經》一書中披露了商場僱傭大量顧問,暗中尾隨顧客,用攝影機或充滿密語的卡片,完整真實的記錄顧客從進入到離開商場的每一個動作,並進行深入的總結和分析,進而改進貨物的陳列位置、廣告的用詞和放置場所等,都與電子商務時代的客戶行為挖掘具有異曲同工之妙,當然電子商務時代,數據分析的成本更加低廉,也更加容易獲取那些非直接觀察可以收集的數據(如信用記錄)。

一些有價值的應用場景

大數據的價值需要藉助於一些具體的應用模式和場景才能得到集中體現,電子商務是一個案例,同時,作者也提到了車載信息「最初作為一種工具出現的,它可以幫助車主和公司獲得更好的、更有效的車輛保險」,然而它所能夠提供的時速、路段、開始和結束時間等信息,對改善城市交通擁堵具有意料之外的價值。基於GPS技術和手......
大數據的到來對我國經濟發展有什麼意義
大數據(big data),是指無法在可承受的時間范圍內用常規軟體工具進行捕捉、管理和處理的數據 *** 。

有人把數據比喻為蘊 藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是成為贏得競爭的關鍵。

大數據的價值體現在以下幾個方面:

1)對大量消費者提 *** 品或服務的企業可以利用大數據進行精準營銷;

2) 做小而美模式的中長尾企業可以利用大數據做服務轉型;

3) 面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。
互聯網大數據有哪些好處多
大數據是什麼?為什麼要使用大數據?大數據有哪些流行的工具?本文將為您解答。

現在,大數據是一個被濫用的流行詞,但是它真正的價值甚至是一個小企業都可以實現。

通過整合不同來源的數據,比如:網站分析、社交數據、用戶、本地數據,大數據可以幫助你了解的全面的情況。大數據分析正在變的越來越容易,成本越來越低,而且相比以前能更容易的加速對業務的理解。

大數據通常與企業商業智能(BI)和數據倉庫有共同的特點:高成本、高難度、高風險。

以前的商業智能和數據倉庫的舉措是失敗的,因為他們需要花費數月甚至是數年的時間才能讓股東得到可以量化的收益。然而事實並非如此,實際上你可以在當天就獲得真實的意圖,至少是在數周內。

為什麼使用大數據?

數據在呈爆炸式的速度增長。其中一個顯著的例子來自於我們的客戶,他們大多使用谷歌分析。當他們分析一個長時間段數據或者使用高級細分時,谷歌分析的數據開始進行抽樣,這會使得數據的真正價值被隱藏。

現在我們的工具Clickstreamr可以收集點擊級的巨量的數據,因此你可以追蹤用戶在他們訪問路徑(或者訪問流)中的每一個點擊行為。另外,如果你加入一些其他的數據源,他就真正的變成了大數據。

更完整的解析

大數據大數據並不僅僅是大量的數據。他的真正意義在於根據相關的數據背景,來完成一個更加完整的報告。舉個例子,如果你把你的CRM數據加入到你網站的數據分析當中,你可能就會找到你早就知道的高價值用戶群。她們是女性,住在西海岸,年齡30至45,花費了大量的時間在Pinterest和Facebook。

現在你已經被這些知識武裝起來了,那就是如何有效的設定和獲取更多高價值的用戶。

類似Tableau和谷歌這樣的公司給用戶帶來了更加強大的數據分析工具(比如:大數據分析)。Tableau提供了一個可視化分析軟體的解決方案,每年的價格是2000美金。谷歌提供了BigQuery工具,他可以允許你在數分鍾內分析你的數據,並且可以滿足任何的預算要求。

大數據是什麼?

由於大數據往往是一個混合結構、半結構化和非結構化的數據,因此大數據變得難以關聯、處理和管理,特別是和傳統的關系型資料庫。當談到大數據的時候,高德納公司(Gartner Group,成立於1979年,它是第一家信息技術研究和分析的公司)的分析師把它分成個3個V加以區分:

量級(Volume):大量的數據

速率(Velocity):高速的數據產出

多樣性(Variety):多種類型和來源的數據。

正如我們所說,大部分的企業每一天在不同的領域都在產出大量的數據。這里給出一組樣本數據的來源及類型,他們都是企業在做大數據分析時潛在的收集和聚合數據的方式:

網站分析

移動分析

設備/感測器數據

用戶數據(CRM)

統一的企業數據(ERP)

社交數據

會計系統

銷售點系統

銷售體系

消費者數據(例如益佰利的數據、鄧氏商聯的數據或者普查數據)

公司內部電子表格

公司內部資料庫

位置數據(空間位置、GPS定位的位置)

天氣數據

但是針對無限的數據來源,不要去做太多事情。把焦點放在相關的數據上,並且從小的數據開始。通常以2-3種數據源開始是一個好的建議,比如網站數據、消費者數據和CRM,這些會讓你得到一些有價值的見解。在你最初進入大數據分析之後,你可以開始添加數據源來促進你的分析,並且公布更多的分析結果。

想要獲得更多關於大數據細節的知識,可以去查閱 *** 的大數據詞條。

大數據的好處

大數據提供了一種識別和利用高價值機會的前瞻性方法。如果你想,那麼大數據可以提供如......
什麼是「大數據」的真正含義
大講台大數據 在線培訓為你解答:大數據(bigdata),指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據 *** ,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。從技術上看,大數據與雲計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單台的計算機進行處理,必須採用分布式架構。它的特色在於對海量數據進行分布式數據挖掘。但它必須依託雲計算的分布式處理、分布式資料庫和雲存儲、虛擬化技術。大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)資料庫、數據挖掘、分布式文件系統、分布式資料庫、雲計算平台、互聯網和可擴展的存儲系統。

最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
大數據給人們帶來的好處
對一般用戶來說意義不大,對於葯店、葯廠有必要了解用戶的需求,但是如果真的利用起來能給用戶帶來選葯的便利還是很有用的。比如當你生病不知道選哪種葯好的時候,根據循證醫學原理能幫你找到合適的葯這樣也算是帶來了好處。
工業大數據對中國有什麼意義
工業大數據可以推動大數據在工業研發設計、生產製造、經營管理、市場營銷、售後服務等產品全生命周期、產業鏈全流程各環節的應用,分析感知用戶需求,提升產品附加價值,打造智能工廠,推動製造模式變革和工業轉型升級

國家下一步將利用大數據推動信息化和工業化深度融合,研究推動大數據在研發設計、生產製造、經營管理、市場營銷、售後服務等產業鏈各環節的應用,研發面向不同行業、不同環節的大數據分析應用平台,選擇典型企業、重點行業、重點地區開展工業企業大數據應用項目試點,積極推動製造業網路化和智能化。在應用項目試點過程中,需要開展應用示範安全可靠性方面的測評,利用大數據測試技術、工業電子系統測試技術和工業雲測試技術,保障工業企業大數據應用項目試點的穩步推進,中國軟體評測中心在相關方面有較深厚的技術積累和案例積累,可以為我國工業大數據發展保駕護航。
大數據的特點主要有什麼?
大數據(big data),是指在可承受的時間范圍內用常規軟體工具進行捕捉、管理和處理的數據 *** 。

大數據的特點:

1、容量(Volume):數據的大小決定所考慮的數據的價值的和潛在的信息;

2、種類(Variety):數據類型的多樣性;

3、速度(Velocity):指獲得數據的速度;

4、可變性(Variability):妨礙了處理和有效地管理數據的過程。

5、真實性(Veracity):數據的質量

6、復雜性(plexity):數據量巨大,來源多渠道

大數據的意義:

現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的產物。

有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模數據是成為贏得競爭的關鍵。

大數據的缺陷:

不過,「大數據」在經濟發展中的巨大意義並不代表其能取代一切對於社會問題的理性思考,科學發展的邏輯不能被湮沒在海量數據中。著名經濟學家路德維希·馮·米塞斯曾提醒過:「就今日言,有很多人忙碌於資料之無益累積,以致對問題之說明與解決,喪失了其對特殊的經濟意義的了解。」 這確實是需要警惕的。

❹ 大數據離不開 「厚數據」

大數據離不開 「厚數據」

當前,全世界各種規模的公司都在被告知需要大數據——大數據是驅動下一輪創新的源動力。風投公司專門確立針對大數據的投資組合,初創公司對外宣稱自己是 「大數據」 公司,成熟的巨頭企業會成立專門做大數據項目的數字創新團隊。面對先進的計算數據收集和分析能力,許多初創公司和大型企業不惜以犧牲人的洞察為代價,過度地專注於收集定量數據。這種把定量數字凌駕於定性洞察之上的做法著實令人擔憂。我就曾親眼見證了一家公司為此遭受到的重大影響,沒有任何一家公司會希望遵循這種做法。

2009年 的時候,我在諾基亞做調研工作。諾基亞是當時新興市場最大的手機公司。我在研究中發現,這家公司在整體商業模式上正面臨挑戰。經過多年在中國的人類學研究工作,不論是與外來打工者一起生活,體驗街頭小販的辛酸苦辣,還是沉浸在網吧世界,這些都讓我看到了大量的市場信號,我有理由相信,低收入消費者已經准備好為更昂貴的智能手機買單。

當時我的結論是,諾基亞必須轉變他們當前的產品開發策略,從製造價格昂貴、面向精英用戶的智能手機,轉而開發價格適中、面向低收入用戶的智能手機。我把我的研究報告和相關建議匯報給了諾基亞總部。但諾基亞在看過我的研究發現後卻不知道該怎麼做。他們說,我的樣本量只有 100 個,和他們成百上千萬的樣本量相比,簡直就是微不足道。另外他們還說,根據他們現有的數據資料,我的洞察發現根本就沒有任何根據可言。

當然現在,我們所有人都知道諾基亞後來發生了什麼。微軟在 2013年 收購了諾基亞手機業務,目前它的全球智能手機市場份額僅占 3%。諾基亞的衰落是由很多原因導致的,但其中最嚴重的原因之一,也是我親歷的一個原因就是,諾基亞過度依賴數字。他們過於注重定量數據,以至於在面對難以衡量或現有報告里沒有的數據時,就變得不知所措。原本可以成為諾基亞的競爭籌碼,最後卻幫了一個倒忙,導致它走向衰亡。

自從諾基亞的那次工作經歷以來,企業組織這種過度重視定量數據而忽略定性數據的做法就一直讓我感到非常不解。隨著大數據時代的崛起,我發現這種情況開始愈演愈烈,一些公司不惜扣減花在以人為本調研上的預算,而寧願花重金投資在大數據技術上。人類學定性研究工作在大數據時代下的生存現狀讓我深感憂心。

在當前這個以數據為驅動的世界,人類學研究工作(經常以市場調研、設計調研和定性調研的形式在行業里出現)正面臨一個非常嚴重的認識誤區。經常會聽到人們談論說,人類學研究的數據樣本量太小,人類學研究數據是 「小數據」,就像當時諾基亞高層說的一樣。

由於缺少概念性文字來快速界定人類學研究在大數據時代的價值,自去年開始我一直在用 「厚數據」(在此向 Clifford Geertz 致意!)這個詞來表示我對綜合性研究法的提倡和支持。厚數據是指利用人類學定性研究法來闡釋的數據,旨在揭示情感、故事和意義。厚數據難以量化,但能從少量樣本中就解讀出深刻的意義和故事。厚數據與大數據截然不同,定量數據需要依賴大量的樣本,同時藉助新技術來捕捉、存儲和分析數據。要讓大數據變得可分析,它就必須經過一個正常化、標准化的定義和歸類過程,這個過程會在無形之中剔除數據中所包含的背景、意義和故事。而厚數據恰恰能防止大數據在被解讀的過程中丟失這些背景元素。

「厚數據是指利用人類學定性研究法來闡釋的數據,旨在揭示情感、故事和意義。」

整合大數據和厚數據能讓企業站在全局的高度,更全面、更徹底地把握任何情形。企業要縱觀全局,就必須同時運用大數據和厚數據,從中獲得不同類型的洞察,獲得豐富的廣度和深度。大數據需要藉助大量樣本來揭示特定模式,而厚數據只要藉助少量樣本就能從深層次解讀出各種以人為本的模式。厚數據依賴人的學習活動,而大數據依賴機器的學習活動。厚數據體現著各種數據關系背後的社會背景,而大數據體現的是從一系列特定定量數據中提煉出的洞察。厚數據技術能包容不可化約的復雜性,大數據技術則是通過分離變數來明確模式。厚數據缺少廣度,大數據缺少深度。

運用大數據存在風險

企業組織在運用大數據時,如果沒有一套整合框架或權衡尺度,那麼大數據就會變成一個危險因子。Steven Maxwell 指出:「人們過度沉迷於數據信息的量,卻忽略了 『質』 的部分,也就是分析法所能揭示的商業洞察。」 量越大並不意味著生成的洞察就一定越多。

另一個問題是,大數據往往過於注重定量結果,而貶低了定性結果的重要性。這就會導向一種比較危險的看法,即認為經統計分析得出的標准化數據要比定性數據更有用、更客觀,從而進一步肯定了定性數據就是小數據這一觀點。

以上兩個問題導致企業組織幾十年來僅僅憑借定量數據來做管理決策。一直以來,企業管理咨詢顧問都是利用定量數據來讓提升企業的運作效率和贏利。

利用大數據的風險在於,企業和個人會開始依賴運演算法則,把它作為衡量標准來做決策和優化表現。

如果沒有一種平衡力量,大數據很可能會導致企業和個人總是依據從運演算法則得來的標准來做決策和優化。在這個優化過程中,包括人、故事、真實的體驗在內的一切都會被忽視。正如 Clive Thompson 寫道的:「把人的決策因素從這個等式中抹去,就意味著我們會與深思熟慮的做法漸行漸遠,而這些深思熟慮的時刻恰恰是我們從道德層面反思自己行為的機會。」


釋放大數據與厚數據的整合效應

大數據產生的信息量實在太過龐大,以至於不得不藉助其他方式才能填補和 / 或揭示知識缺口。而這恰恰是人類學研究工作在大數據時代的價值所在。下面,我會分享一些有關企業如何整合使用厚數據的方式。

厚數據是勾勒未知世界的最佳方式。當企業組織想了解他們並不了解的領域時,就需要厚數據的幫助,因為它能帶來大數據所沒有的東西——靈感。收集和分析故事有助於生成洞察。

當企業組織想要了解並不熟悉的領域時,就需要 「厚數據」 的幫助,因為它能帶來大數據所無法帶來的東西——靈感。收集和分析故事有助於生成洞察。

故事能激發企業組織探索通往目的地的不同途徑,這個最終目的地就是洞察。打個比方,假設你在開車,厚數據能讓你瞬間移動到想去的地方。厚數據常常會帶來一些意料之外的發現,既讓人困惑又讓人驚喜。但不論怎樣,它都能帶來靈感啟發。只有在富於想像力的企業,創新才能賴以生存。

當企業想要與利益相關方建立更穩健的關系時,他們就會需要用到 「故事」。「故事」 包含著情感,而這是經分析過濾的標准化數據所不能提供的。數字無法折射出日常生活中的各種情感:信任、脆弱、害怕、貪婪、慾望、安全、愛和親密。很難用算術法則來表示一個人對服務 / 產品的好感程度,以及這種好感會隨著時間變化而發生怎樣的轉變。相對地,「厚數據」 分析法能深入人們的內心。畢竟,利益相關方與企業 / 品牌的關系是感性的,而不是理性的。


厚數據和大數據的未來整合機會點

大數據概念的提出者 Roger Magoulas 強調了故事的必要性:「故事能很快傳播開來,把數據分析法的經驗教訓擴散到企業組織的各個角落。」

僅僅使用大數據會帶來問題,關鍵是要懂得如何同時利用起大數據和厚數據,讓兩者相輔相成。對於定性研究者來說,這是他們在以定量結果為主導的大數據時代定位自己工作性質的絕佳機會。像 Claro Partners 這樣一些公司甚至已經開始重新界定我們如何問有關大數據的問題。在他們的個人數據經濟(Personal Data Economy)研究中,他們並沒有問大數據對人類行為的啟示這類問題,而是反過來問了人類行為對大數據在日常生活中的作用的啟示。他們還為客戶開發了一套工具,幫助他們轉變思維視角,「從以數據為核心轉變為以人為核心。」

有關大數據和厚數據如何在企業組織中發揮協同效應,我梳理了以下機會點(當然並不僅限於這些):

健康醫療

隨著個人能越來越方便地追蹤自己的健康狀態,自我量化值正在成為一種主流。醫療服務提供者會有越來越多的機會收集到各種匿名數據。像 Asthma Files 這列項目可以讓你迅速展望厚數據和大數據將如何共同解決全球健康問題。

重新定位來自移動運營商的匿名數據

全球各地的移動公司已經開始重新包裝和出售他們的顧客數據。市場營銷者不是唯一的買家。城市規劃者正在用 Air Sage 的蜂窩式網路數據來了解當地的交通狀況。為了保護用戶隱私,這些數據會採取匿名或抹去個人通信記錄。當然,沒有了關鍵的個人詳情,數據也就丟失了關鍵的背景信息。在這種情況下,若沒有厚數據,企業就很難破譯這些因個人信息被抹去而丟失的個人情況和社會背景,也就無法真正解讀數據。

社交網路分析

社交媒體能產生大量數據,這些數據能讓社交網路分析法變得更為豐富。目前,包括 Hilary Mason、Gilad Lotan、Duncan Watts 和 Ethan Zuckerman (以及他在 MIT Media Lab 的實驗室) 在內的研究科學家都在研究信息在社交網路上的傳播方式,以及同時會產生哪些問題,而這些問題只能藉助 「厚數據」 才能回答。現在越來越多的公司把社交媒體作為衡量尺度,對此企業必須謹慎對待,不要誤認為僅僅透過數據就能看到 「影響因素」。媒體對 Cesar Hildalgo 工作的誤讀就是大數據網路分析結果被曲解的一個實例,意指維基網路可以成為文化代理。(點擊此處查看 Heather Ford 對此做出的糾正。)

品牌戰略和生成洞察

一直以來,企業都習慣於依賴市場分析來制定企業戰略和生成洞察。如今,企業正在轉向用一種更為以人為本的方式,也就是立足於 「厚數據」。《快公司》雜志(Fast Company)在最近一期 Jcrew 的報道中明確指出,在以大數據為驅動的管理咨詢法宣告失敗後,帶領品牌走出困境的恰恰是那些真正懂得消費者想要什麼的員工。其中,一位叫 Jenna Lyons 的員工有機會與消費者一起反復嘗試、修改和實時測試產品。她的這套方法在消費者中引起了反響,最終成功地把 Jcrew 轉變為一個讓人頂禮膜拜的品牌,營收翻了三番。

產品 / 服務設計

單單藉助運演算法則並不能解決問題,但仍然有很多公司依賴運演算法來指導產品和服務開發。施樂公司(Xerox)就是利用大數據來為政府解決問題,但它同時還藉助了人類學研究法作為數據分析法的補充。施樂帕羅奧多研究中心(Xerox PARC)的人類學家 Ellen Issacs 在提及厚數據對設計工作的重要性時這樣說道:「即使你對某項技術有著清晰的概念,你仍然需要把它設計出來,確保這套概念符合人們對自己行為活動的看法……你必須看他們怎麼做。」

落實企業組織戰略

厚數據可以作為大數據的補充,與大數據相輔相成,以減少經過規劃的企業轉變所造成的顛覆性影響。定量數據可能會顯示必須做出某種轉變,但企業組織內部的顛覆代價是巨大的。重新布局企業組織架構圖,重新撰寫職位描述,轉換工作職能,重新設定成功標准——所有這些顛覆式轉變都要付出昂貴代價,而這一後果可能並不會體現在大數據計劃中。企業需要厚數據專家與業務領導一起協作,共同了解轉變會帶來的影響和發生背景,從文化的角度決定哪些轉變是可行的,以及如何設計整個流程。Grant McCracken 把厚數據專家叫做首席文化官(Chief Cultural Officer),他們就好比是 「企業的眼睛和耳朵,會敏銳地嗅出即將發生的轉變,即使這些潛在轉變只是發出非常微弱的信號。」 首席文化官就是厚數據專家,負責收集、講述和傳播故事,保持企業組織的靈氣和靈活性。大數據概念的提出者 Roger Magoulas 強調了故事的必要性:「故事很快就能傳播開來,把分析總結帶來的習得散播到整個企業組織。」


綜合運用同理心和數據資源進行創新

除了所有這些有待挖掘的機會點,還有一點很重要的就是,大數據仍有很大的改進空間。高德納咨詢公司(Gartner)的研究顯示,在投資大數據能力的公司當中,只有 8%的公司在利用大數據做一些具有深遠意義的事情。其餘公司僅僅只是用大數據來拉動漸進式增長。這意味著很多公司雖然都在談論和投資大數據,但他們並沒有真正利用起大數據來推動真正的變革。

我認為,企業和機構要想充分發揮大數據的潛力,就必須結合運用厚數據,這也是為什麼我們現在比以往任何時候更需要從事以人為靈感來源的研究工作者,不論是人類學家、市場調研者、設計調研者、設計師、產品經理、紀錄片導演、製片人、作家還是社交媒體經理,因為這類研究工作者是始終帶著同理心在收集和分析數據。最有創新力的公司往往就是那些懂得如何綜合運用大數據與同理心的公司。這也是為什麼阿里巴巴、網路和騰訊這些公司得以如此成功的原因之一,他們總能閃電般地迅速掌握實際用戶所處的情境,以此來驅動他們的技術革新。未來,中國的創新將同時有賴於情境和數據。

以上是小編為大家分享的關於大數據離不開 「厚數據」的相關內容,更多信息可以關注環球青藤分享更多干貨

❺ 互聯網大數據有哪些好處

大數據是大量、高速、多變的信息,它需要新型的處理方式去促成更強的決策能力回、洞察力與最佳化處答理。大數據為企業獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。
藉助大數據及相關技術,我們可針對不同行為特徵的客戶進行針對性營銷,甚至能從「將一個產品推薦給一些合適的客戶」到「將一些合適的產品推薦給一個客戶」,得以更聚焦客戶,進行個性化精準營銷。
大數據時代下的精準營銷是指通過大數據獲取對象的喜好,行為偏好,對不同對象進行不同營銷。大數據精準營銷的核心可以概括為幾大關鍵詞:用戶、需求、識別、體驗。
億美軟通推出數據雲服務,延續億美的客戶服務、客戶營銷、客戶管理的公司經營理念,通過龐大的消費數據資源,為客戶提供數據驗證,精準營銷等數據級服務。簡單說就是為企業提供數據驗證和數據篩選業務。

❻ 大數據的是與不是

大數據的是與不是
在時下的流行語中,很難找出一個比「大數據」更吸引眼球的術語了。1980年,阿爾文 托夫勒在《第三次浪潮》中預言了信息時代的到來會帶來數據爆發,約翰 梅西在1998年的美國高等計算機系統協會大會上首次提出「大數據(big data)」一詞。什麼是大數據?這一概念目前尚未形成統一的定義。幾種代表性的觀點如下:麥肯錫認為「大數據是指無法在一定時間內用傳統資料庫軟體工具對其內容進行抓取、管理和處理的數據集合」;維基網路認為「大數據是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的數據集」;全球最具權威的 IT研究與顧問咨詢公司——高德納公司認為「大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產」。
大數據時代已經來臨,它將在眾多領域掀起變革的巨浪,這是勿庸置疑的事實,在以雲計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值,而對於電網企業來說,大數據的應用同樣會促進企業的跨越發展。
大數據的本質是事物的時域、空域記錄,並非事物的描述數據
對於大數據的特點,IT界通常用Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)這4個 V來概括。Volume,指數據體量巨大,從TB級別躍升到PB乃至EB級別;Variety,指數據類型繁多。除了傳統的結構化數據,大量非結構化、半結構化數據如網路日誌、音頻、視頻、圖片等;Value,指價值密度低,但大數據分析的價值高。價值密度的高低與數據總量的大小成反比,以視頻為例,一部一小時的視頻,在連續不間斷監控過程中,可能有用的數據僅僅只有一兩秒;Velocity,指變化速度快。大數據不僅量大,而且變化快,大數據的應用依賴於對數據的快速處理。但在筆者看來,對大數據作4V特點的概括是現象而非本質總結。
其實人類文明就是大數據的記錄與應用積累,當今社會進入了信息時代,信息化的本質是用 IT技術和方法描述世界,描述事物的內在本質、過程規律和業務規則,信息化的應用過程就是在描述好事物的軟體系統中實現人工和 /或機器記錄,大數據的本質是事物的時域、空域記錄,並非事物的描述數據,大數據成為熱門是因為信息化、互聯網、終端的普及和應用讓我們進入了一個機器自動記錄的時代,爆炸性增長的記錄數據使傳統的人工、單機 /單節點的機器處理能力無法完成記錄的分析、挖掘,由此催生了雲計算和大數據概念並推動人工智慧的工程應用,機器學習等人工智慧技術就是機器處理大數據及大數據應用高級模式。
大數據應用的本質是推導規律、預知未來,並非簡單的統計分析
在信息化時代以前,人類就有典型的大數據應用,如視覺美學總結的黃金分割(0.618),社會學中的在特定時空范圍內存在的「二八」理論。大數據應用的本質是推導規律、預知未來,並非簡單的統計分析。在信息化時代,大數據極大依賴信息化及其應用,開展大數據分析也必須應用信息化方法與手段,符合信息化業務驅動、目標導向等原則,沒有目標的大數據平台建設或掛大數據「羊頭」不利於信息化建設和大數據應用。
而互聯網大數據與企業大數據是有區別的,互聯網本質是跨區域的信息化網路基礎設施,其大量的內容服務和居於互聯網社交軟體並不存在描述事物的過程即沒有對象模型,人們應用互聯網留下了應用記錄(大量的非結構化數據),分析這些大數據記錄的前提是重新構建記錄的對象,對記錄標識特徵。企業信息化一般經過業務標准化和業務流程梳理過程,所以企業的大數據是存在對象描述,但企業應用的困難是我們建設的系統在對象描述上不統一、對象上的記錄不完整。所以互聯網大數據與企業大數據應用盡管原理與方法一致,但分析工作的重點是有區別的。互聯網公司在開展大數據分析的工具、技術方法不完全適用於企業,更不能把互聯網大數據的平台建設當做企業大數據應用工作的全部。
區別好對象模型數據與記錄數據是大數據分析的基礎,盡管描述事物對象的數據也可以達到 PB級,如人類的基因圖譜、地球大氣層流動模型、電網的網路結構模型等,這些數據不是大數據,在這些對象模型上構建軟體並記錄的業務變化是大數據。所以在大數據應用方面存在兩類數據的預處理,一類是模型數據預處理,另一類是記錄數據預處理。模型層面的預處理本質是信息化建設方案的科學性、合理性。記錄的完整性很大程度上也是取決於信息化方案,同時也取決於信息系統的應用過程。一旦軟體上線,再作數據治理來解決模型之間的不一致性或對記錄的二次「模型化」加工是一種方法論上的誤導,正確的方法應該是依據企業架構和行業解決方案完善信息化架構,實現企業信息化架構規范和引導下的信息系統建設和應用,在企業層面統籌企業模型、統籌系統結構和功能界面、統一業務系統應用規范。企業的數據治理必須在建設方案中完成,系統建成系統後的數據治理是無效的,當然在系統運行過程中資料庫的技術數據治理是必須的。
大數據應用在電網領域大有可為
在電網企業中,電量數據是一組典型的大數據。客戶和客戶的電表台賬是電量數據的宿主對象,採集系統中對客戶和電表台賬進行建模,各用戶電表的時序記錄就是電量大數據。下面結合國網江蘇電力開展的負荷預測大數據應用簡述大數據應用方法。
首先是數據預處理。對象模型的預處理,依託營配調一體化,建立客戶和電表台賬與電網供電邏輯關系,構建電網各電壓層級直至各台區到用戶的關聯模型;記錄數據的預處理,對電量記錄電度值進行年度節假日除權回原,去除電量的節假日因素,去除記錄奇點和內插補全個別記錄缺點等。
其次是分行業回歸建立日電量與氣溫、濕度等因素用電模型,依據實時運行方式累計各台區日電量、日負荷,完成各區域、各電壓等級的電量和負荷預測模型的構建,並構建模型機器學習,保持模型的時效性。
最後,由大數據平台給預測模型導入實時氣溫與前一時段的電量和負荷,實現短期、超短期的全網負荷預測。同樣原理,關聯宏觀GDP與電量指數,結合業擴包裝量變化,實現中長期負荷預測。
2015年 ,江蘇電網以全樣本的用戶每日實時採集用電數據,結合十多年用電、業擴、氣象等歷史數據,建立起涵蓋全省各地區、分行業以及25萬專變用戶和40萬台公用變壓器的包括溫度、濕度、節假日、周末等要素的多維度用電影響模型,模型包含的數據關聯關系超過110億項,開展負荷中長期、短期、超短期預測工作,有效指導了生產工作。
此外,電量大數據的應用在行業內外還有大量的可應用價值,如從用電設備節能潛力分析全社會節能潛力、大用戶用電特徵分析行業產能利用情況、居民用戶家庭活動特徵等,大數據應用在電網領域大有可為。

❼ 用明喻或者暗喻的方法描述大數據

大數據的定義:
大數據由巨型數據集組成,這些數據集大小常超出人類在可接受時間下的收集、庋用、管理和處理能力。大數據的大小經常改變,截至2012年,單一數據集的大小從數太位元組(TB)至數十兆億位元組(PB)不等。
在一份2001年的研究與相關的演講中,麥塔集團(META Group,現為高德納)分析員道格·萊尼(Doug Laney)指出數據增長的挑戰和機遇有三個方向:量(Volume,數據大小)、速(Velocity,數據輸入輸出的速度)與多變(Variety,多樣性),合稱「3V」或「3Vs」。高德納與現在大部分大數據產業中的公司,都繼續使用3V來描述大數據。高德納於2012年修改對大數據的定義:「大數據是大量、高速、及/或多變的信息資產,它需要新型的處理方式去促成更強的決策能力、洞察力與最優化處理。」另外,有機構在3V之外定義第4個V:真實性(Veracity)為第四特點[20]。
大數據必須藉由計算機對數據進行統計、比對、解析方能得出客觀結果。美國在2012年就開始著手大數據,投入2億美金在大數據的開發中,更強調大數據會是之後的未來石油。
數據挖掘(data mining)則是在探討用以解析大數據的方法。

❽ 說文解字第1課:大數據Big Data

大家好,又到了說文解字的時間,不對,這是癮科技的新專欄,所以說文解字這個專欄是第一次跟大家見面喔。在往後的每個星期,我們都會推出1篇文章,向讀者解釋各種電腦、3C領域的關鍵字,希望大家多多支持。

在幾年前,BOT是個相當熱門的辭匯,山也BOT、海也BOT。到了這幾年,大數據成了最火紅的關鍵字之一,無論企業界還是政治人物,都把大數據掛在嘴邊,但是大數據到底是什麼呢?

大數據不只大,全面更重要

大數據一詞直譯自英文的Big Data,也有人將其翻譯為海量資料,字面上的意思就已經把它的涵義說明一半了。大數據既然有個「大」字,就代表它的資料量一定很多,於是這就引發了另一個問題,要有多少資料,才能叫作大數據呢?根據麥塔集團(META Group)2001年的研究報告指出,資料增長的挑戰有資料量(Volume)、處理速度(Velocity)、資料多樣性(Variety)等3個方向。

然而麥塔集團在2005年時被高德納顧問公司收購,高德納於2012年對大數據提出新的定義,指出大數據是大量資料、高速處理,並可能具有多樣性,需要使用新的方式進行處理,以用於增進決策能力、洞察力,並協助將處理程序最佳化。從這個定義中,我們可以看到資料的量並沒有被給予明確的界限,因此我們不防轉向參考麥爾荀伯格與庫基耶所著的大數據一書,從資料的特性進行思考。

▲大數據一書由天下文化出版,相當值得一看。(圖片來源:天下文化)

大數據之所以與傳統資料有所不同,其中很大的原因就是資料采樣方式的差異。在傳統分析資料的過程中,因為收集資料的方式與工具需要相當的成本與時間,而在有限的經費與時間下,我們需要先對母體進行抽樣,然後再收集這些樣本的資料。舉例來說,如果要在選舉之前進行民調,民調公司只對一部份的人進行抽樣,並調查他們的投票意向。這時候分析的結果很可能就會受到抽樣方式影響,若是採用室內電話調查,可能會因為年輕族群在家時間較少,且部分租屋族並未安裝室內電話,而讓樣本的年齡偏高,進而影響分析的准確度。

藉助電腦自動處理大量資料

然而大數據的概念之一,就是可以透過不同的方式收集資料,以達到直接對母體進行全面性調察的目的,如此一來就能避免抽樣失真而讓分析結果失去參考價值。

再舉個例子,傳統電視節目的收視率,是透過在特定收視戶家中安裝調整設備,來記錄觀看電視的頻道與時間,或是透過電話訪問,訪查收視戶正在收看的節目。然而這種方式會因為樣本的家庭成員組成、喜歡節目的不同,而影響調察結果,雖然可以透過增加抽樣數量的方式,提高結果的准確度,但是無論再怎麼改善調查結果,都還是無法還原所有收視戶真實的情況。

但是在電視數位化之後,系統業者便能透過機上盒的程式統計收視情況,並自動將資料回傳至伺服器進行統計,如此一來便能確實掌握所有人的真實收視情況,而不會被不準確的抽樣影響,這對資料分析有著相當大的助益。

▲在抽樣統計中,若樣本的數量越大,誤差就會越小,而大數據則是直接將母體做為樣本,因此不會有統計誤差。

比較前後兩者的差別,可以看到新的方式能夠透過自動化的方式,全面性地收集資料,並透過電腦進行高速統計與處理,由於節省了許多成本與時間,因此就不再需要為了現實考量而採用抽樣統計,這就是大數據與傳統資料處理方式的差異,也讓資料更具參考價值,能提供決策者更強而有力的判斷依據。

總結來說,大數據的精神除了資料本身量很龐大之外,以至於分析的對向從樣本題升至母體之外,另一個重點就是透過非傳統的方式,挖掘出資料中尚未被發現的價值。至於該如何收集、挖掘並運用資料,這就是另一門學問了,這個主題就留到下周再一起討論吧。

說文解字使用範例:大數據

O:企業經營者可以透過大數據預估消費趨勢。

X:辦公室已經沒有空間擺放大數據的卷宗了。

閱讀全文

與高德納大數據概念相關的資料

熱點內容
pdf文件無法列印其他正常 瀏覽:126
拍照文件掃描轉換word 瀏覽:724
電腦啟動後桌面文件不見了 瀏覽:535
圖文游戲編程作品說明如何寫 瀏覽:197
qq瀏覽器wifi不安全衛士 瀏覽:449
文件在用戶卻不顯示在桌面 瀏覽:124
delphi獲取操作系統版本 瀏覽:722
linux定時任務執行腳本 瀏覽:787
招商銀行app怎麼查電費 瀏覽:739
手機代碼文檔翻譯軟體 瀏覽:676
青華模具學院和ug編程哪個好 瀏覽:736
怎麼改網站關鍵詞 瀏覽:581
怎麼把ps圖片保存成雕刻文件 瀏覽:771
java字元串賦空值不賦值null 瀏覽:556
什麼是文件hash 瀏覽:345
文件碎片微信小程序 瀏覽:878
蘋果手機怎麼升級運營商版本 瀏覽:100
什麼是菜鳥網路服務協議 瀏覽:260
11月份的銷售數據是什麼 瀏覽:439
三個數據如何列表格 瀏覽:92

友情鏈接