㈠ 什麼是大數據時代
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。《著雲台》的分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapRece一樣的框架來向數十、數百或甚至數千的電腦分配工作。
簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。 大數據的4個「V」,或者說特點有四個層面:第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網路日誌、視頻、圖片、地理位置信息等等。第三,價值密度低。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。第四,處理速度快。1秒定律。最後這一點也是和傳統的數據挖掘技術有著本質
的不同。業界將其歸納為4個「V」——Volume,Variety,Value,Velocity。 物聯網、雲計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的感測器,無一不是數據來源或者承載的方式 著雲台
例子包括網路日誌,RFID,感測器網路,社會網路,社會數據(由於數據革命的社會),互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他復雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務。
大的數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)資料庫,數據挖掘電網,分布式文件系統,分布式資料庫,雲計算平台,互聯網,和可擴展的存儲系統。
一些但不是所有的MPP的關系資料庫的PB的數據存儲和管理的能力。隱含的負載,監控,備份和優化大型數據表的使用在RDBMS的。
斯隆數字巡天收集在其最初的幾個星期,比在天文學的歷史,早在2000年的整個數據收集更多的數據。自那時以來,它已經積累了140兆兆 位元組的信息。這個望遠鏡的繼任者,大天氣巡天望遠鏡,將於2016年在網上和將獲得的數據,每5天沃爾瑪處理超過100萬客戶的交易每隔一小時,反過來進口量資料庫估計超過2.5 PB的是相當於167次,在美國國會圖書館的書籍 。
FACEBOOK處理400億張照片,從它的用戶群。解碼最初的人類基因組花了10年來處理時,現在可以在一個星期內實現。
「大數據」的影響,增加了對信息管理專家的需求,甲骨文,IBM,微軟和SAP花了超過15億美元的在軟體智能數據管理和分析的專業公司。這個行業自身價值超過1000億美元,增長近10%,每年兩次,這大概是作為一個整體的軟體業務的快速。 大數據已經出現,因為我們生活在一個社會中有更多的東西。有46億全球行動電話用戶有1億美元和20億人訪問互聯網。
基本上,人們比以往任何時候都與數據或信息交互。 1990年至2005年,全球超過1億人進入中產階級,這意味著越來越多的人,誰收益的這筆錢將成為反過來導致更多的識字信息的增長。思科公司預計,到2013年,在互聯網上流動的交通量將達到每年667艾位元組。
最早提出「大數據」時代已經到來的機構是全球知名咨詢公司麥肯錫。麥肯錫在研究報告中指出,數據已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產因素;而人們對於海量數據的運用將預示著新一波生產率增長和消費者盈餘浪潮的到來。
「麥肯錫的報告發布後,大數據迅速成為了計算機行業爭相傳誦的熱門概念,也引起了金融界的高度關注。」隨著互聯網技術的不斷發展,數據本身是資產,這一點在業界已經形成共識。「如果說雲計算為數據資產提供了保管、訪問的場所和渠道,那麼如何盤活數據資產,使其為國家治理、企業決策乃至個人生活服務,則是大數據的核心議題,也是雲計算內在的靈魂和必然的升級方向。」
事實上,全球互聯網巨頭都已意識到了「大數據」時代,數據的重要意義。包括EMC、惠普(微博)、IBM、微軟(微博)在內的全球IT 巨頭紛紛通過收購「大數據」相關廠商來實現技術整合,亦可見其對「大數據」的重視。
「大數據」作為一個較新的概念,目前尚未直接以專有名詞被我國政府提出來給予政策支持。不過,在12月8日工信部發布的物聯網「十二五」規劃上,把信息處理技術作為4項關鍵技術創新工程之一被提出來,其中包括了海量數據存儲、數據挖掘、圖像視頻智能分析,這都是大數據的重要組成部分。而另外3項關鍵技術創新工程,包括信息感知技術、信息傳輸技術、信息安全技術,也都與「大數據」密切相關。
㈡ 什麼是大數據時代
什麼是大數據時代:
利用相關演算法對海量數據的存儲、處理與分析,從海量數據中發現價值,服務於生產和生活。
大數據無處不在,社會各行各業都可以找到大數據的印記,在金融,餐飲,電信,體育,娛樂等領域都可以感受到大數據對各行各業的影響
大數據的特點:
1、更多,更亂,但內部有關系可循。
示例:
大約20年前,亞馬遜剛成立時,傑夫·貝索斯讓50個書評員來為他賣書,他意識到不僅僅可以請人來寫書評,還可以用數據技術來提供圖書推薦。起初他使用的是小數據,不是大數據,把客戶進行分類,比如說有人對中國旅遊或者是對園藝感興趣,系統會自動提供推薦。他的同事告訴他,剛剛開始使用這個數據推薦時,使用體驗並不好;在進一步分析後,亞馬遜決定不對人進行分類,而是對用戶的需求分類。這個做法做法非常成功,以至於到今天,推薦系統為亞馬遜帶去30%的銷售收入。
這就是數據收集和再處理。亞馬遜有交易數據,每買一本書就是一個交易,然後對這個數據進行分析。但今天我們已不再滿足於交易數據了,轉而收集起溝通數據。你看了某一個書評、某一個交流會給商家更多的信息和細節。
2、數據可以被重復使用(數據的產生和收集本身並沒有直接產生服務,最具價值的部分在於:當這些數據在收集以後,會被用於不同的目的,數據被重新再次使用)
示例:
比方說這家公司實時車輛交通數據採集商Inrix,該公司目前有1億個手機端用戶。Inrix可以幫助你開車,避開堵車,為司機呈現路的熱量圖,紅的就表面堵車。如果只提供數據,這個產品沒什麼特色,
但值得一提的是,Inrix並沒有用交警的數據,這個軟體的每位用戶在使用過程中會給伺服器發送實時數據,比如走的多快,走到哪裡,這樣每個客戶都是探測器。
大數據時代的思維:
每天早上起來想一下,這么多數據我能用來干什麼,這些價值在哪裡可以找到,能不能找到一個別人以前都沒有做過的事情。你的想法和思路,是最重要的資產。
示例:
我們可以通過大數據來確定哪些地方會有火災。以前防火檢查員只有13%的時間可以准備預測,現在他們找到火災隱患的概率達到了70%,比以前提高了6倍。將效率提高6倍是一個巨大無比的進步,未來的公共服務業可以由此獲得更多便利。
㈢ 什麼是大數據時代
讓大數據區別於數據的,是其海量積累、高增長率和多樣性
什麼是數據?數據(data)在拉丁文里是「已知」的意思,在英文中的一個解釋是「一組事實的集合,從中可以分析出結論」。
籠統地說,凡是用某種載體記錄下來的、能反映自然界和人類社會某種信息的,就可稱之為數據。
古人「結繩記事」,打了結的繩子就是數據。
步入現代社會,信息的種類和數量越來越豐富,載體也越來越多。
數字是數據,文字是數據,圖像、音頻、視頻等都是數據。
什麼是大數據呢?量的增多,是人們對大數據的第一個認識。
隨著科技發展,各個領域的數據量都在迅猛增長。有研究發現,近年來,數字數據的數量每3年多就會翻一番。
大數據區別於數據,還在於數據的多樣性。
正如高德納咨詢公司研究報告指出的,數據的爆炸是三維的、立體的。所謂的三維,除了指數據量快速增大外,還指數據增長速度的加快,以及數據的多樣性,即數據的來源、種類不斷增加。
從數據到大數據,不僅是量的積累,更是質的飛躍。海量的、不同來源、不同形式、包含不同信息的數據可以容易地被整合、分析,原本孤立的數據變得互相聯通。這使得人們通過數據分析,能發現小數據時代很難發現的新知識,創造新的價值。
通過數據來研究規律、發現規律,貫穿了人類社會發展的始終。
人類科學發展史上的不少進步都和數據採集分析直接相關,例如現代醫學流行病學的開端。倫敦1854年發生了大規模的霍亂,很長時間沒有辦法控制。
一位醫師用標點地圖的方法研究了當地水井分布和霍亂患者分布之間的關系,發現有一口水井周圍,霍亂患病率明顯較高,藉此找到了霍亂暴發的原因:一口被污染的水井。關閉這口水井之後,霍亂的發病率明顯下降。這種方法,充分展示了數據的力量。
本質上說,許多科學活動都是數據挖掘,不是從預先設定好的理論或者原理出發,通過演繹來研究問題,而是從數據本身出發通過歸納來總結規律。
近現代以來,隨著我們面臨的問題變得越來越復雜,通過演繹的方式來研究問題常常變得很困難。這就使得數據歸納的方法變得越來越重要,數據的重要性也越發凸顯出來。
大數據是非競爭性資源,有助於政府科學決策、商家精準營銷。
大數據時代,數據的重要作用更加凸顯,許多國家都把大數據提升到國家戰略的高度。
政府合理利用大數據,引導決策的將是基於實證的事實,政府會更有預見性、更加負責、更加開放。
中國古代治國就已經有重數據的思想,如商鞅提出,「強國知十三數……欲強國,不知國十三數,地雖利,民雖眾,國愈弱至削」。
大數據時代,循「數」治國將更加有效。小數據時代,政府做決策更多依憑經驗和局部數據,難免頭痛醫頭、腳痛醫腳。比如,交通堵塞就多修路。
大數據時代,政府做決策能夠從粗放型轉向集約型。路堵了,利用大數據分析,可以得知哪一時間、哪一地段最容易堵,或在這一地段附近多修路,或提前預警引導居民合理安排出行,實現對交通流的最佳配置和控制,改善交通。
對於商家來說,大數據使精準營銷成為可能。
一個有趣的故事,是沃爾瑪超市的「啤酒、尿布」現象。沃爾瑪超市分析銷售數據時發現,顧客消費單上和尿布一起出現次數最多的商品,竟然是啤酒。
跟蹤調查後發現,有不少年輕爸爸會在買尿布時,順便買些啤酒喝。沃爾瑪發現這一規律後,搭配促銷啤酒、尿布,銷量大幅增加。
大數據時代,每個人都會「自發地」提供數據。我們的各種行為,如點擊網頁、使用手機、刷卡消費、觀看電視、坐地鐵出行、駕駛汽車,都會生成數據並被記錄下來,我們的性別、職業、喜好、消費能力等信息,都會被商家從中挖掘出來,以分析商機。
大數據也將使個人受益。
從生物學、醫學上講,以前生物學家只是通過對單個或幾個基因的操控來觀察其對生物體的影響,很難發現整體的關聯。現在由於技術的發展,可以分析很多,如遺傳信息、全體基因的表達量信息、蛋白質族譜信息、全基因組甲基化信息、表觀遺傳信息等。
同時還有個人健康指標、病歷、葯物反應等數據。如果真能達成生物學上多維多向數據的有機融合,就能夠把個人完整地描述出來,從而實現精準醫療的目的。
大數據時代,審核數據的真實性也有了更有效的手段。
大數據的特徵之一是多樣性,不同來源、不同維度的數據之間存在一定的關聯度,可以交叉驗證。例如,某地的工業產值虛報了一倍,但用電量和能耗卻沒有達到相應的規模。這就是數據異常,很容易被系統識別出來。發現異常後,相關部門再進行復核,就能更有針對性地防止、打擊數據造假。
數據是一種資源,但數據又跟煤、石油等物質性資源不一樣。物質性資源不可再生,你用多了,別人就用少了,因而很難共享。
數據可以重復使用、不斷產生新的價值。大數據資源的使用是非惡性競爭的,共享的前提下,更能夠製造雙贏。
從另一個角度來說,數據如果不被融合、聯系在一起,也不能稱之為大數據。
大數據不能被直接拿來使用,統計學依然是數據分析的靈魂
現在社會上有一種流行的說法,認為在大數據時代,「樣本=全體」,人們得到的不是抽樣數據而是全數據,因而只需要簡單地數一數就可以下結論了,復雜的統計學方法可以不再需要了。
首先,大數據告知信息但不解釋信息。
打個比方說,大數據是「原油」而不是「汽油」,不能被直接拿來使用。就像股票市場,即使把所有的數據都公布出來,不懂的人依然不知道數據代表的信息。
大數據時代,統計學依然是數據分析的靈魂。正如加州大學伯克利分校邁克爾•喬丹教授指出的,「沒有系統的數據科學作為指導的大數據研究,就如同不利用工程科學的知識來建造橋梁,很多橋梁可能會坍塌,並帶來嚴重的後果。」
其次,全數據的概念本身很難經得起推敲。全數據,顧名思義就是全部數據。這在某些特定的場合對於某些特定的問題確實可能實現。
比如,要比較清華、北大兩校同學數學能力整體上哪個更強,可以收集到兩校同學高考時的數學成績作為研究的數據對象。
從某種意義上說,這是全數據。但是,並不是說我們有了這個全數據就能很好地回答問題。
一方面,這個數據雖然是全數據,但仍然具有不確定性。
入校時的數學成績並不一定完全代表學生的數學能力。假如讓所有同學重新參加一次高考,幾乎每個同學都會有一個新的成績。分別用這兩組全數據去做分析,結論就可能發生變化。
另一方面,事物在不斷地發展和變化,同學入校時的成績並不能夠代表現在的能力。全體同學的高考成績數據,僅對於那次考試而言是全數據。
「全」是有邊界的,超出了邊界就不再是全知全能了。事物的發展充滿了不確定性,而統計學,既研究如何從數據中把信息和規律提取出來,找出最優化的方案;也研究如何把數據當中的不確定性量化出來。
在大數據時代,數據分析的很多根本性問題和小數據時代並沒有本質區別。當然,大數據的特點,確實對數據分析提出了全新挑戰。
例如,許多傳統統計方法應用到大數據上,巨大計算量和存儲量往往使其難以承受;對結構復雜、來源多樣的數據,如何建立有效的統計學模型也需要新的探索和嘗試。對於新時代的數據科學而言,這些挑戰也同時意味著巨大的機遇,有可能會產生新的思想、方法和技術。
來源:《人民日報》(2015年07月20日12版)清華大學劉軍教授
㈣ 大數據時代是什麼意思的
大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,而這個海量數據的時代則被稱為大數據時代。
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型資料庫用於分析時會花費過多時間和金錢。
大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapRece一樣的框架來向數十、數百或甚至數千的電腦分配工作。
(4)大數據時代的概念擴展閱讀:
大數據時代的影響:
1、不是隨機樣本,而是全體數據:
在大數據時代,人們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(隨機采樣,以前人們通常把這看成是理所應當的限制,但高性能的數字技術讓人們意識到,這其實是一種人為限制)。
2、不是精確性,而是混雜性:
研究數據如此之多,以至於人們不再熱衷於追求精確度;之前需要分析的數據很少,所以人們必須盡可能精確地量化人們的記錄,隨著規模的擴大,對精確度的痴迷將減弱。
擁有了大數據,人們不再需要對一個現象刨根問底,只要掌握了大體的發展方向即可,適當忽略微觀層面上的精確度,會讓人們在宏觀層面擁有更好的洞察力;
3、不是因果關系,而是相關關系:
人們不再熱衷於找因果關系,尋找因果關系是人類長久以來的習慣,在大數據時代,人們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系;相關關系也許不能准確地告訴人們某件事情為何會發生,但是它會提醒人們這件事情正在發生。
參考資料來源:網路-大數據時代
㈤ 什麼是大數據時代
大數據時代是指利用相關演算法對海量數據的處理與分析、存儲,從海量的數據中發現價值,服務於生活與生產。在餐飲、電信、金融、娛樂、體育等領域都能夠感受到大數據對各行各業帶來的影響。
所謂的大數據時代,從字面意義上就不難理解,數據非常大,信息量比較龐大,這也是互聯網迅速發展所帶來的改變。僅從通訊上面我們就能夠看出來,以前的2G、3G就能夠滿足人們使用,到後來的4G,網路的發展,人們能夠通過互聯網獲取的信息越來越多,現在又開始推出5G,大數據的時代,畢竟容納和接受更多的信息。
㈥ 什麼是大數據時代
「大數據」時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:「數據,已經滲透到當回今每一個行業和答業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。」 「大數據」在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。
㈦ 什麼是大數據時代
(1)大數據時代的提出
最早提出大數據時代到來的是全球知名咨詢公司麥肯錫,他認為數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。
(2)大數據時代的來臨
隨著互聯網快速發展、智能手機以及「可佩帶」計算設備的出現,我們的行為、位置,甚至身體生理數據等每一點變化都成為了可被記錄和分析的數據。這些新技術推動著大數據時代的來臨,各行各業每天都在產生數量巨大的數據碎片,數據計量單位已從Byte、KB、MB、GB、TB發展到PB、EB、ZB、YB甚至BB來衡量。
(3)大數據時代的特點
如果簡單來理解什麼是大數據,我們只要抓住大數據的四個特點,大量、高速、多樣、價值。具體來講就是數據體量巨大,數據的爆發性增長迫切的需要智能的演算法、強大的數據處理平台和新的數據處理技術,來統計、分析、預測和實時處理如此大規模的數據;數據類型繁多,廣泛的數據來源決定了大數據形式的多樣性。任何形式的數據都可以產生作用,目前應用最廣泛的就是推薦系統的應用;價值密度低,現實世界所產生的數據中,有價值的數據所佔比例很小。相比於傳統的小數據,大數據最大的價值在於通過從大量不相關的各種類型的數據中,挖掘出對未來趨勢與模式預測分析有價值的數據;數據分析處理速度快,主要通過互聯網傳輸。大數據對處理速度有非常嚴格的要求,伺服器中大量的資源都用於處理和計算數據,很多平台都需要做到實時分析。
㈧ 大數據時代是什麼意思 大數據時代意思簡述
1、大數據時代是指利用相關演算法對海量數據的處理與分析、存儲,從海量的數據中發現價值,服務於生活與生產。在餐飲、電信、金融、娛樂、體育等領域都能夠感受到大數據對各行各業帶來的影響。
2、最早提出「大數據」時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:「數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。」