⑴ 什麼是「PB級別的數據」
pb指petabyte,它是較高級的存儲單位,其上還有EB,ZB,YB等單位,1PB=1024TB。
未來學家Raymond Kurzweil在他的論文中關於對PB級數據定義解釋說:人類功能記憶的容量預計在1.25個TB,這意味著,800個人類記憶才相當於1個PB。
⑵ 什麼是PB級別的數據
「TB是一個計算機存儲容量的單位,它等於2的40次方,或者接近一萬億個位元組(即,一千千兆位元組)。」
一提到數據量級,人們通常會聯想到美國國會圖書館(見圖)。德勤、麥肯錫、IBM、Gartner和移動廣告公司Adfonic的數據專家向TechTarget記者介紹了PB級數據究竟有多大。
麥肯錫首席分析師Michael Chui指出,美國國會圖書館「在2011年4月前已經收集了235TB的數據,而一個PB相當於它的4倍。」
TechTarget自己的網路網站Whatis有關於PB大小的定義:「PB是數據存儲容量的單位,它等於2的50次方個位元組,或者在數值上大約等於1000個TB。」
未來學家Raymond Kurzweil他的論文中對PB的定義進行延伸:人類功能記憶的容量預計在1.25個TB。這意味著,800個人類記憶才相當於1個PB。
如果這樣還不夠清楚,那麼Adfonic的CTO Wes Biggs給出了下面更直接的計算:
假設手機播放MP3的編碼速度為平均每分鍾1MB,而1首歌曲的平均時長為4分鍾,那麼1PB歌曲可以連續播放2000年。
如果智能手機相機拍攝相片的平均大小為3MB,列印照片的平均大小為8.5英寸,那麼總共1PB的照片的並排排列長度就達到48000英里——大約可以環繞地球2周。
1PB足夠存儲整個美國人口的DNA,而且還能再克隆2倍。
DVD、戰列艦和六國賽
從比特(bit)和位元組(byte)開始,德勤的分析師還將他們的思考向以下方面進一步延伸。(1個比特是1個二進制位,可能是0或1;1個位元組長8個二進制):
如果以每秒1個位的速度數一下1PB所包含的位數,那麼您需要2.85億年才能數完。
如果每秒數1個位元組,那麼您需要數357萬年。
保存1PB數據需要用掉22.3萬張DVD。
保存1PB數據,需要用掉7.46億張3.5英寸軟盤;這7.46億軟盤重13422噸。這個重量僅僅比2艘Type 45驅逐艦輕一些。
人類身體細胞數據各不相同,但是數量最多的接近100萬億個,如果用1個位來表示1個細胞,那麼1PB足夠記錄90個人的身體細胞,相當於橄欖球六國賽的全部球員。
谷歌、社交媒體和宇宙大爆炸
谷歌在2004年率先進軍數字地圖領域,並在2005年發布了谷歌地圖和谷歌地球。現在,谷歌為用戶提供了超過20PB(215億MB)的地圖影像——包括衛星圖片、航拍照片和360度街景圖片。
即使在2008年,谷歌每天處理的數據已經達到20 PB,一年就是7300 PB。
從那時起,社交媒體網站就開始生成PB級數據,它們逐漸成為所謂的「大數據」。
根據2012年2月1日Facebook向美國證券交易委員會提交的IPO文檔記錄,Facebook在1年前已經存儲了100 PB數據。
在Twitter網站上,每分鍾就有34000條微博出現。IBM非常關注於一個天文項目:「由於20個國家共同出資總計15億歐元建設的平方公里陣列(Square Kilometer Array, SKA)是一個無線電天文望遠鏡,它可以觀測宇宙大爆炸的衰弱信號。」
SKA(計劃在2024年完成)估計整個宇宙每天將生成1376 PB數據,相當於每天傳輸的全球互聯網流量的兩倍。
⑶ 大數據是什麼多大的數據叫大數據
多大的數據才算「大數據」
什麼是大數據有一個故事,說的是一位顧客訂購披薩時,披薩店可以立即調出這位顧客的許多信息,比如送披薩上門必有的家庭、單位等地址和電話,顧客的消費習慣從而推薦適合他的披薩種類,顧客名下的銀行卡透支情況從而確定他的支付方式,甚至顧客要自取披薩時,還能根據顧客名下車輛的停放位置預估他的到店時間等等。
從這個故事,我們可以看出大數據的一些關鍵特徵,比如容量大、類型多、關聯性強、有價值等等。「大數據是以高容量、多樣性、存取速度快、應用價值高為主要特徵的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行採集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。」工信部信息化和軟體服務業司副司長李冠宇接受經濟日報·中國經濟網記者采訪時說。
⑷ tb級資料庫是什麼意思
tb級資料庫是指資料庫整體容量的大小是以T為單位的,比如1.5T ,1T=1024G
⑸ 大數據中所說的數據量大是指到達甚麼級別
早在2001年,行業分析師Doug Laney已經將大數據定義為3個「V」,也就是規模(Volume),快速(Velocity)和多樣(專Variety)。屬
規模(Volume)
通過許多年來基於交易的存儲,越來越多的感測器和機器的數據被收集,諸多因素導致數據量增加。在過去,過多的數據量存儲是一個問題,但是隨著存儲成本的降
低,大數據存儲得以成功解決。然而現在,其他問題又逐漸出現了,包括怎樣從大量的數據中確定其相關性,怎樣從相關數據中分析並創造價值等。
快速(Velocity)
大數據以前所未有的速度傳輸,必須及時處理。射頻識別標簽、感測器和智能計量正在推動著瞬間處理海量數據的需求。而對於大多數公司組織來說,實現對數據的快速處理,還是一個挑戰。
多樣(Variety)
今天,所有這些格式類型的數據,包括文本文檔、電子郵件、視頻、音頻、股票數據和金融交易等,其管理、合並以及不同類型數據資源間的整合,對許多公司組織來說也是一個需要應對的問題。