⑴ 什么是“PB级别的数据”
pb指petabyte,它是较高级的存储单位,其上还有EB,ZB,YB等单位,1PB=1024TB。
未来学家Raymond Kurzweil在他的论文中关于对PB级数据定义解释说:人类功能记忆的容量预计在1.25个TB,这意味着,800个人类记忆才相当于1个PB。
⑵ 什么是PB级别的数据
“TB是一个计算机存储容量的单位,它等于2的40次方,或者接近一万亿个字节(即,一千千兆字节)。”
一提到数据量级,人们通常会联想到美国国会图书馆(见图)。德勤、麦肯锡、IBM、Gartner和移动广告公司Adfonic的数据专家向TechTarget记者介绍了PB级数据究竟有多大。
麦肯锡首席分析师Michael Chui指出,美国国会图书馆“在2011年4月前已经收集了235TB的数据,而一个PB相当于它的4倍。”
TechTarget自己的网络网站Whatis有关于PB大小的定义:“PB是数据存储容量的单位,它等于2的50次方个字节,或者在数值上大约等于1000个TB。”
未来学家Raymond Kurzweil他的论文中对PB的定义进行延伸:人类功能记忆的容量预计在1.25个TB。这意味着,800个人类记忆才相当于1个PB。
如果这样还不够清楚,那么Adfonic的CTO Wes Biggs给出了下面更直接的计算:
假设手机播放MP3的编码速度为平均每分钟1MB,而1首歌曲的平均时长为4分钟,那么1PB歌曲可以连续播放2000年。
如果智能手机相机拍摄相片的平均大小为3MB,打印照片的平均大小为8.5英寸,那么总共1PB的照片的并排排列长度就达到48000英里——大约可以环绕地球2周。
1PB足够存储整个美国人口的DNA,而且还能再克隆2倍。
DVD、战列舰和六国赛
从比特(bit)和字节(byte)开始,德勤的分析师还将他们的思考向以下方面进一步延伸。(1个比特是1个二进制位,可能是0或1;1个字节长8个二进制):
如果以每秒1个位的速度数一下1PB所包含的位数,那么您需要2.85亿年才能数完。
如果每秒数1个字节,那么您需要数357万年。
保存1PB数据需要用掉22.3万张DVD。
保存1PB数据,需要用掉7.46亿张3.5英寸软盘;这7.46亿软盘重13422吨。这个重量仅仅比2艘Type 45驱逐舰轻一些。
人类身体细胞数据各不相同,但是数量最多的接近100万亿个,如果用1个位来表示1个细胞,那么1PB足够记录90个人的身体细胞,相当于橄榄球六国赛的全部球员。
谷歌、社交媒体和宇宙大爆炸
谷歌在2004年率先进军数字地图领域,并在2005年发布了谷歌地图和谷歌地球。现在,谷歌为用户提供了超过20PB(215亿MB)的地图影像——包括卫星图片、航拍照片和360度街景图片。
即使在2008年,谷歌每天处理的数据已经达到20 PB,一年就是7300 PB。
从那时起,社交媒体网站就开始生成PB级数据,它们逐渐成为所谓的“大数据”。
根据2012年2月1日Facebook向美国证券交易委员会提交的IPO文档记录,Facebook在1年前已经存储了100 PB数据。
在Twitter网站上,每分钟就有34000条微博出现。IBM非常关注于一个天文项目:“由于20个国家共同出资总计15亿欧元建设的平方公里阵列(Square Kilometer Array, SKA)是一个无线电天文望远镜,它可以观测宇宙大爆炸的衰弱信号。”
SKA(计划在2024年完成)估计整个宇宙每天将生成1376 PB数据,相当于每天传输的全球互联网流量的两倍。
⑶ 大数据是什么多大的数据叫大数据
多大的数据才算“大数据”
什么是大数据有一个故事,说的是一位顾客订购披萨时,披萨店可以立即调出这位顾客的许多信息,比如送披萨上门必有的家庭、单位等地址和电话,顾客的消费习惯从而推荐适合他的披萨种类,顾客名下的银行卡透支情况从而确定他的支付方式,甚至顾客要自取披萨时,还能根据顾客名下车辆的停放位置预估他的到店时间等等。
从这个故事,我们可以看出大数据的一些关键特征,比如容量大、类型多、关联性强、有价值等等。“大数据是以高容量、多样性、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。”工信部信息化和软件服务业司副司长李冠宇接受经济日报·中国经济网记者采访时说。
⑷ tb级数据库是什么意思
tb级数据库是指数据库整体容量的大小是以T为单位的,比如1.5T ,1T=1024G
⑸ 大数据中所说的数据量大是指到达甚么级别
早在2001年,行业分析师Doug Laney已经将大数据定义为3个“V”,也就是规模(Volume),快速(Velocity)和多样(专Variety)。属
规模(Volume)
通过许多年来基于交易的存储,越来越多的传感器和机器的数据被收集,诸多因素导致数据量增加。在过去,过多的数据量存储是一个问题,但是随着存储成本的降
低,大数据存储得以成功解决。然而现在,其他问题又逐渐出现了,包括怎样从大量的数据中确定其相关性,怎样从相关数据中分析并创造价值等。
快速(Velocity)
大数据以前所未有的速度传输,必须及时处理。射频识别标签、传感器和智能计量正在推动着瞬间处理海量数据的需求。而对于大多数公司组织来说,实现对数据的快速处理,还是一个挑战。
多样(Variety)
今天,所有这些格式类型的数据,包括文本文档、电子邮件、视频、音频、股票数据和金融交易等,其管理、合并以及不同类型数据资源间的整合,对许多公司组织来说也是一个需要应对的问题。