A. 《大数据》阅读答案
所谓‘大数据’,是指数据规模巨大,大到难以用我们传统信息处理技术合理撷取、管理、处理、整理”“在‘大数据’时代,我们的知识生产若再固守印刷时代的知识生产理念,沿袭此前的知识生产方式,就会被远远地甩在时代后面。我在这里整理了《大数据》阅读答案,希望能帮助到那您。
大数据
近年来,“大数据”这个概念突然火爆起来,成为业界人士舌尖上滚烫的话题。所谓“大数据”,是指数据规模巨大,大到难以用我们传统信息处理技术合理撷取、管理、处理、整理。“大数据”概念是“信息”概念的3.0版,主要是对新媒体语境下信息爆炸情境的生动描述。
我们一直有这样的成见:信息是个好东西。对于人类社会而言,信息应该多多益善。这种想法是信息稀缺时代的产物。由于我们曾吃尽信息贫困和蒙昧的苦头,于是就拼命追逐信息、占有信息。我们甚至还固执地认为,占有的信息越多,就越好,越有力量。但是,在“大数据’时代,信息不再稀缺,这种成见就会受到冲击。信息的失速繁衍造成信息的严重过剩。当超载的信息逼近人们所能承受的极限值时,就会成为一种负担,我们会不堪重负。
信息的超速繁殖源自于信息技术的升级换代。以互联网为代表的新媒体技术打开了信息所罗门的瓶子,数字化的信息失速狂奔,使人类主宰信息的能力远远落在后面。美国互联网数据中心指出,互联网上的数据每两年翻一番,目前世界上的90%以上数据是近几年才产生的。2000年,数字存储信息占全球数据量的四分之一,另外四分之三的信息都存储在报纸、胶片、黑胶唱片和盒式磁带这类媒介上。2007年,只有7%是存储在报纸、书籍、图片等媒介上的模拟数据,其余都是数字数据。到2013年,世界上存储的数据中,数字数据超过98%。面对数字数据的大量扩容,我们只能望洋兴叹。
“大数据”时代对人类社会的影响是全方位的。这种影响究竟有多大,我们现在还无法预料。哈佛大学定量社会学研究所主任盖瑞·金则以“一场革命”来形容大数据技术给学术、商业和政府管理等带来的变化,认为“大数据”时代会引爆一场“哥白尼式革命”:它改变的不仅仅是信息生产力,更是信息生产关系;不仅是知识生产和传播的内容,更是其生产与传播方式。
我们此前的知识生产是印刷时代的产物。它是15世纪古登堡时代的延续。印刷革命引爆了人类社会知识生产与传播的“哥白尼式革命”,它使得知识的生产和传播突破了精英、贵族的垄断,开启了知识传播的大众时代,同时,也确立了“机械复制时代”的知识生产与传播方式。与印刷时代相比,互联网新媒体开启的“大数据”时代,则是一场更为深广的革命。在“大数据”时代,信息的生产与传播往往是呈几何级数式增长、病毒式传播。以互联网为代表的媒介技术颠覆了印刷时代的知识生产与传播方式。新媒体遍地开花,打破了传统知识主体对知识生产与传播的垄断。新媒体技术改写了静态、单向、线性的知识生产格局,改变了自上而下的知识传播模式,将知识的生产与传播抛入空前的不确定之中。在“大数据”时代,我们的知识生产若再固守印刷时代的知识生产理念,沿袭此前的知识生产方式,就会被远远地甩在时代后面。
(节选自2013.2.22《文汇读书周报》,有删改)
《大数据》阅读题目:
9.下列对“大数据时代”的特点解说正确的一项是
A.数据规模巨大,信息严重过剩,总量已超过了人们的承受极限值而成为社会的负担。B.信息生产呈几何级数式增长、病毒式传播,信息传播方式不再是自上而下,而是相反。
C.精英与贵族的知识垄断被冲破,传统知识主体不再是唯一的知识生产者和传播者。 D.“机械复制时代”知识生产和传播方式被颠覆,呈动态、多向和空前的不确定性。 10.下列理解,不符合原文意思的一项是
A.人们在信息稀缺时代形成的占有信息越多越好、越有力量的认识,将随着“大数据”时代的到来而改变。
B.人类主宰信息的能力远远落后于信息的产生,是因为信息技术的升级换代带来的数字化信息的失速狂奔。
C.从2000年数字存储信息占全球数据量的四分之一,到2013年超过98%,说明了传统媒体被新媒体取代。
D.印刷革命开启了知识传播的大众时代, 与印刷时代相比,互联网新媒体开启的“大数据”时代,则是一场更为深广的革命。
《大数据》参考答案:
9.D【试题分析:论述类文体阅读的命题主要从概念、判断、推理三个角度命题,概念注意“答非所问”“内涵、外延不准”“误划类别”“张冠李戴”;判断类注意“范围不当”“偷换概念”“曲解文意”;推理注意“强加因果”“强行推理”等错误。答题的关键是审清题干、找准区位、对读原文、寻找细微的差别。选项A原文“信息的失速繁衍造成信息的严重过剩。当超载的信息逼近人们所能承受的极限值时,就会成为一种负担,我们会不堪重负”现在是“大数据”时代,但还没有到“当超载的信息逼近人们所能承受的极限值时”,时间范围混淆;选项B 原文“新媒体技术改写了静态、单向、线性的知识生产格局,改变了自上而下的知识传播模式,将知识的生产与传播抛入空前的不确定之中”选项“信息传播方式不再是自上而下,而是相反”,偷换了文中的概念“抛入空前的不确定之中”为“自下而上”;选项C对应的原文“印刷革命引爆了人类社会知识生产与传播的‘哥白尼式革命’,它使得知识的生产和传播突破了精英、贵族的垄断”让“知识的生产和传播突破了精英、贵族的垄断”是“印刷革命”,选项是“大数据时代”,犯了张冠李戴的错误。】
10.C【试题分析:选项“说明了传统媒体正被新媒体取代”,文中没有依据,属于无中生有。】
B. 《大数据时代》的读后感
认真品味一部名著后,你有什么领悟呢?现在就让我们写一篇走心的读后感吧。那么如何写读后感才能更有感染力呢?以下是我帮大家整理的《大数据时代》优秀读后感范文,希望能够帮助到大家。
这书读起来不费劲,没有太多晦涩的理论,所以也比较快速的用了几天的中午休息时间读完了。
网上到处都是推荐此书的文章,赞为大数据的经典之作。可是,我读了一遍下来,却没有这种经典之感,只是必须叹服作者思维严密、涉猎广泛,书中有关大数据的例子真是不少,会给我们的阅读带来一定的舒适感和现实感。
已经看过太多网上的关于大数据的文章、案例分析,但是我认为大数据仅仅是一种手段,是我们分析认识世界的诸多手段中的一种。我们既不要拒绝排斥大数据的应用,但也没必要神话大数据。
在读此书过程中,稍带也看了几部关乎大数据分析的影片,有本书中提到的《少数派报告》,还有《永无止境》、《源代码》。少数派报告中,人类借助先知的超能力获取对犯罪的预测和提前打击,但是书中和影片中都提到的有一个悖论的问题:如果你预测某犯罪要发生,所以去提前抓捕,阻止了案件的发生,但案件没有发生,又以什么为依据来抓捕嫌疑人呢?!所以,我认为大数据的应用在预测方面的作用,不应该涉及任何行政司法等严肃方向。因为,人是善变的,也许在预测之后的时间里,由于其它因素影响,t她的决定就突然改变,预测就彻底无效了。大数据,更应该在提供思路、途径方向,在我们还没有发现其原理之前,先依照大数据的分析去做些突破常规、有创造性的事情。
从古至今,对数据的统计应用一直没有中断过,我们人类在发挥聪明才智的过程中,创造了文字记录历史,通过积累和总结为人类的文明发展做出了极大的贡献。只不过,现在我们利用计算机系统对日益暴涨的数据信息能够处理的数据量更大、想法更多了。在这个角度上,大数据其实不过是人类信息化发展历史中的一个必然过程。
大数据爆发的背景,是计算机普及应用、工作和生活信息化、网络尤其是互联网的发达等因素,为之提供了能够使用的超大规模数据化信息。就如计算机与人下棋的程序一样,掌握了足够的棋局数据、能够推算每一步之后的可能,快速的运算能力是实现这些的基础。
大数据本身是无意识的,或者叫无目的,是因为使用的人的发现或主观意识,才从中抓取到符合所想或支持所想的一些数据和比例。人才是核心。别以为有个所谓的大数据中心就能够挥斥方遒、指点江山了。这也是我说要对大数据去神化的一点。书中所举例子,成功的案例其实都基本是一个打破常规、奇思异想的人或一个具备创新思维的团队,而这个人或团队一旦陷入对现有模式的僵化应用或崇拜,失败的结果也是必然。我想说的是,无论是大数据还是快数据什么的玩意,都仅仅是我们了解世界了解社会的一个角度一种手段,都始终无法摆脱依赖于人的思考这个根本。别一叶障目不见泰山的意味有了大数据就拥有了整个世界,你的心有多大,舞台才有多大。只有当你的思考抵达,那些个曾经没有价值的数据垃圾,才会焕发出价值!不要荒废了你的思考这个核心!
作者说大数据只讲结果不讲原因。这个状态我认为仅仅是一个过渡时期的表现,如果要实现对大数据分析应用的更加精准、甚至可以作为某种依据,必然要获得对大数据分析的果的可靠解释,也从而能对我们现有的行为、制度等获得新的认识,来进行可行的改变、升级或者重造,大数据的指导意义才发挥更深。
人们都说,中外著述的差距有时是很大的,中国的作家习惯铺垫和描绘,将简单的事情复杂化;国外的就相反,喜欢直捣要害,将复杂的事情抽象简单化。不知道是不是我不很适应国外这类书籍的缘故,对大数据时代一书,我没有感受到很多的震撼和脑洞大开感,也许和现在各类大数据的文章太多有关,已经把此书的观点各自领用发挥了一番,也许是我还没有领会到精华所在。既然人们都奉为经典,那我想或许我应该隔一段时间、换个姿势,再重读此书,看看是不是会有新的感受吧。
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据。
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。
三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?
我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。
在风险社会中信息安全问题日趋凸显。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考的答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考的答案。此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,平均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道2009年出现的H1N1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的.数据资源,可见大数据时代对公共卫生也产生了重大的影响!在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
现在已经进入到了二十一世纪了,当今社会已经摆脱了上个世纪的那种消息滞后的时代了,我们最应该感谢的就是科学的进步为我们带来了这么多便利。与此同时,科学的进步还为我们带来了“大数据”这个让人类减少了很多工作量的东西。
在这个学期的名著导读课上我们就被要求读:《大数据时代》这本书。《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据时代的预言家”,他是一个特别厉害的人,他作为一个教师,他曾经在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多所世界前列名校任教的经历。他作为一个科学家,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。他是十余年潜心研究数据科学的技术权威。他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
他作为一个研究学者,他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;"大数据"在网络上搜索到的解释是:称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。特点:数量、速度、品种、真实性。而舍恩伯格认为,大数据并不能定义一个确切的概念。他提到"大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府和公民关系的方法。"这是一种更具有人文色彩和社会意义的诠释。
大数据不仅改变了公共卫生领域,整个商业领域都因为大数据而重新洗牌。购买飞机票就是一个很好的例子。就像书中写到2003年,奥伦·埃齐奥尼准备乘坐从西雅图到洛杉矶的飞机去参加弟弟的婚礼。他知道飞机票越早预订越便宜,于是他在这个大喜日子来临之前的几个月,就在网上预订了一张去洛杉矶的机票。在飞机上,埃齐奥尼好奇地问邻座的乘客花了多少钱购买机票。当得知虽然那个人的机票比他买得更晚,但是票价却比他便宜得多时,他感到非常气愤。于是,他又询问了另外几个乘客,结果发现大家买的票居然都比他的便宜。
飞机着陆之后,埃齐奥尼下定决心要帮助人们开发一个系统,用来推测当前网页上的机票价格是否合理。作为一种商品,同一架飞机上每个座位的价格本来不应该有差别。但实际上,价格却千差万别,其中缘由只有航空公司自己清楚。
埃齐奥尼表示,他不需要去解开机票价格差异的奥秘。他要做的仅仅是预测当前的机票价格在未来一段时间内会上涨还是下降。这个想法是可行的,但操作起来并不是那么简单。这个系统需要分析所有特定航线机票的销售价格并确定票价与提前购买天数的关系。
在信息时代,信息安全问题的日趋凸显,数据独裁与隐私保护之间的矛盾更是立于风口浪尖,成为众矢之的,舍恩伯格在本书的最后章节曾试图寻找一种解决方式来摆脱这一种困境,但最终没能做到,但是他提出"大数据并不是一个充斥着算法的和机器的冰冷世界,人类的作用仍无法被完全代替。"这里表明人在数据时代同样的重要,数据是为人类服务的,也就该人类驱使下完成相应的目的。在这样的大环境下,常引起我更多的思考和担忧。
大数据时代对于我们同是机遇与挑战,一些国家已开始步入大数据时代的行列,并在各个领域开始研究和使用。而对于我国庞大的人口,以及较大的领土面积,都可以在大数据时代为我们提供数据的保障,而能否面临挑战,在大国之间的新一轮角色角逐间崭露头角,我们更需要解决技术等方面的问题,更应在政策上逐步开放各领域的数据,保证数据来源、权限等问题得到解决,不断学习先进的计算机技术,缩小与其他国家的差距。
C. 大数据具有哪些特征.答案
大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。
(3)大数据时代的小数据阅读答案扩展阅读:
一、具体特征
容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息。
种类(Variety):数据类型的多样性。
速度(Velocity):指获得数据的速度。
可变性(Variability):妨碍了处理和有效地管理数据的过程。
真实性(Veracity):数据的质量。
复杂性(Complexity):数据量巨大,来源多渠道。
价值(value):合理运用大数据,以低成本创造高价值。
二、运用
洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。
google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。
统计学家内特.西尔弗(Nate Silver)利用大数据预测2012美国选举结果。
麻省理工学院利用手机定位数据和交通数据建立城市规划。
梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。
医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。
D. 读书笔记:大数据时代
随着网络的普及、计算机运算和存储能力的提高,我们获取信息越来越容易,越来越多。绝大多数信息对我们来说可能都是噪音,或者用过一次后就被丢弃;而对有大数据思维的公司或个人来说,这些则是零散的金粉,他们可以从中挖掘出许多小数据无法得到的意想不到的结果。比如人们所用的搜索词在搜索完成之时就失去用处,Google偏偏将它们重新利用,用以改善结果的排序,用来预测流感感染情况。word语法检查,小数据下表现最好的算法在大数据下准确率却最差。谁曾想坐姿可以转化成数据,并开发成汽车防盗系统?进而扩展到盗贼识别?
大数据时代真的只有想不到,没有做不到。它深刻的变革着我们的工作、生活、甚至思维方式。
1.不是样本而是全部:得到全部数据并不那么难,而且结果更全面可靠,我们不再依赖小数据时代的随机取样、假设-实验-结论模式,取而代之的是直接对全部数据进行分析挖掘;
2.不是精确性而是混杂性:大数据时代我们不再执着于精确,而是允许一点瑕疵。我们要做的不是以高昂的代价消除所有的不确定性,而是接受这些纷繁的数据并从中获益。以谷歌翻译为例,它搜罗了所有可以利用的数据,虽然搜集的有错误翻译,但巨大的语料库优势完全压倒了缺点,使其好于布朗、微软的班科和布里尔、IBM的Candide。又如word语法检查,小数据下表现最好的算法在大数据下准确率却最差。混杂的大数据能创造比精确的小数据更好的结果!
小数据模式下,小的错误会导致极大的偏差,因此要求精确。值得注意的是,大数据的混杂性只是现实,而不是其固有特性,随着技术的发展将会被改善。
3.不是因果关系而是相互关系:千百年来,我们一直在寻找事件背后的原因。事实上,如果凡事皆有因果的话,我们就没有决定任何事的自由了。
基于大数据分析事物间的相互关系,使我们从因果串联思维变为相互并联思维。相互关系能提醒我们某些事正在发生,这些提醒非常有用。基于相关关系的预测是大数据的核心。通过找出一个关联物并监控它,我们就能预测未来。如塔吉特怀孕预测,美国折扣零售商塔吉特通过对女性消费记录分析,可以发现她是否怀孕,从而在相应阶段寄送相应的折扣券。
戏中主角分别是大数据拥有者、大数据技术公司、大数据思维的公司或个人。第一个吃螃蟹的人早已斩获良多,更多的人也开始去尝试;随着技术的发展,拥有大数据技术的公司的领先优势也越来越弱;而数据本身的价值则与日俱增。试想,一个拥有思维和技术的新公司,如何去跟一个拥有海量数据且知道什么更好的公司去竞争?
随着行业发展,数据中间商也将粉墨登场。因为有些数据的价值只能通过中间人来挖掘。航空公司不到最后一刻不会发布航班晚点,也不会告诉你何时买票最便宜,但只要有数据,你就能知道这些。还有一些公司愿意把数据给非营利机构。
大数据确实给我们带来诸多便利,使我们的生活更便利、更美好。但我们也变得越来越透明,通过你的检索词、购物、评论等就能轻易定位到精确的个人!想想就让人不寒而栗!
亚马逊监视着我们的购物习惯
谷歌监视着我们的网页浏览习惯
微博窃听到了我们心中的TA
而facebook似乎什么都知道,包括我们的社交关系网
我们时刻暴露在第三只眼下(政府除外)。
鉴于此,维克托也建议完善相关司法,制定更完整的隐私保护政策、反垄断。
值得注意的是,大数据给我们提供的不是最终答案,而是参考答案,我们不要过分信任、依赖数据给出的结果。假如一切都可以被预测,而且很精确,而我们想当然的去相信,放弃选择的权利,也会不为结果承担责任,那我们离变成机器人就不远了,人工智能控制人类也并非臆想!
而乐观的人们则会认为一个更美好的未来在像我们招手:
以下为收集内容 。
http://www.ximalaya.com/1000577/sound/412418?from_platform=weixin
【构建一个机器的你】模拟你的知识体系、行为习惯:通过拟合你在社交网络的发言、及其它信息。模拟声音:整合微信里的语音。模拟外貌:通过你发的照片等。将这些东西“导入”到一个机器,你在另一个地方被重生。它知道你所有的所有,宛如镜像孪生。
可以看电影黑镜2。
汽车若能交流 车祸或可避免
http://v.youku.com/v_show/id_XNTcyODU4NjQw.html
实现汽车对话以避免车祸,实际也是大数据的利用:通过数据化位置速度(通过摄像头传感器电脑系统)等信息,然后分析并做出预测。信息与机器结合会使人分为自然人、半自然人、机器人吧。现在的美瞳等改变人的外形,以及研究火热的脑机接口以实现通过意念控制机械,人正在与机器越来越多的整合在一起。
谷歌无人驾驶汽车
http://mp.weixin.qq.com/s?__biz=MjM5NzM5ODU2MA==&mid=200295774&idx=4&sn=&scene=1#rd
什么时候无人驾驶汽车成片的出现在杭州就好了[偷笑][偷笑]或者不用成片,就是有些地方会放着(比如某个山洞某个工厂),嗯,某些方式(某个app,某个电话或者直接与微信集合,或者快的打车,打的车都变成无人驾驶车)可以把他叫过来,然后用完之后他自己回到原来的地方。[傲慢][傲慢]这样社会多美好呀!还可以叫个车,让他把东西/人送到某个地方,就不是为自己叫车而是为他人叫……
如果视野更开阔点, 数据或许是实现人与机器交流的语言 ,,数据能挖掘我们不知道的一面,但也不要全迷信数据,将活生生的、复杂的人等同于毫无生命的一堆数据或机器就不好玩了。。
量化自我,一场二十年前无法想象的运动
http://www.36kr.com/p/204479.html#wechat_redirect
E. 《大数据时代》:别把参考答案当做最终答案
因为周边总是充斥着“大数据”、“云计算”的字眼,望着说着术语的人们眼里野心勃勃的光芒,我不禁有些急躁的想弄明白什么是大数据,到底我们可以从大数据里挖掘到什么样的财富。不得不说,我选了一本好书,全篇脉络分明,逻辑缜密,穿插着数量繁复的案例,让人在兴致盎然之际就能通俗理解。
第一部分 大数据时代的思维变革
大数据时代的来临,最先要颠覆的是我们的思维模式:1、不是随机样本,而是全体数据;2、不是精确性,而是混杂性;3、不是因果关系,而是相关关系。
坦率的说,这个部分给我的感悟很深,相信很多工作涉及到做数据报告的人,都会从中获益不少。浅显的说,大数据时代是让我们把思维聚焦引向发散的变革。传统意义上,甚至人们日常生活的惯性里,都本能的需求一种因果关系。例如发生了一件事情,人们会立刻寻找一个简单的原因去说服自己。也就是“因为……所以……”这种逻辑思维是根深蒂固的。
在大数据时代,在拥有几乎完整的数据时,我们不再刻意追求数据中彼此之间的目的性,从相关性出发,我们无法说清楚为什么,但我们总知道就是这样。相关性的概念将会引申更多的创意思维,相信未来的工种也会因此更加细分,甚至会出现更多的新兴行业。
第二部分 大数据时代的商业变革
这是每个人都深有体会的:1、一切皆可量化;2、取之不尽,用之不竭的数据创新;3、数据、技术与思维的三足鼎立。
全书最核心或者说我本人最想了解的答案就在这里了。搜索引擎,导航工具,微博,微信记录着我们一切的行为记录,我们的情绪起伏都能被量化。这对商界是笔巨大的财富,他们可以根据这些数据定制独一无二的消费计划,也可以从中的相关关系中避免许多不必要的损失。
于是数据时代的价值链诞生:
1、基于数据本身的公司。 这类公司拥有大量的数据或者可以收集到大量数据。他们以出售数据盈利。当然大数据时代的后期,他们也开始逐渐转型,收购分析团队,将数据更大限度的价值化,以获取更高的盈利。
2、基于技能的公司。 咨询公司就是此类公司的典型代表,天睿,尼尔森这些都是数据分析的佼佼者,甚至四大现在也在积极开拓咨询业务。
3、基于思维的公司。 创新思维应该属于大数据时代最宝贵的财富。FlightCaster、Facebook、滴滴等等这些都是创新思维的典范。
我们要想从大数据时代挖掘金矿也可以顺着这条价值链下手。本人更倾向于第三种思维的风暴。有趣的是,这类公司的发起人甚至这些被我们趋之若鹜的应用都是创始人无聊逗乐的作品。显然,热爱生活,为生活提供更多便利和快乐,仿佛都是创新思维创造需求所必须的。
第三部分 大数据时代的管理变革
风险: 除开我们平常喜欢网购,消费习惯被搜索引擎记录在外,导航系统记录着我们的行动轨迹,甚至是我们的心情,通过微信朋友圈和微博,也都一一被监控中。我们仿佛生活在一双看不见的眼睛里,想想都觉得不寒而栗。
更可怕的是,当人们过于依赖大数据去做决策的时候,我们的社会终将有一天会演变为预测行为更替事实行为的悲剧。最简单的例子:警察可能从大数据监控的一系列行为中分析得到结论某人会谋杀他的妻子,而这个人也许什么都没做,而警察却名正言顺的将此人逮捕。因为大数据预测分析他一定会做,而警察的行为只是阻止了的悲剧的发生。完全磨灭了他可能真的不会犯罪的可能性。
掌控: 让数据的使用者承担责任,是相对保护个人隐私的有效方式。避免了个人信息数据被过度曝光,又给与了数据分析者极大的开发使用空间。另外大数据时代更要避免数据独裁时代。谷歌曾要求员工测试41种蓝色的阴影效果中,哪种被人们使用最频繁,从而决定网页工具栏的颜色。这种数据独裁曾在谷歌一度到达顶峰,同时也激起了强烈反抗。
数据的盲目崇拜总让人会遗忘数据总有固有的局限性,数据导向的答案是参考答案不是最终答案。不为数据而数据,才是大数据时代最好的态度,才能将大数据的功能最大化。
F. 大数据时代读后感
《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。以下是这本书的读后感范文,欢迎阅读!
大数据时代读后感(一)
我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。这个命题是我读这本书最大的感触。个人认为也是这本书最核心的思想。从头说起吧,首先,书提出一个颠覆我以前认知的命题--”并非原子而是信息才是一切的本源“,将世界看做信息,看做可以理解的数据的海洋,为我们提供了一个从未有过的审视下是的视角。它是一种可以渗透到所有生活领域的世界观。这个命题是在书的最后一部分中的某一段中描写的。我之所以把它放在最前面来讲,因为我觉得,这是谈数据化世界的前提,自然也是谈论大数据的前提啦。书的中间部分有一节讲到数据化和数字化的区别。经过我自己脑子的整理,把数据化世界这个命题列为大数据思维的第二步。写到这里,我不由得反省下,我是不是有领悟到书的精髓所在(我认为的精髓),就是第一句话。因为回顾我整个思路,还是按照旧模式的因果关系思考模式思考问题。书中另一个吸引我的地方就是,有很多观点的论述,会从哲学的高度论述。虽然,自己肚子没多少墨水,但是读这些描述的时候,就会发现自己会更好的理解作者提出的命题。比如书中有一段文字
当我们说人类是通过因果关系了解世界时,我们指的是我们再理解和解释世界各种现象时使用的两种基本方法:一种是通过快速、虚幻的因果关系,还有一种就是通过缓慢、有条不紊的因果关系。大数据会改变这两种基本方法在我们认识世界时所扮演的角色。
在附上一些事例的时候,用作者提供的”本质“去看待时,很容易理解,确实是这么回事。好了,那么大数据到底改变了我们什么呢,作者给出3点,
大数据的精髓在于我们分析信息时的三个转变,这些转变讲改变我们理解和组建社会的方法。
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(样本=总体)
第二个转变就是,研究数据如此之多,以至于我们不再热衷于追求精确度
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。大数据告诉我们”是什么“而不是”为什么“。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。
正如大家所知道的那样,人类的大脑具备这样的功能,它会把新输入的刺激或信息与”过去的经验或积累的部分知识“相对照,然后进行调整并接受下来。如果眼前新的现实与大脑中储存的固有信息无法协调,便会在无意识中拒绝接受新的现实(当作没有看见);或者通过自己一知半解的知识任意推测,使自己认识到的情况偏离实际(产生错觉)。这是人的一种本能,目的在于使自己保持冷静。
所以作者称之为revolution。
讲了这么多,那么大数据到底给我们带来什么。在这里,我只想谈我感触最深的,其他的有兴趣的可以自己去了解。当然,书中提了很多,最多的就是,XXX公司或者个人利用大数据创造了多大的财富了,抛开这些表面的不说,最让我动心亦或者是害怕的是---预测。这是大数据带来最核心的东西,动心的理由无须赘述,计算机会告诉你什么时候买什么双色球可以中头奖,想想心里是不是有一点小激动咧。当然这只是我打的一个比较夸张的比喻。至于害怕呢,书中有段话我很喜欢
公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪,社会关系于个人责任的基本信条是,人为其选择的行为承担责任。如果大数据分析完全准确,那么我们的未来会被精准的预测,因此在未来,我们不仅会失去选择的权利,而且会按照预测去行动。如果精准的预测成为现实的话,我们也就失去了自由意志,失去了自由选择的权利。既然我们别无选择,那么我们也就不需要承担责任。这不是很讽刺吗。
扯到这里,顺便扯一下,书中另一段关于自由意志的描述
在哲学界,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果。而这个结果又是由其他原因导致的。以此循环往复,那么就不存在人的自由意志这一说了。——所有的生命轨迹都只是受因果关系的控制了。因此,对于因果关系在世间所扮演的角色,哲学家们争论不休,有时他们认为,这是与自由意志相对立。
书中举了个例子,举了部电影《少数派报告》,当我看到这里的时候,”哎哟,我居然看过这部电影,想想心里还是有点小激动“,有兴趣的可以去看下,大概就是讲警察通过预测来提前抓捕犯人,不过不是通过大数据,是通过超人类的方式。当你什么举动都可以被预测,相当于你完全暴露在太阳光下,换成你,你害怕不。
最后,附上两段结语,一段是书中的一段话,另一段是我自己瞎编的。
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。
大数据终将会影响到我们,也像其他技术一样会是一把双刃剑,用得好,动心,滥用,害怕。如同核技术一样,用的话,造福地球,滥用,给个金刚石地球你,照样爆。我相信,未来的大数据的发展会如作者所说的,是一场生活、工作与思维的革命。
大数据时代读后感(二)
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI最大的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。看完此书,我心中的一些问题:
1.什么是大数据?
查了查网络,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的'的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity--这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2.大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过
专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,5,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3.大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响最大的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
大数据时代读后感(三)
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
G. 在大数据中精准生活阅读答案
在大数据中精准生活阅读答案
①万物皆互联,无处不计算。因为互联网、手机、无线传感器的普及,实时监测、远程协作、SOHO工作、数据管理已成为平常之事,信息像水电一样通过网络供应汩汩传输,计算机上有形数据转化为无形的财富,深入并造福于现实生活。
②这标志着云计算与大数据时代的开启。智能管理、社交网站、物联网、IPv6,当新技术风驰电掣般地驶入生活,我们如同搭上高铁列车,还来不及看清楚窗外的风景,就已呼啸着越过下一个站台。大数据应用于健康管理,几乎表征了新媒体技术层面的全部特征:电子档案高度个性化;人工智能帮助我们细分信息;远程协同记录用户的行为模式;数据挖掘预测人们的未来需要。而智能终端与“可穿戴”计算设备的出现,更使得行为、位置、生理数据等细微变化成为可供记录和分析的精准对象。
③尽管大数据这个名词并不新鲜,但社会对于大数据价值的认识尚在深化。20世纪80年代,美国人首先提出了这个概念。雅虎的科学家发现,得益于计算机技术和海量数据库的发展,个人在真实世界的活动能够得到前所未有的记录。随着新媒体技术的更新,如今,大数据的概念逐渐拓展,涵盖了从数字图像、新闻跟帖、文本记录、视频文档、社交平台互动所提供的所有信息。不仅如此,它还被视作一种能力,引发了社会和国家战略层面的深刻关注。
④大数据之“大”,不仅在于容量,更在于社会对其价值的洞悉:在大数据所重塑的后信息环境中,一个大规模生产、分享和应用数据的世界扑面而来。正如学者维克托·迈尔—舍恩伯格所说,它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到一角,绝大部分隐藏于表面之下。
⑤但即便如此,我们依然可以清楚察觉到大数据给社会带来的一些改变。从谷歌的流行病分析系统到沈阳浑南居民的数据查询终端,基于信息的创新成为服务的先导,连接民生,可以救助更广泛的普通大众;以云计算为基础的信息存储、分享和挖掘手段,推动着数据的交换、整合和分析,可以帮助人们发现新知,创造新的价值;作为新发明和新服务的源泉,大数据也影响到传统学科研究的分化,改变了人们的价值取向、知识结构和生活方式。有学者将大数据比作观察人类自身社会行为的显微镜和仪表盘。而我们看到,这个新的测量工具,再一次引领新的繁荣,提供给人们更多的选择。
⑥作为发掘价值、征服数据的强大引擎,大数据所带来的更多改变蓄势待发。站在创新、竞争和生产率提高的前沿,思索大数据对于生活的'意义,如何将数据、信息转化为知识,扩大人类的理性,实现技术与智能服务的跨越?如何规避风险、应对它对管理世界所提出的挑战?如何借助于大数据的力量将人类的观察和理解推向“精准”,并衍生出有效的解决方案?答案还存在于人类智慧的彼此交融之中。
(选自《人民日报》2016年5月,有删改。)
1.简要概括第五段中大数据给社会带来了哪些改变?(2分)
2.第四段画横线的句子运用了哪种说明方法?有什么作用?(3分)
3.第二段中加点的“几乎”一词能否删去?为什么?(3分)
4.下面的说法或推断符合原文意思的一项是()(2分)
A、大数据这个名词早已出现,社会对于大数据价值的认识也早已深化。
B、我们已经进入大数据时代,可以“精准”规避风险,成功应对所有挑战。
C、大数据作为一种新的测量工具,将再次引领新的繁荣,提供给人们更多的选择。
D、大数据之“大”,仅仅是因为它的容量大,数据大。
参考答案:
1.可以救助更广泛的普通大众;可以帮助人们发现新知,创造新的价值;改变了人们的价值取向、知识结构和生活方式。
2.打比方。(1分)把大数据的真实价值比作“漂浮在海洋中的冰山”,具体形象地说明了它巨大的价值还未被发现,有待于进一步开发。(2分)。
3.不能删去。因为“几乎”是十分接近,差不多的意思,说明了“大数据应用于健康管理”差不多“表征了新媒体技术层面的全部特征”,删除后说法就太绝对了,不符合事实,体现了说明文语言准确、严密的特点。
4.C
H. 《大数据时代》的读后感
当认真看完一本名著后,大家心中一定有很多感想,为此需要认真地写一写读后感了。你想知道读后感怎么写吗?下面是我收集整理的《大数据时代》的读后感范文(通用5篇),仅供参考,大家一起来看看吧。
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据。
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。
面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的.预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。
在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。
一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?
我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。
在风险社会中信息安全问题日趋凸显。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考的答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考的.答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,平均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道2009年出现的H1N1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的数据资源,可见大数据时代对公共卫生也产生了重大的影响!
在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!
大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。
大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
首先,想谈一谈何为大数据,何为大数据时代。大数据是一种资源,也是一种工具。它提供一种新的思维方式去理解当今这个信息化世界。为何说是一种新的思维方式:在信息缺乏的时代或模拟时代,我们更倾向于精确性的思维方式,就像是”钉是钉,铆是铆”,而在这种传统的思维方式下,我们得到问题的答案只有一个。
而在大数据时代下,我们打破了这种思维方式,换句话说,我们接受结果的不确定性。简言概括之,我认为大数据是一种预测模型。在大数据时代下,我们关注的不是因果,即为什么是这样,而更关心”是什么”这种相关关系。换句话说,在这种新思维的思考方式下,我们探究问题背后的原因也是不可行的。我们所做的是利用大数据这种工具,让数据自己说话!
其次,我想谈下如何利用大数据提升我军战斗力。当然,大数据分析并不是精准的预测,精准的预测也是不存在的。大数据只能有利于我们理解现在和预测未来的可能性。
作为军人,我所关注的是如何利用好大数据的工具提升我军战斗力,打赢这场信息化战争。毫无疑问,现在我们打的不是刀对刀,枪对枪的战争,更不是模拟时代,当代乃是数字时代,打的是信息化战争!
四次战争的大胜,美军的战争形态从机械化转向信息化,而且相应的在战场取胜的时间也越来越短,这正是大数据时代下的必然结果。而我军正在转向信息化的过程中。在此战争形态的过程中,我们需要更多的计算分析师,大数据分析师,数学家等高等技术性人才来打赢这场信息化战争。这正是大数据时代下我们不得不有的基础。我军战斗力的提升迫在眉睫!
当然大数据是一把双刃剑,利用好了取胜也是得心应手,相反,利用不好会导致不可估量的损失。
毕竟,这只是一种预测模型,得不到精准的预测结果。我们更要让数据为我们所用,不要被庞大的数据库框住我们的思维。为适应时代的发展,在这个适者生存,弱肉强食的世界,大数据时代下的残酷竞争已经给我们敲响警钟,一场悄无声息的信息化战争已经打响!
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。
看完此书,我心中的一些问题:
1、什么是大数据?
查了查网络,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2、大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。
同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3、大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
I. 【《大数据时代》读书笔记3】数据是可再生的可再生资源
本科毕业论文写的是风力发电,作为一种安全清洁的可再生能源,虽然并网会给电网带来较大压力,但随着智能电网的普及,风力发电前景喜人。与风力资源类似,数据也是可再生的,而且与对风力资源的利用暂时只局限在发电领域不同,数据可以被称作是可再生的可再生资源。两个可再生并非笔误,而是源自其价值的多样化,对数据利用方式的创新,带来的,是源源不断的数据价值。
数据冰山,更需要仔细勘探,太远,会看不清,太近,会迷失方向,如果不小心撞上,那恐怕只能在数据之海里沉没了。所幸,在大数据思维的指引下,在数据的首要价值被挖掘后,潜在价值也持续不断被释放。
三种创新让我们得以初探冰山全貌。
数据创新1:数据的再利用
数据再利用的前提是收集或控制数据集尤其是大型数据集。有些机构如谷歌、如亚马逊,早早地开启了他们的数据再利用之旅,谷歌基于关键词搜索整理了一个版本的搜索词分析,并公开供人们查询,如实时经济指标以及旅游部门的业务预报服务;而亚马逊则一直致力于让数据的价值再大一点,通过早期为AOL电子商务网站提供后台技术服务的合作,让亚马逊掌握了用户的数据,包括他们在看什么、买什么,进一步帮助亚马逊提高推荐引擎性能。
与这些线上企业对数据利用的敏感度不同,一些线下运作的传统企业,也许还在信息喷泉上安睡。有些数据被收集、被保存,但也把数据带入了坟墓,暂不能见天日。但当他们嗅到了数据所带来的机会后,如一家知名的物流企业,针对其掌握的全球出货信息,成立专门部门,以商业和经济预测的形式出售汇总数据,创造了谷歌搜索查询业务的一个线下版本。
数据创新2:重组数据
还记得那个将某个地区的交通事故发生情况与犯罪发生情况映射到一张地图上的例子么,这就是数据重组,很多时候,1+1>2的效果一次又一次地在证明其强大魔力。其实,两个或者更多个大数据的相加,是更大的大数据,关键在于怎么相加。丹麦癌症协会曾就手机是否增加致癌率这个命题进行研究,通过将1990年至2007年间拥有手机用户的信息和该国所有癌症患者的信息这两个数据集结合后,得出了没有发现使用移动电话和癌症风险增加之间存在任何关系的结论。这就是一个数据与数据相加的实例,虽然未能形成轰动的效果,但至少也能让人们更加放心的使用移动电话了,也为我们提示了大数据运用的更多可能性。
数据创新3:可扩展数据
一个数据集并不会只有一种用途,就如美的发现需要一双发现美的眼睛一样,数据的用途也需要一双发现数据用途的眼睛。零售商店内的监控摄像头,不仅可以用来认出商店扒手,还能跟踪在商店里购物的客户流和他们停留的位置,利用这些信息,零售商可以设计店面的最佳布局并判断营销活动的有效性,正如那句话所说,无心插柳柳成荫。
数据利用的其他可能,还有数据的折旧值、数据废气、开放数据等。其中,开放数据最吸引人眼球,这也是各国政府现在正在努力推进的,其主旨是通过多元主体的参与,唤醒沉睡的数据,虽然真正实施起来,并不是那么容易,但这,必然是大势所趋,方向已经确定,路途的曲折蜿蜒,不过是为了更好地前进。