⑴ 大数据和征信是什么意思
大数据是互联网金融形成的,主要数据来源于网贷,网贷很多上不了银行征信便形成了大数据信用,比如现在国家成立的百行征信,如果需要查看大数据报告可以上一些微信公众平台查询,比如“百信查查”公众号。征信主要指银行征信,也就是央行征信中心的报告,记录的主要数据来源于信用卡,房贷,信贷记录等。查询可以去四大行,我一般去的是建设银行,离我家比较近
⑵ 大数据时代读后感5篇600字
去年的"云计算"炒得热火朝天的,今年的"大数据"又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起"大数据"来了。于是乎,各企业的CIO也将热度纷纷转向关注"大数据"来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状,下面是我为大家带来的大数据时代 读后感 ,希望你喜欢。
大数据时代读后感1
舍恩伯格的《大数据时代》被人推崇为2012最佳书籍,今年安泰读书会的重头戏。虽然主讲人最后放了个香港大黄鸭般的鸽子,但现场讨论氛围依旧非常热烈——而且还是在没几个人读完的情况下,也就意味着——大数据对我们的影响,已经深入到生活的方方面面。
无处不在的大数据:各种云计算,谷歌的神通,亚马逊的推送,天涯人肉,微博万能等等等等,我们掌握了新的工具,也获取了以前从未有过的各种信息。大数据拉近了我们与现实的距离,“地球村”变成了“地球屋”,仿佛所有人所有事物都触手可及,而这些牛逼哄哄的互联网巨头就在客厅展示着世界的每一寸光景。
然而,事实真的是这样吗?首先,从应用角度出发,低廉的运算能力和存储空间,让以前的样本分析显得非常简陋——一些从全体数据挖掘出来,忽略精确而从大量数据的简单算法得出来的结论颠覆了常识。但个人觉得,这只是统计学的终极目标——并没有非常大的跨越,可能终结了回归分析,有效性验证等手段,但依旧还是统计。而革命性在于关注相关关系而非因果关系。现场讨论从神学角度挑战了因果关系的不可能——或者说人类用简单思考的逻辑来定义因果,以及用之前小数据演绎出大概率事件来推导因果,都是不正确的。真正的因果关系应该属于上帝的范畴,人类如果真的完全掌握之后,会统治整个宇宙。但我觉得,无需从神学观点来讨论,而可以借鉴量子力学对经典力学的颠覆——在原子层面上,经典力学会失效——那么在大数据层面上,普通的抽样调查直观反映会失效。而且从量子力学角度是很难推导经典力学的公式,那么从现在的惯有思维,也难以推导出大数据的因果关系。
大数据时代读后感2
书中虽只是阐述了大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并未提及会对我们 教育 教学产生什么影响,但在这样的大环境之中,我们同样可以获得启示,寻求大数据在教育工作中可实现的价值。
1.教师角度:从基于 经验 到基于数据的教学转型
“经验主义”是指形而上学的思想 方法 和工作作风,其特点是在观察和处理问题的时候,从狭隘的个人经验出发,不是采用联系、发展、全面的观点,而是采取鼓励、精致、片面的观点。在教学中,我们有时会凭借以往经验认定本节课学生的起点,从而制定教学目标、重难点以及教学过程。这往往忽略了上届学生和这届学生是有差异的,这班学生和另一班学生也是存在差异的,那如何准确把握学生的起点呢?我想可以借助前测数据,它可以为有效教学指明了方向。
如教学“复式统计表”时,前期查找资料的时候就发现早在一年级上册P96的时候学生就见过复式统计表,意让学生初步认识统计表,渗透统计思想。而二三年级的书中练习也多有涉及,就是这种复式统计表没有“表头”,生活中的复式统计表也很多。既然在以前练习时碰到这么多次复式统计表,学生对复式统计表到底认识多少呢?我们对157名学生进行这样的调查(如下图),第1题:像上表这样的统计表以前见过吗?见过约占65%,没见过约占35%,学生在练习中碰到过、生活中也经常看见,但还是约35%的学生回答自己没见过,说明学生平时在看这个复式统计表的时候就浮于表面,所以这节课我们重点应该让学生经历复式统计表的产生过程,加深学生对复式统计表的印象。第2题:上表中的16表示什么意思?能完整表达出二班身高在130~139厘米的学生有16人,约占41%;表达一半,如二班16人,或130~139厘米16人,约占22%,其他约占37%,真正能正确读懂复式统计表的学生一半不到,需要在课中进行读图方法的指导。而知道这个表叫做复式统计表的学生不到20%。
大数据时代读后感3
这一章节,利用马修莫里导航图的例子引出了大数据的实践方式,奇人莫里通过整理航海相关的边角数据,把整个大西洋按照经纬度划分了出来,并标注出了温度、风速和风向,从而发现了洋流,也为船员提供了有效的航海路线,这就是数据的价值体现了。书中也提到了,量化我们周围的一切,是数据化的核心,将文字变成数据、将方位变成数据,将沟通、情感变成数据,通过大数据,我们会意识到,世界在本质上是由信息构成的。
在工作中,这点也可以作为启发点,通过对数据的整理,或者说以某种方式采集到相关数据,将数据整理出有价值的信息后,不断的改善到工作流程、效率、服务方面,也是工作上的创新点。
笔者在书中提到了,数据的潜在价值,并提出了数据创新应用的方法,第一是数据的再利用,数据信息被采集用作特定分析后,在另一个领域或者角色立场下,或许会开发出新的有价值的信息;第二是数据的重组,将不同类别、类型的数据进行重组,产生一个新的数据集合出来,寻找其中的关联性;第三是数据的扩展,这就需要在记录数据的同时设计好他的可扩展性;第四是数据的折旧值,数据将会贬值,但是仍会有其潜在价值;第五是数据废气,即数据采集时的离散量、离散交互信号,举例是谷歌与微软的拼写检查;第六是开放数据,数据的开放将会有利于各行各业的使用,并促进全行业数据时代的发展。这其中又提到了数据估值的概念,在数据使用时价值才会体现出来,而不是在占有本身。
根据所提供价值的不同来源,分别出现三种大数据公司,基于数据本身(采集大量数据的公司)、基于技能(提取用户的需求,给出数据分析结果的公司)、基于思维(挖掘数据新的价值的公司)。
大数据时代读后感4
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作--舍恩佰格的《大数据时代》。维克托.迈尔--舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家"的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分"大数据时代的思维变革"中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
大数据时代读后感5
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出"不是因果关系,而是相关关系。"这一论断时,他在书中还说道:"在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道“是什么”时,我们就会继续向更深层次研究的因果关系,找出背后的“为什么”。"[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可"量化",大数据的定量分析有力地回答"是什么"这一问题,但仍然无法完全回答"为什么"。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节"掌控"中试图回答,但基本上属于老生常谈。我想,或许凯文.凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:"大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。"谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
大数据时代读后感5篇600字相关 文章 :
★ 走进网络时代作文600字:互联网时代不应是“忽老”时代
⑶ 如何运用大数据为征信服务
二十多年间,伴随着经济体系的变革,我国企业信贷体系发生了重大的变化,由以大型企业为主要贷款群转变为中、小、微企业成为贷款主力军。面对新的贷款群体,银行等资金机构无法充分地给予资金,造成了日益严重的“中小微企业融资困境”。小微企业贷款的瓶颈是“缺乏高效率、低成本、高精度基础征信服务”。在此背景下,小宇宙给大家讲解几种大数据征信的探索之路。
一、 大数据征信诞生的背景
二十多年间,伴随着经济体系的变革,我国企业信贷体系发生了重大的变化,由以大型企业为主要贷款群转变为中、小、微企业成为贷款主力军。面对新的贷款群体,银行等资金机构无法充分地给予资金,造成了日益严重的“中小微企业融资困境”。林毅夫早在2001年《经济研究》发表的文章《中小金融机构发展与中小企业融资》,认为小型金融机构更适合服务于小企业,奠定了我国之后大力推动中小型金融机构发展的理论基础。城市商业银行、农村信用社、小额贷款公司纷纷成立,带动全社会的小微企业贷款产品激增,资金供给量大大提高,数年间小微企业融资环境得到了很大的改变。
然而,小型资金机构的出现并没有从根本上解决小微融资的困境,相对于大企业,小微企业对资金的占用比例极低(约30%),与小微企业对GDP的贡献(约70%)极不相称。近年来,小微企业的生存压力不断增大,传统行业竞争激烈,利润空间被不断挤压,赊销使小微企业面临残酷的资金周转压力,因资金链断裂倒闭的小微企业比比皆是。这种情况更加剧了资金机构“惜贷”行为,对小微企业贷款的负面预期导致小微企业贷款收缩,小微企业、小型金融机构两方陷入恶性循环。小微企业和小型资金机构处于整个信贷体系的最底层。
小微企业信贷的困局看似很复杂,牵扯宏观、微观各方的行为,但实际我们看所有小微信贷的难点,全部集中于一点:资金方认为无法看清小微企业的风险,自然不能放款,这称之为“信息不对称风险”;既然无法识别风险,资金方制定了回避小微借款的贷款政策,形成了“逆向选择”,小微信贷就此止步,陷入无钱可贷的困境。无论是大型银行,还是小型资金机构,都面临同样的问题,所以都对小微信贷无计可施。这个问题可以笼统地称为社会诚信体系欠缺导致信用风险高。
信用体系欠缺导致资金方难以看清小企业实际情况,这有着现实的原因。我国的小微企业内部管理是很随意的,很多交易不会以规范的方式记录下来。正规的资金方需要经过严密的尽职调查第一还款来源(依靠经营偿还借款),辅之以第二还款来源(抵押品),才能做出决策。这个过程可以称之为“征信”或者“信用审核”。前面我们已经分析过,由于资金方缺乏有效的可利用于小微企业的信用调查、审核手段,对于小微贷款项目,这个过程不但冗长成本很高,而且通常难以找到准确、真实、有价值的信息,阻碍了小企业信贷的成功率性。同样,对于那些私募资金机构、民间资金机构,本来没有能力进行相关调查,放贷只能靠感觉和其他手段,风险更大。
由此,我们可以得出结论:小微企业贷款的瓶颈是“缺乏高效率、低成本、高精度基础征信服务”。可以想象,如果资金方有能力以一种低成本的方式准确识别小企业是否可信,再加以辅助风控措施(担保、抵押等),小微业务将变得有利可图,资金通道可以就此而打开,小微信贷就会变得顺畅而有序。大数据征信正是在这种社会背景下应运而生的。
二、 大数据征信技术的几条探索之路
随着大数据技术在各行业的深入应用,运用大数据为征信打开一条通路,逐渐成为了社会主流的意识。信用服务从业者、政府信用办公室、互联网金融公司对此进行了不懈的探索,期待找到一种可以针对于小微企业的量化深度评判方法。下面我们分析一下当前主要几种方法的特点。
(一) 量化信用评价(评级)模型(由内而外型)
多年以来,信贷机构、征信机构和评级机构一直期待着能够形成一个量化信用模型,将各方面的数据导入模型之后,能够自动生成评级结果,提示是否可以放贷。经过长期的探索、研究、试验之后,这个理想的模型一直没有出炉。我国部分有实力的资金方引进日本、美国知名咨询公司的信用分析模型,但这些模型对我国的实际情况的适用性很差,没有达到期待的效果——导入相关数据后即可对企业偿还能力和偿还意愿作出可靠的判断。
国外的先进模型以及国内机构的多年模型探索,都没有形成一个普遍性有效的评判小企业的量化模型,主要原因是我国小企业的数据质量低下。由于无论国内外使用的企业数据主要是财务报表数据,而财务数据是会计师事务所出具的。我国诚信体系存在巨大缺失,会计师事务所出具的审计报告几乎是制造出来的,其可信度很低。对于诚信企业,这份报告具有较大的参考性,而对于蓄意骗贷企业,也未必能够从审计报告中看出破绽。各种量化模型的探索之所以没有得到令人满意的结果,正是由于其所依据的数据质量是低下的,所以无论如何也不可能得出真正有价值的信息。这种方法基本上宣告了是无效的。
(二) 外部数据库接入(由外向内)模式
在企业内部数据质量不佳的条件下,各类机构开始向外寻找广度更大、更加可靠的数据来源,例如政府各部门的数据,税务系统数据、工商信息、行业主管单位业务数据、海关数据等,各行业协会的经营性数据等,也有在电商平台上积累的交易数据(如淘宝上的交易数据)。基于这些数据查找与某企业相关的数据并进行综合分析。我们称之为“由外向内型”的数据体系,也就是企业征信服务不再是从被评价的企业提取数据,而是运用外部数据体系实现。
这种模式的优势在于:数据库系统形成之后,单个企业的征信信息采集将非常容易,征信服务的边际成本极低,且速度极快,直接带来的好处是征信服务的收费将非常低廉,并且服务量很大。但这种模式也存在自身的劣势:对接多部门数据入口是一项巨大的系统工程,建设、磨合的成本很高,当前除了工商信息可以达到全国联网外,其他部门信息均在分布在市级部门,整合工作相当巨大。另外,也是最严重的问题还是数据质量。我国的小企业对外报送的经营信息具有很大的随意性,都是根据具体需要编出来的,例如为了避税、贷款或者其他目的。有些地区政府为了鼓励当地企业发展,给予很高的纳税优惠,比如核定一个固定纳税额度,这样的话就不会要求企业如实报送。因此,从各部门搜集到的数据恐怕与实际情况相差较远,如果用做征信服务,可信性也会遭到质疑。同时,一个企业产生的数据并非全部对外报送,事实上,对外报送的数据仅占一小部分,如基础财务报表、应纳税额等,而大部分的能够说明企业情况的数据沉淀在企业内部,如供销信息、产品品类、资金流转等,这些数据无法通过外部数据库找到。外部数据库的数据量虽大,但针对于某单一企业,却显得容量不足了。如果是电商内部生态圈数据也相对片面,因为一个企业不会仅仅通过一个电商渠道销售,单一电商交易数据显然是不够全面的。
如果用外部数据编织数据网的话,这张网将是巨大的,几乎可以覆盖全国的企业。但由于关于某一企业的数据量不足,这张网的数据线条比较稀疏,也就是数据网眼很大,多数关于企业的有价值信息都被漏掉了,有效信息过小,不足得出可信的结论。这就是由外向内建立征信数据体系的探索。
自国务院交办发改委建立全国信用体系以来,各级政府信用办公室主导将辖区内各个掌握数据的政府部门连接起来,形成一个统一的信用信息平台,由专业的第三方公司或者设立下属公司运营,出具满足社会需求的征信报告。除政府外,也有社会征信机构做类似的事情,接入一些政府端数据并运营。从目前的发展来看,这类征信服务当前能够提供的最主要的信息是工商注册类的信息,以及少量的各部门备案信息。这类征信服务提供的信息简单,收费低廉,但对于信贷业务而言,基本上没有发挥太大的作用。
(三) 单体企业数据征信服务(由内向外)
另外一种数据征信服务,是从企业内部挖掘有用信息,从这个角度来说,这种方法和传统的征信方法是一致的,不同的是采集的信息和分析模式。现在有些专业征信公司也在研发由内而外的数据征信方法。这种方法利用的数据量不像社会征信的数据量那么大(因此称“小数据”),但与贷款相关度很高,再保证真实度的基础上,可以得到很多有价值的信息(“大信息”),并且均为信贷业务中资金方最关注的信息。该项服务可以帮助资金方在最短的时间内评判该企业是否能达到可以贷款的条件,为资金方节约大量的调研时间和成本,适应小微企业融资的效率要求和风控要求。
数据征信虽然应用的基础数据量不像政府部门数据那样多,那样大,但采集到的都是相关度最高的信息,可以捕捉企业真实经营情况和偿还能力。如果从数据网的角度看,这种方法形成的数据网较小(只适用于某单个企业),但数据“网眼”恰好适合保留住关于该企业的大量有价值信息,而筛查掉无关信息、干扰信息,形成深度、高质量的征信报告,为信贷决策提供可靠依据。
这种数据征信服务的优势是,启动快,无需长期建设成本,很好地适应我国现有的信息基础和社会现实。其难点在于如何取得借款企业的充分信任因此愿意提供深度数据。
企业数据征信技术已非一个技术上的构想,而是已经开始了大量的实践。数据征信已经在担保业务、小贷业务中发挥了重要作用,帮助担保公司和小贷公司排查风险、清晰评估项目、提高业务效率。相信随着市场环境的变化,将有越来越多的人意识到这种技术的价值。
⑷ 《大数据》读后感字
《大数据》读后感2000字
如今,我们正处于一个大数据时代,有时候数据给了我们有力的证明。以下是、《大数据》读后感2000字,欢迎阅览!
这两年,大数据,云计算的思想就像小苹果的音乐一样,传的到处都是,每一个公司不管是互联网公司还是传统企业,都标榜自己的大数据。
1、实体物联网与虚拟物联网
曾几何时,物联网的概念闹得风生水起,庞大的物联网能够让世间大量的物体,都能够被检测 并联网,包括了人、车、房等一切能够被联网的物体,这些物体都能够以种方式被感知他的存在,并对其信息记录在案,以供使用。在若干年前,这还是一种看似遥不可及的事物,要对每个物体都贴上一个所谓的RFID的标签,显得不切实际。如今,随着手机的大量使用,人类本身也被加入了物联网中。为什么要物联网?是为了获取什么?要知道物联网获取了什么,只需要看看在一个物体在没有加入物联网与加入物联网之后,我们多出了哪些东西便能够知晓。那么,很明显,我们需要通过某种方式来获取该物体的信息,这种存储下来的信息,就叫做——数据。
物联网产生的数据是实体的物品之间的信息,而现在的互联网上,占最大数据量的,是虚拟物品,或者叫做网络虚拟物品。由于网络物体是直接寄生于网络,具有能够方便的接入网络的特征,因此,在获取实体物体信息还有一定难度的时期,占有很大优势。但今后实体的物联网产生的数据量一定会不断增加,或许,能够超越网络上的物物相连数据量。
网络的广泛使用,使得信息的产生于传遍变得容易,每个接入网络的人都以一定的角色存在,都是网络的信息的创造者。对于所产生的信息而言,每个接入网络的人又身兼多角,对于网络服务商,他是网络使用者的角色;对于门户网站而言,他是使用的用户;对于社交网站而言,我们则扮演一个虚拟或者真实的网络角色;对于浏览器而言,他是一系列的浏览网页、一些列鼠标动作的角色… 不同的角色取决于对方需要从我们的行为中获取哪些信息。将网络上各种角色看成是虚拟的物体,那么,这种虚拟物体构成的虚拟物联网便产生了巨大的数据量。经历过一直以来缺乏信息获取渠道的日子,现在,既然信息获取变得如此容易,那么,必然迎来信息量暴增的时代——大数据时代。
2、思维的转变
技术的改变,使得我们思维方式也要随之发生变化。在过去的小数据时代,由于获取信息、存储信息、整理信息都是费时费力的活,我们只能精打细算,捉摸着如何以最小的代价、最快的方式来收集尽可能准确的信息。之所以会有抽样统计的方式,是受技术所限,无法获得全体的样本,或者就算获取了也无法在合理的时间内进行处理。由于信息获取代价大,使得我们不得不在获取信息前,就把一切都想清楚,才能够着手处理。这就像在计算机出现的初期,使用纸袋来编码的时期,一次出错的代价太大,所以人们不得不在输入前将代码验证过无数遍之后才敢输入到机器中。而现代计算机让编码的效率大大提升,这才使得人们能够创造出更加强大的软件。人们不需要在着手编码前就对代码过分深思熟虑,因为机器会帮助你解决一些问题。因此,那些担心由于获取数据太方便,进行数据处理、分析代价太小而使人们变得懒惰或者做事欠考虑的家伙,真是杞人忧天。历史上,技术的进步都会提升人类的生产力,但却没有让人们变得懒惰,因为与此同时,欲望也随之增长。人类只会变得更伟大。
因此,大数据时代,这个数据更加全面的时代,我们可以涉足一些之前由于缺乏数据而无法涉及的领域,例如——预测。这是一个令人兴奋的领域,但其实这个领域早有苗头,而且大家都是受益者。我们平时使用的输入法中的智能联想功能,能够根据我们之前输入的文字,来预测我们接下来有可能输入的文字,以节省我们的输入时间。这种算法里,没有人工智能,而只有人们大量的输入习惯的统计,通过大量数据的统计来预测,是一个统计学的方式而非加入了特有的规则或者逻辑。这便引出了在大数据时代,对于信息处理的一种重要方式,基于统计,得出不同个体的相关关系,却无需了解其因果关系,而我们则受益于相关关系。这种方式,看似有些投机取巧,却能够在关键时刻令我们处于优势地位。我们已经习惯了先知道某些事物的因果逻辑,继而推断出相应的结果。但世间总会有一些令人无法用合理的逻辑进行解释的现象,若通过大数据分析,我们能够跳过逻辑阶段直接享用某些一些结果(沃尔玛的啤酒加尿布案例),岂不乐哉。当然,严密的逻辑永远是值得尊敬的。
3、互联网的黏性
在经历过了从广度上通过新花样来吸引用户的时代,由于技术的提高,一个创业者在一个新的领域开辟的东西很容易被其他人所复制。在这个时候,深度很重要。特别是购物网站、微薄、门户网站这类信息量大的网站,越是了解一个用户,优势就越大。所以,在技术已经不是最重要的因素的时代,如何增加用户的黏性、忠诚度便是首要的。通过用户之前的信息,来推测用户的喜好,给用户推荐相应的信息或物品。当你越了解一个用户,而别人却不了解时,这个用户就越离不开你。微薄中有他的`智能排序功能、新闻门户中有“今日头条”应用,各类购物网站有他的推荐算法(但这个纯粹为了增加消费而非增加用户黏性),都能够根据用户之前的浏览、偏好来给出相应的推荐。这些的基础,都是拥有用户的行为记录,否则,都无从谈起。
各行各业,都在疯狂的抓紧时机,获取数据,拥有足量的数据,那一切就变得皆有可能。
凡是过去,皆为序曲是大数据业者最喜欢引用的语句。大数据是现在的潮流,大数据时代被认为是了解大数据的初级读物。近期连续读了两遍,第二遍是为了写这篇读后感,总体而言,值得一看,但细节方面却需要讨论了。
维基网络对大数据的解释:Big data,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。
有人说现在是读图时代,除去小说、心灵鸡汤以外,现在的畅销书基本都有图片,这本书是一个特例
首先尝试解析一下作者的三大观点,这三大观点是大数据业者很喜欢引用的三句话:
1 不是随机样本,而是全体数据
我想所有人都能意识到对全体数据的分析优于对随机样本的分析,但在现实中我们经常拿不到全体数据:一是数据的收集方法,每一种方法都有适用的范围,不太可能包罗万象;二是数据分析的角度,战斗机只能统计到飞回来的飞机上的弹孔,而坠毁的则无法统计,沃德通过分析飞回来的战斗机得出来最易导致坠毁的薄弱点;三是处理能力跟不上,就像以前的天气预报太离谱是因为来不及算那些数据。“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”,作者显然只关注了一部分原因。
从语言的理解上看,什么是全体数据,究竟是“我们需要的所有数据”,还是“我们能收集到的所有数据”,书中的很多商业案例中,处理的只是“我们能收集到的所有数据”,或者说是“我们认为的全体数据”。人对自然的认识总是有限的,存在主义认为世界没有终极的目标。书中举例“Farecast使用了每一条航线整整一年的价格数据来进行预测”,而“整整一年”就是一个采样,或者是“我们需要的所有数据”。
从历史的角度看,国外的托勒密建亚历山大图书馆唯一的目的是“收集全世界的书”,实现“世界知识总汇”的梦想,国内的乾隆汇编四库全书,每个收集的过程都有主观因素在里面,而他们当时都认为可以收集全部的书籍,到最后,我们也没有得到那个梦中的全体。
2 不是精确性,而是混杂性
既然我们过去总是在抽样,那本身就是在一个置信水平下,有明确的容错度或者是偏差值。人类永远知道我们是在精确性受限的条件下工作。同时,作者本身也承认 “错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在”。那大数据的特征究竟是精确性还是混杂性?
由此衍生出一个问题,大数据的品质如何控制:一、本身就不要求精确,但是不精确到何种程度是需要定义的,否则就乱套了,换个角度,如果定义了容错度,那符合条件的都是精确的(或者说我这句话还是停留在小数据时代?这里的逻辑我没有理顺)。就像品质管理大师克劳斯比提出过零缺陷理论,我一直觉得是一个伪命题,缺陷是一定存在的,就看如何界定了;二、大量非结构化数据的处理,譬如说对新闻的量化、情感的分析,目前对非SQL的应用还有巨大的进步空间。
“一个东西要出故障,不会是瞬间的,而是慢慢地出问题的”。“通过找出一个关联物并监控它,我们就能预测未来”。这句话当然是很认同,但不意味着我们可以放弃精确性,只是说我们需要重新定义精确度。之于项目管理行业,如果一个项目出了严重的问题,我们相信,肯定是很多因素和过程环节中出了问题,我们也失去了很多次挽救的机会。而我们一味的容忍混杂性的话,结果显然是不能接受的。
3 不是因果关系,而是相关关系
这是本书对大数据理论的最大的贡献,也是最受争议的地方。连译者都有点看不下去了。
相关关系我实在是太熟了,打小就学的算命就是典型的“不是因果关系,而是相关关系”。算命其实是对趋向性的总结,在给定条件下,告诉你需要远离什么,接近什么,但不会告诉你为什么那样做。
我们很多时候都在说科学,然而,什么是科学,没有人能讲清楚。我对科学的认识是:一、有一个明确的范围;二、在这个范围内树立一个强制正确的公理;三、有明确的推演过程;四 可以复制。科学的霸道体现在把一切不符合这四个条件的事物都斥为伪科学、封建迷信,而把自己的错误都用不符合前两条来否决。从这个定义来看,大数据不符合科学。
混沌学理论中的蝴蝶效应主要关注相关关系。它是指对初始条件敏感性的一种依赖现象,输入端微小的差别会迅速放大到输出端,但能输出什么,谁也不知道。
人类一旦放弃了对因果关系的追求,也就放弃了自身最优秀的品质:意志力。很多人不愿意相信算命是担心一旦知道了命运,就无法再去奋斗。即使我相信算命,也在探求相关关系中的因果要素。我放弃第一份工作的原因之一是厌倦了如此确定的明天:一个任务发出去,大概能预测到哪些环节会出问题,只要不去 follow,这些环节十有八九会出问题。
解析完这三大观点,下面是我对大数据理论的一些疑惑。大数据是目前风行的反馈经济中的重要一环,在金融、互联网行业的应用最为广泛,而这些行业都是大家所认为的高薪领域。很多时候我就在想,所谓无形的手所产生的趋势究竟是不是无形的。比如几家公司强推一个概念,说这是趋势,不久就真的变成趋势了。我们身边活生生的例子就是天猫的双十一和京东的618,一个巨头开路,无数人跟风,自然就生造出购物节,至于合理不合理,追究的意义也不大,因为很多事情是没有可比性的。这和没有强制控制中心的蜂群思维又不一样。
看完这本书,总是觉得作者说的过于绝对,也许是我的认识太浅了吧,所以最后用法演四戒做总结:
势不可以使尽,使尽则祸必至
福不可以受尽,受尽则缘必孤
话不可以说尽,说尽则人必易
规矩不可行尽,行尽则事必繁
⑸ 《大数据时代》读后感
导语:读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。以下是我为大家精心整理的《大数据时代》读后感,欢迎大家参考!
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的;话题,钟情于务虚的观点;新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。一、人们研究与分析某个现象时,将使用全部数据而非抽样数据;二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。
面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
“除了上帝,任何人都必须用数据来说话。”——这是《大数据》中出现的让人印象深刻的一句话,也是全书力图传递的信息。在数字信息时代,数据和空气一样遍布生活,对于有些人来说,数据无意义,而对于有些人来说,数据,即真相。
美国是《大数据》的主角,全书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴ma建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3·0与下一代互联网的未来图景等等,为读者一一细解数据创新给公民、政府、社会带来的种种挑战和变革。
透过全书,一个立体的美国及美国人民的思想呈现在我们面前——美国人民执著于个人隐私的保护,却又不遗余力地推动着政府信息的透明与公开。
读完此书,对生活中的数据及数据处理突然有了很大的兴趣。如果有一天,处处以数据说话,那么,政治、制度、生活将更加清明,事故将降到最低点。
作为信息技术教师,是有必要阅读此书的!有慧根的教师将能从书中挖掘出信息技术特有的文化以及能用于教学的鲜活案例。
每天能用来阅读的时间很少,总是要等到夜深疲倦时才有空打开书本,总是在眼睛极不舒服的情况下坚持阅读,《大数据》就这样在坚持中溶入我的思想……
读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。
我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的`到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
3月11日下午两节课后,我校全体教师和受邀而来的金南学区各友好学校的领导及教师汇聚于多媒体教室,共同分享、交流《大数据》读后感。
老师们从:何谓大数据;立足国情对大数据进行探讨;大数据在教育教学中的主要应用等几个方面畅谈了自己的感悟。
张萌老师说:大数据体量庞大、结构复杂、是产生巨大价值的数据集合。大数据这种方法在中国的国情下需要以更加科学、合适的方式进行实践,不可生搬硬套。
董译雯老师说:在你我感叹《大数据》里深植于美国民众血液中的自由、民主、严谨的价值观的同时,可否想过中国教育体制下的孩子们身上还残留多少独立与自我意识?作为典型的八零后,我们这一代人身上最缺失的便是独立思考能力。但愿,我的学生哪怕是因为我所做的一点点努力而开始思考“我”这个字的含义,足矣!
张红杰老师说:很感谢校长给我们推荐了《大数据》这本书。在教学工作中,应该有大数据意识,创新意识。学习一些专业的教学统计法、数据分析法,从中发现一些教育现象,并采取相应的策略。让我们的教育教学工作少一些随意和盲目,多一份严谨与科学。
白媛媛老师通过文中的三个事例,结合教学实际,谈了自己教学中对数据使用的价值;结合自己的工作,谈了如何实现工作的最高境界。
交流活动尾声,身为阅读《大数据》的倡议者、发起者、以及忠实的读者韩校长幽默风趣的同大家分享了他读后的感悟:我们心中要装着学校,因为我们个人的命运依赖群体的命运;工作要追求精细化,不能做胡适书中的“差不多”先生;尊重数据,拥有数据意识,建立数据团队!
此次活动从寒假期间倡导读《大数据》一书,到开学伊始的分组沙龙,再到今日的阅读共享,现已圆满告一段落。相信此次活动定会增强我校全体教师的数据意识,掌握大数据,运用大智慧助推我校的教育教学上一个新的台阶!
⑹ 《大数据》读书笔记
《大数据》(徐子沛)
核心观点: 一个真正的信息社会,首先是一个公民社会。
徐子沛和吴军是国内科技界文笔最好的两位大拿,能把复杂的技术发展讲得像故事一样引人入胜。书中讲述了美国信息开放、数据技术创新、数据逐步开放的历史,例举了美国政府如何通过大数据来治国:降低犯罪率、纠正福利滥用、增加财务透明度,并展望了大数据发展的未来,他觉得中国和美国最大的区别就在中国习惯于说“差不多”,不善于用数字管理国家。书中也介绍了大数据中数据仓库、数据挖掘、数据分析、数据可视化等技术的发展,他认为: 数据就是企业的财富和金矿,数据分析和挖掘的能力就是企业的核心竞争力。 阿里网罗了徐子沛和王坚两个大数据和云计算专家,估计在大数据和云计算领域鲜有敌手了。
核心观点: 推崇知识和理性,用数据创新
本书讲述互联网对传统工业 生活的推进,大量数据没有数字化,数据基本都困在一家医院内,电子病历推进也很缓慢,通过数据的流通让患者享受更便捷、更安全的服务基本只限制在思考层,这里面有方方面面的各种利益、法规的原因,这就像书中说的“也许是由于其本身的根深蒂固。作者认为 iPhone、云计算、3D打印、基因测序、无线传感器、超级计算机,这些改变了我们生活的事物,将再一次地融合在一起,对医学进行一次“创造性破坏” ,我觉得新技术的应用比新规则的创立在国内还是相对简单,而也能解决医疗资源不足的痛点,把像IBM沃森这样的智能作为医疗的辅助判断,提升医疗的效率和准确率还是前景明朗的。但要说像书中说的“旧的体系完全不复存在,新的体系随之取代...在这超级融合之下,权力再次交回到我们自己手中,而只有我们自己,。我想这还有很远的路要走,与生命有关的事物,一定是慎之又慎的;与体系有关的事情,改变一定是难上加难的。
所以 崇正说他们阿里都是看数据做事情,不是臆想做事情。因为在这个高速发展的时代,数据都是流动。他们都是落实到行动,分析数据,应用数据,依靠数据。
⑺ 《征信大数据理论与实践》epub下载在线阅读,求百度网盘云资源
《征信大数据》(姚前)电子书网盘下载免费在线阅读
资源链接:
链接:https://pan..com/s/1W1uD4xJsQdInfBAAxCtZvQ
书名:征信大数据
作者:姚前
出版社:中国金融出版社
出版年份:2018-3-30
页数:190
内容简介:
征信(Credit reporting或者是Credit reference)是指依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估、信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。征信的主要目的是解决交易双方信息不对称的问题,进行信用风险管理。本书共分为十七篇,包含:大数据简介,征信大数据的应用,基于征信数据观中国近十年产业间信贷资源的调整路径,基于大数据的中国房企信贷分析,基于大数据的个人房贷分析, 基于征信大数据的住宿餐饮业信贷结构分析, 基于征信大数据的水利、环境和公共设施管理业分析等等。
⑻ 《大数据时代》的读后感
认真品味一部名著后,你有什么领悟呢?现在就让我们写一篇走心的读后感吧。那么如何写读后感才能更有感染力呢?以下是我帮大家整理的《大数据时代》优秀读后感范文,希望能够帮助到大家。
这书读起来不费劲,没有太多晦涩的理论,所以也比较快速的用了几天的中午休息时间读完了。
网上到处都是推荐此书的文章,赞为大数据的经典之作。可是,我读了一遍下来,却没有这种经典之感,只是必须叹服作者思维严密、涉猎广泛,书中有关大数据的例子真是不少,会给我们的阅读带来一定的舒适感和现实感。
已经看过太多网上的关于大数据的文章、案例分析,但是我认为大数据仅仅是一种手段,是我们分析认识世界的诸多手段中的一种。我们既不要拒绝排斥大数据的应用,但也没必要神话大数据。
在读此书过程中,稍带也看了几部关乎大数据分析的影片,有本书中提到的《少数派报告》,还有《永无止境》、《源代码》。少数派报告中,人类借助先知的超能力获取对犯罪的预测和提前打击,但是书中和影片中都提到的有一个悖论的问题:如果你预测某犯罪要发生,所以去提前抓捕,阻止了案件的发生,但案件没有发生,又以什么为依据来抓捕嫌疑人呢?!所以,我认为大数据的应用在预测方面的作用,不应该涉及任何行政司法等严肃方向。因为,人是善变的,也许在预测之后的时间里,由于其它因素影响,t她的决定就突然改变,预测就彻底无效了。大数据,更应该在提供思路、途径方向,在我们还没有发现其原理之前,先依照大数据的分析去做些突破常规、有创造性的事情。
从古至今,对数据的统计应用一直没有中断过,我们人类在发挥聪明才智的过程中,创造了文字记录历史,通过积累和总结为人类的文明发展做出了极大的贡献。只不过,现在我们利用计算机系统对日益暴涨的数据信息能够处理的数据量更大、想法更多了。在这个角度上,大数据其实不过是人类信息化发展历史中的一个必然过程。
大数据爆发的背景,是计算机普及应用、工作和生活信息化、网络尤其是互联网的发达等因素,为之提供了能够使用的超大规模数据化信息。就如计算机与人下棋的程序一样,掌握了足够的棋局数据、能够推算每一步之后的可能,快速的运算能力是实现这些的基础。
大数据本身是无意识的,或者叫无目的,是因为使用的人的发现或主观意识,才从中抓取到符合所想或支持所想的一些数据和比例。人才是核心。别以为有个所谓的大数据中心就能够挥斥方遒、指点江山了。这也是我说要对大数据去神化的一点。书中所举例子,成功的案例其实都基本是一个打破常规、奇思异想的人或一个具备创新思维的团队,而这个人或团队一旦陷入对现有模式的僵化应用或崇拜,失败的结果也是必然。我想说的是,无论是大数据还是快数据什么的玩意,都仅仅是我们了解世界了解社会的一个角度一种手段,都始终无法摆脱依赖于人的思考这个根本。别一叶障目不见泰山的意味有了大数据就拥有了整个世界,你的心有多大,舞台才有多大。只有当你的思考抵达,那些个曾经没有价值的数据垃圾,才会焕发出价值!不要荒废了你的思考这个核心!
作者说大数据只讲结果不讲原因。这个状态我认为仅仅是一个过渡时期的表现,如果要实现对大数据分析应用的更加精准、甚至可以作为某种依据,必然要获得对大数据分析的果的可靠解释,也从而能对我们现有的行为、制度等获得新的认识,来进行可行的改变、升级或者重造,大数据的指导意义才发挥更深。
人们都说,中外著述的差距有时是很大的,中国的作家习惯铺垫和描绘,将简单的事情复杂化;国外的就相反,喜欢直捣要害,将复杂的事情抽象简单化。不知道是不是我不很适应国外这类书籍的缘故,对大数据时代一书,我没有感受到很多的震撼和脑洞大开感,也许和现在各类大数据的文章太多有关,已经把此书的观点各自领用发挥了一番,也许是我还没有领会到精华所在。既然人们都奉为经典,那我想或许我应该隔一段时间、换个姿势,再重读此书,看看是不是会有新的感受吧。
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据。
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。
三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?
我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。
在风险社会中信息安全问题日趋凸显。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考的答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考的答案。此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
读完《大数据时代》这本书后,我意识到:我们即将或正在迎接由书面到电子的跳跃之后的又一重大变革。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为Farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,平均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道2009年出现的H1N1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,Google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的.数据资源,可见大数据时代对公共卫生也产生了重大的影响!在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!大数据时代的到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
现在已经进入到了二十一世纪了,当今社会已经摆脱了上个世纪的那种消息滞后的时代了,我们最应该感谢的就是科学的进步为我们带来了这么多便利。与此同时,科学的进步还为我们带来了“大数据”这个让人类减少了很多工作量的东西。
在这个学期的名著导读课上我们就被要求读:《大数据时代》这本书。《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为“大数据时代的预言家”,他是一个特别厉害的人,他作为一个教师,他曾经在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多所世界前列名校任教的经历。他作为一个科学家,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。他是十余年潜心研究数据科学的技术权威。他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
他作为一个研究学者,他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;"大数据"在网络上搜索到的解释是:称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。特点:数量、速度、品种、真实性。而舍恩伯格认为,大数据并不能定义一个确切的概念。他提到"大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府和公民关系的方法。"这是一种更具有人文色彩和社会意义的诠释。
大数据不仅改变了公共卫生领域,整个商业领域都因为大数据而重新洗牌。购买飞机票就是一个很好的例子。就像书中写到2003年,奥伦·埃齐奥尼准备乘坐从西雅图到洛杉矶的飞机去参加弟弟的婚礼。他知道飞机票越早预订越便宜,于是他在这个大喜日子来临之前的几个月,就在网上预订了一张去洛杉矶的机票。在飞机上,埃齐奥尼好奇地问邻座的乘客花了多少钱购买机票。当得知虽然那个人的机票比他买得更晚,但是票价却比他便宜得多时,他感到非常气愤。于是,他又询问了另外几个乘客,结果发现大家买的票居然都比他的便宜。
飞机着陆之后,埃齐奥尼下定决心要帮助人们开发一个系统,用来推测当前网页上的机票价格是否合理。作为一种商品,同一架飞机上每个座位的价格本来不应该有差别。但实际上,价格却千差万别,其中缘由只有航空公司自己清楚。
埃齐奥尼表示,他不需要去解开机票价格差异的奥秘。他要做的仅仅是预测当前的机票价格在未来一段时间内会上涨还是下降。这个想法是可行的,但操作起来并不是那么简单。这个系统需要分析所有特定航线机票的销售价格并确定票价与提前购买天数的关系。
在信息时代,信息安全问题的日趋凸显,数据独裁与隐私保护之间的矛盾更是立于风口浪尖,成为众矢之的,舍恩伯格在本书的最后章节曾试图寻找一种解决方式来摆脱这一种困境,但最终没能做到,但是他提出"大数据并不是一个充斥着算法的和机器的冰冷世界,人类的作用仍无法被完全代替。"这里表明人在数据时代同样的重要,数据是为人类服务的,也就该人类驱使下完成相应的目的。在这样的大环境下,常引起我更多的思考和担忧。
大数据时代对于我们同是机遇与挑战,一些国家已开始步入大数据时代的行列,并在各个领域开始研究和使用。而对于我国庞大的人口,以及较大的领土面积,都可以在大数据时代为我们提供数据的保障,而能否面临挑战,在大国之间的新一轮角色角逐间崭露头角,我们更需要解决技术等方面的问题,更应在政策上逐步开放各领域的数据,保证数据来源、权限等问题得到解决,不断学习先进的计算机技术,缩小与其他国家的差距。
⑼ 大数据时代读后感1000字
大数据时代读后感1000字(精选7篇)
当品味完一本著作后,大家心中一定有很多感想,现在就让我们写一篇走心的读后感吧。怎样写读后感才能避免写成“流水账”呢?下面是我精心整理的大数据时代读后感1000字,仅供参考,大家一起来看看吧。
如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。这个命题是我读这本书最大的感触。个人认为也是这本书最核心的思想。从头说起吧,首先,书提出一个颠覆我以前认知的命题--”并非原子而是信息才是一切的本源“,将世界看做信息,看做可以理解的数据的海洋,为我们提供了一个从未有过的审视下是的视角。它是一种可以渗透到所有生活领域的世界观。这个命题是在书的最后一部分中的某一段中描写的。我之所以把它放在最前面来讲,因为我觉得,这是谈数据化世界的前提,自然也是谈论大数据的前提啦。书的中间部分有一节讲到数据化和数字化的区别。经过我自己脑子的整理,把数据化世界这个命题列为大数据思维的第二步。写到这里,我不由得反省下,我是不是有领悟到书的精髓所在(我认为的精髓),就是第一句话。因为回顾我整个思路,还是按照旧模式的因果关系思考模式思考问题。书中另一个吸引我的地方就是,有很多观点的论述,会从哲学的高度论述。虽然,自己肚子没多少墨水,但是读这些描述的时候,就会发现自己会更好的理解作者提出的命题。比如书中有一段文字
当我们说人类是通过因果关系了解世界时,我们指的是我们再理解和解释世界各种现象时使用的两种基本方法:一种是通过快速、虚幻的因果关系,还有一种就是通过缓慢、有条不紊的因果关系。大数据会改变这两种基本方法在我们认识世界时所扮演的角色。
在附上一些事例的时候,用作者提供的”本质“去看待时,很容易理解,确实是这么回事。好了,那么大数据到底改变了我们什么呢,作者给出3点,
大数据的精髓在于我们分析信息时的三个转变,这些转变讲改变我们理解和组建社会的方法。
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(样本=总体)
第二个转变就是,研究数据如此之多,以至于我们不再热衷于追求精确度
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。大数据告诉我们”是什么“而不是”为什么“。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。,出处:短美文,否则追究其责任,谢谢你的支持,我们会给做得更好!
正如大家所知道的那样,人类的大脑具备这样的功能,它会把新输入的刺激或信息与”过去的经验或积累的部分知识“相对照,然后进行调整并接受下来。如果眼前新的现实与大脑中储存的固有信息无法协调,便会在无意识中拒绝接受新的现实(当作没有看见);或者通过自己一知半解的知识任意推测,使自己认识到的情况偏离实际(产生错觉)。这是人的一种本能,目的在于使自己保持冷静。
所以作者称之为revolution。
讲了这么多,那么大数据到底给我们带来什么。在这里,我只想谈我感触最深的,其他的有兴趣的可以自己去了解。当然,书中提了很多,最多的就是,XXX公司或者个人利用大数据创造了多大的财富了,抛开这些表面的不说,最让我动心亦或者是害怕的是,预测。这是大数据带来最核心的东西,动心的理由无须赘述,计算机会告诉你什么时候买什么双色球可以中头奖,想想心里是不是有一点小激动咧。当然这只是我打的一个比较夸张的比喻。至于害怕呢,书中有段话我很喜欢
公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪,社会关系于个人责任的基本信条是,人为其选择的行为承担责任。如果大数据分析完全准确,那么我们的未来会被精准的预测,因此在未来,我们不仅会失去选择的权利,而且会按照预测去行动。如果精准的预测成为现实的话,我们也就失去了自由意志,失去了自由选择的权利。既然我们别无选择,那么我们也就不需要承担责任。这不是很讽刺吗。
扯到这里,顺便扯一下,书中另一段关于自由意志的描述
在哲学界,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果。而这个结果又是由其他原因导致的。以此循环往复,那么就不存在人的自由意志这一说了。——所有的生命轨迹都只是受因果关系的控制了。因此,对于因果关系在世间所扮演的角色,哲学家们争论不休,有时他们认为,这是与自由意志相对立。
书中举了个例子,举了部电影《少数派报告》,当我看到这里的时候,”哎哟,我居然看过这部电影,想想心里还是有点小激动“,有兴趣的可以去看下,大概就是讲警察通过预测来提前抓捕犯人,不过不是通过大数据,是通过超人类的方式。当你什么举动都可以被预测,相当于你完全暴露在太阳光下,换成你,你害怕不。
最后,附上两段结语,一段是书中的一段话,另一段是我自己瞎编的。
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。
大数据终将会影响到我们,也像其他技术一样会是一把双刃剑,用得好,动心,滥用,害怕。如同核技术一样,用的话,造福地球,滥用,给个金刚石地球你,照样爆。我相信,未来的大数据的发展会如作者所说的,是一场生活、工作与思维的革命。
“大数据”一词不知何时在我们的生活悄然出现,为了一探究竟,我便选择了《大数据时代》一书。
作者先从全局简单地描述大数据对我们的生活、工作与思维的影响,再从三方面具体地用上百个学术和商业的实例展开写作。样本=总体、追求精确性和相关关系等大数据时代具体特点一一现出。在同时,作者也从个人、企业等多角度分析大数据中的隐忧。
书中内容繁多,在此不能各方面概括。此书中虽有许多专有名词,但作者以其通俗的语言以及许多实例让我嗅到大数据时代中一抹清新之气。
为什么是清新的呢?因为书中的内容仿佛向我打开了一个既有点熟悉又有点陌生的世界。我们现在已处于网络时代 ,在我们日常简单的操作中大量数据产生,然而起初我们仅用众多技术在解决手头上的问题,那些大数据像沙子中的金子,价值不被发现。到目前,每当我们网上购书时总会看到“猜你喜欢”的栏目、出现谷歌搜索与流感预测、Farecast与飞机票价预测系统等,这些事情的达成全来自于那些曾被忽略的大数据同时也在证明“预测,大数据的核心”这句话,为我们的生活创造了前所未有的可量化的维度。看到书中这部分内容时,我不禁感受到自己的生活已在享大数据带来的福利,就像“猜你喜欢”栏目让我触到更多合我口味的书,让我看到了以前无法发现的细节。拥有大量数据的公司巨头如谷歌、亚马逊大力开发有关大数据的新型产业和研究相关项目。借网络时代的便利大数据成为了如今最有商业价值的事物,使一切可量化的趋势也开始出现。“本质上世界是由信息构成的”,面对这句话时,大数据时代仿佛就在眼前。
在感受惊叹着大数据能为我们做到以往无法想象的事和它巨大的价值时,我认同大数据能极大优化我们的生活,但又不禁为这时代感到担忧。一旦大数据时代来临,不仅我们的隐私可能不再是隐私,就如书中所言“我们时刻暴露在‘第三只眼’下:亚马逊监视着我们的购物习惯,谷歌监视着我们的购物习惯,而微博似乎什么都知道”,而且利用大数据我们可以预测许多事情并且十分高效,一旦人们依赖大数据极少运用人类自身的创新等能力被数据束缚住,世界只会沦落为一个极少活力的机械环境。而我认为最大的忧患,是大数据时代对人类自身思维、思想、信仰等精神领域的冲击。如今我们都生活在数据中,大数据时代说不定在几年后就会逐步来临,这使我不禁发问:我们一直坚信着信仰着的究竟是什么?我觉得世界说变就变实在令我想不通这个问题。事情都有好坏,我也不知道自己是否杞人忧天。
于是我继续去探索作者对这问题的思考。“更大的数据在于人本身”,作者还说“我们是在创造更好的未来”,也说“在一个预测的时代里,人类的.自由意志不可侵犯,这一点不可轻视。我们在使用大数据时,应当怀有谦恭之心,铭记人性之本”。人类学家克利福德吉尔兹曾说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”这些话语仿佛是阳光,驱散我心中对大数据时代的担忧以及内心对其的恐惧。我认为,在坚守我们内心和自由意志下,大数据才会造福我们人类世界,发挥出它背后对人温暖的光芒。
面对时代的变革,我会为坚守内心深处的自由意志而努力并“拥抱大数据”。
世界的本质就是数据,当你掌握了数据,你便掌控了世界—你可以轻而易举地通过数据中的相关关系预测事物的发展,将一切不利因素扼杀于摇篮之中—这远胜于"防患于未然"。
《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。全书介绍了 "大数据"时代三种大的变革:思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古中国固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。
"我们不再热衷于寻找因果关系,而应该寻找事物间的相关关系",我想这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。
这种观念以惊人的力量给现知识状况带来了巨大的冲击,通过对海量数据的分析,获得巨大价值的产品和服务,或深刻的洞见。比如谷歌公司,2009年h1n1流行之时,通过检测检索词条,处理34。5亿个不同的数据模型,通过预测并与2007、2008年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为预测流感提供了一种更快速、高效的工具。
同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于预测,当敌人通过这种手段预测我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。
对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!
“除了上帝,任何人都必须用数据来说话。”——这是《大数据》中出现的让人印象深刻的一句话,也是全书力图传递的信息。在数字信息时代,数据和空气一样遍布生活,对于有些人来说,数据无意义,而对于有些人来说,数据,即真相。
美国是《大数据》的主角,全书通过讲述美国半个多世纪信息开放、技术创新的历史,公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,Web3·0与下一代互联网的未来图景等等,为读者一一细解数据创新给公民、政府、社会带来的种种挑战和变革。
透过全书,一个立体的美国及美国人民的思想呈现在我们面前——美国人民执著于个人隐私的保护,却又不遗余力地推动着政府信息的透明与公开。
读完此书,对生活中的数据及数据处理突然有了很大的兴趣。如果有一天,处处以数据说话,那么,政治、制度、生活将更加清明,事故、将降到最低点。
作为信息技术教师,是有必要阅读此书的!有慧根的教师将能从书中挖掘出信息技术特有的文化以及能用于教学的鲜活案例。
每天能用来阅读的时间很少,总是要等到夜深疲倦时才有空打开书本,总是在眼睛极不舒服的情况下坚持阅读,《大数据》就这样在坚持中溶入我的思想……
读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。
我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
舍恩伯格的《大数据时代》,让我重新审视了"大数据"这个在信息时代异军突起的热点词汇,作为信息安全专业的我,对大数据这个词本身有着更多的热忱。
在网络上搜索到的解释是:"大数据",或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。特点:数量、速度、品种、真实性。
而舍恩伯格认为,大数据并不能定义一个确切的概念。他提到"大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府和公民关系的方法。"这是一种更具有人文色彩和社会意义的诠释。
本书中,主要从三个方面论述,即思维变革、商业变革和管理变革。而舍恩伯格更是着重阐明三大观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。
对于观点一,我不敢苟同,毕竟大数据的实现需要一定的技术支持,而显然,现在这种技术还不够成熟,同时一些简单的事情运用大数据反倒是问题更加复杂化,因此这种大叔据的繁杂处理方式更适用于一些特定的情况,比如商业预测,人类dna的研究等。
而对第二种观点,我是十分赞同舍恩伯格所说的"大数据的简单算法比小数据的简单算法有效"。在计算机行业迅速发展中,一种新的简单可行的算法的出现,远没有计算机在运算速度和存储容量的发展快,而大数据算法似乎更能迎合这种大趋势。
观点三中提到的相关关系在大数据中可是重量级的,它能较快找到事物规律和对应的解决措施,当然,也不能完全忽视因果关系,毕竟人们在思维上更能够接受因果关系分析出的结果,而大数据预测的需要人们慢慢的适应才能接受。当我们完成相关关系的分析而又不满足于只知道"是什么"的时候,我们就可以转而研究"为什么"了,毕竟问题的根本在于因果。而舍恩伯格的全体数据和相关关系是大数据时代下的一种捷径。
但是在信息时代,信息安全问题的日趋凸显,数据独裁与隐私保护之间的矛盾更是立于风口浪尖,成为众矢之的,舍恩伯格在本书的最后章节曾试图寻找一种解决方式来摆脱这一种困境,但最终没能做到,但是他提出"大数据并不是一个充斥着算法的和机器的冰冷世界,人类的作用仍无法被完全代替。"这里表明人在数据时代同样的重要,数据是为人类服务的,也就该人类驱使下完成相应的目的。
在这样的大环境下,常引起我更多的思考和担忧。
大数据时代对于我们同是机遇与挑战,一些国家已开始步入大数据时代的行列,并在各个领域开始研究和使用。而对于我国庞大的人口,以及较大的领土面积,都可以在大数据时代为我们提供数据的保障,而能否面临挑战,在大国之间的新一轮角色角逐间崭露头角,我们更需要解决技术等方面的问题,更应在政策上逐步开放各领域的数据,保证数据来源、权限等问题得到解决,不断学习先进的计算机技术,缩小与其他国家的差距。
工业化、信息化,我们都向世界交出了一份让世界不能小觑的答案;
大数据时代的数据化我们又将怎样在新的风暴中所向披靡,如果大数据时代是一种必然趋势,那这就是我们这一代人的责任,是我们新的战场!
;