⑴ 大数据的理想与现实之间
大数据的理想与现实之间
我与数据打了25年的交道,经历了从电信、网通到联通的多次重组,亲身参与了数据专业线从弱势群体逐渐发展壮大的全过程。一直想找个机会,谈谈我的体会,但是没有下这个决心动笔。最近,受范总原创《“一篇文看懂Hadoop”读后感》的鼓舞,想从数据工作实务的角度分享一下我的想法,就当抛砖引玉吧。
1. 关于数据中心的定位我们就按照论文里通常的套路开始吧。首先“什么是数据?”通俗的理解就是:如果把企业比作一个“生产线”,数据就是在这个“生产线”上各项活动所产生的,以各种形式存放在各个系统中或者其他载体上的信息,把这些信息按照一定的属性和规则进行分类加工就形成了数据,它反映着企业经营发展的状况,记录着企业用户的使用情况,还有产业链上各个参与者的状况。 受现代企业的部门设置、专业线管理架构的影响,企业完整的“生产线”被各部门分割,数据散落在由各部门管理的系统中,这就是大型企业通常的业务和数据管理的现状~~“职责分割、数据分散”。那么,如何反映企业整体的发展现状呢?通常是公司月度经营分析会上,财务部门的分析报告中,汇报公司的总体情况,而市场、集团客户等部门的报告分别汇报本专业条线的经营情况。曾经出现的情况就是财务部门汇报公司总体利润下降,而各业务部门纷纷完成任务形势一片大好的反差。老板心里纳闷~~“你们都完成了任务,敢情就我没完成任务?”联通重组以来,顶着来自省里还有其他专业的压力,一直在推行数据的集中。信息化部把各省、各系统中的数以亿计的用户明细数据在集团层面进行了集中存储,并经过统一的规则加工数据,再加上后来的分析应用,不仅使每个月统计的用户发展数据更加真实了,还发现地市层面违规经营、业绩造假的行为。集团董事长召开全国地市级工作会议,点名批评、撤换了几个地市老总。当时,地市老总还在云里雾里~~“我都没有这么详细的数据,董事长怎么知道的?”这就是数据在打破部门和省分之间的壁垒,使领导层能纵观企业真实情况,“知其然,知其所以然”方面发挥的至关重要的作用。近两年来,联通通过与外部公司的合作,使用脱敏的用户标签数据为企业创造了真金白银的实际价值,“数据”的应用价值日益突出,真正成为企业的又一宝贵资源。而之前,企业内部并没有这么一个专门的部门是站在全局的角度,承担起“数据资源”管理者的角色的,这就是成立“数据中心”的初衷,也是其定位和义不容辞的责任。联通数据中心的成立,是“数据线”这个弱势专业有史以来摆脱依附关系成为独立二级部门的第一次,也是对于联通信息化部门实践数据集中整合、应用,支撑公司管理方面取得成果的高度肯定。说起这个,数据线工作的人都会有深深的共鸣,这里面有多少苦衷啊。2. 主动还是被动?都是“支撑”惹的祸“数据中心”脱身于信息化部门,而信息化部门的基本定位就是“支撑”,就是要“有求必应”。我们熟悉的场景是每个月的那么几天,业务部门的人员为了写分析报告,需要些报表以外的数据进行分析,给数据部门打电话,然后心急火燎地等待他们提供的数据结果。另一场景,数据部门的人员被各部门各种的数据需求折腾得团团转,为了提供数据,加班到天亮。曾经有负责数据服务的处室,在总结年度工作时用到的数据是“提供报表上万张”。经分系统在用户的坚持下,开发了大量内容相近、格式不同的报表。一方面是用户层出不穷的需求无法满足,另一面却是系统里大量的报表没有人访问。因为用户无法自己获取数据,日常数据服务工作显得相当被动。其实从内容上看,一个企业的数据是唯一的,只是各部门因为关注的角度不同,提出了不同的展现要求,实际上在数据层面有较高的重叠性。如果想要在减少需求量的同时,提高用户满意度,就需要数据管理部门的人员具备高度的综合能力,这个人不仅要熟悉公司的业务、流程、部门的职责分工,还要有很好的沟通能力,能够正确理解、综合、引导用户的需求,然后在总体框架下将整合后的、被验证过的需求在系统中固化。如果能力强,从个人层面,还是可以主动地做一些事情的。但是,要想改变数据工作的被动局面,就需要数据管理部门不再局限于“支撑”的角色,而是应该站在”数据资源管理者”的角度,主动地从数据、应用、管控、系统四个方面,形成一个体系化的数据管理架构,并指导日常工作和系统建设。 上图是2009年联通开展的数据管理体系研究工作的成果,是对数据工作的一次很好的总结和提升。它是数据管理体系L0架构,揭示了数据管理工作的组成部分以及各个部分之间的关系。与其他专业线不同,数据专业的管理核心是”数据”,数据质量、生命周期和安全管理都是核心的管控内容,而组织(人员、制度)和系统是数据产生价值的基本保障。数据、应用、管控、系统四个方面的内容缺一不可,同时又存在相互关联、不断优化的过程(流程),绝对不是建几个系统那么简单,这也是数据专业管理的难度所在。 上面这张图就是对数据工作的流程很好的诠释,数据部门要想扭转被动的局面,首先必须有自己完整的架构(数据、应用、系统、流程、管理制度)。而这一架构的形成,是需要通过以下4个步骤:正确评估自身能力现状;找到公司业务战略、目标对数据专业的期望和差距;有选择性地确定数据工作的战略目标和阶段性计划后组织实施的;在完成阶段性计划之后,还需要评估能力提升的结果,以便对现状形成新的评价,循序渐进,有效积累。信息化的同事对于数据、应用、系统这三项内容都容易理解,但是,对于制度和流程就不太容易理解了。制度就是游戏规则,规定了该谁做,做什么,怎么做,做到什么程度。流程则是为了明确一件工作的步骤和涉及的部门之间的关系。目前流程的缺失带来太多的问题,常见的场景就是一项业务已经下线了,我们的系统中还在展示;新的业务已经为公司创造价值了,其收入还没有在财务报表中单独体现,不能及时反映这项业务的发展状况;系统中数据和报表功能已经具备了,业务部门还在要求数据部门人工提供数据,用户的需求无法及时传递到建设环节。
解决这些问题的根本就是必须形成闭环的数据工作流程,在数据生产、服务、建设、维护内部各个环节的有效沟通的同时,加入到公司运营、网络、管理的前端环节,第一时间参与产品策划、基建计划、科目调整等前期工作,才能确保数据工作的有效积累和正常运转。
3、谁在用数据?他的核心需求是什么?在清楚了定位和工作内容之后,首先要明确的就是工作目标,而目标的确定就需要了解数据的使用者是谁,他们的核心需求是什么。那么,谁是数据的需求方呢?站在企业经营的角度看,通常把数据需求分为:内部需求和外部需求。具体包括:(1)内部需求是数据服务于企业管理的职责所在。从管理层级上看,包括集团及分子公司、省级分公司;从管理职责上分就是公司管理层、职能部门、基层操作人员。管理层的诉求就是通过数据掌握公司运营的整体情况,知道“发生了什么?什么是主要原因?我应该去找谁?”你给我10个指标都多,因为这10个指标也许是反方向变化的,我要自己判断哪个是核心指标。管理层需要的是“简洁但不简单”,这个要求也是最高的。“如何让领导的桌面变得简洁?”如果这样的问题你没有想过,领导层对你的工作就很难满意。满足领导层需求的最好办法就是提供综合指数,就像是温度计,或者上证指数,一个指标就能纵览全局。而这一个指数背后是高度综合的评价体系,需要专门的研究与大量的实践检验。 (上图为DW1.0设计的领导首页UI规范,这是一个工作台,包括:问题发现、任务指派和问题反馈三个功能。中间是对目前公司当月总体情况的评价结果,雷达图中显示综合评价指标池中业务发展、财务状况、企业运营、创新能力四类指标值与目标值的差距,并支持预警提示和问题的下钻探索。页面下方,是热点信息和信息反馈的连接,支持领导任务指派和问题反馈。)职能部门是我们打交道最多的,他们的诉求就是获取本专业的数据支持日常管理。应用最多的就是每月的经营分析,有的部门使用的是自己的报表体系,有的部门基本靠数据部门支撑,有的部门基本没有什么可用的数据,有的部门干脆重新建立了自己的系统进行模型沉淀。从数据的应用层次看,我们能够提供给职能部门使用的还停留在数据的粗加工层面。“哪个是我们最赚钱的产品?哪些是我们含金量最高的用户?我们应该采用什么样的策略?我们采取的措施收效如何?”太多的问题需要用数据来回答。现在是离开数据部门的后台提数,职能部门的人自己基本拿不到数据,做不了事情。什么时候他们能自己取数自己分析,什么时候职能部门的用户满意度就能提升了。基层操作人员是与用户最接近的环节,他们能够用到的数据确实非常少。近年来的激发基层单元活力的工作,对数据服务于基层提出了更多的要求。但是,一个基于产品线的用户级粒度的收入数据,与一个基于管理主体的成本数据,怎么能够支撑一线人员的资源配置和绩效管理?数据层面为基层人员做的还非常少。最后为我们的用户说几句吧,如果我是一个世界500强的用户,第一次走进联通的营业厅办业务,联通能不能第一时间给我提供大客户级的服务而不要等我给联通创造了多少收入之后才发现我的价值?如果我使用了联通10年以上的宽带业务,联通能不能辨识出我的价值,给我提供VIP级的一体化服务?联通能不能通过我喜欢的方式、在我方便的时间、通过更加便捷的手段,推荐给我贴心的服务,而不是关注于挖掘我的隐私?以上用户的诉求,背后都是大量的数据作为支撑的。公司经营策略中说了多少年的“以客户为中心”,但是从数据指标体系上看,仍然是“以产品为中心”。数据层面确实应该为我们的用户做点什么了。 上面这张图,帮助我们换个角度去思考我们的工作目标,我们应该站在数据的使用者的角度,考虑应该做什么,能做什么,做了些什么,形成我们的工作目标。不能再固守传统的工作模式,数据工作需要总结和创新。(2)外部需求是数据服务于社会,为企业创造价值的体现。近年来,由于联通数据集中的优势,与招商、蚂蚁金服多家企业进行合作,开拓了手机终端、用户信用指数等多项应用,为企业创造了新的收入来源。(我不了解的工作,没有发言权)“去年9月国务院印发《促进大数据发展行动纲要》称,国家政府数据统一开放平台将在2018年底前建成,率先在气象、环境、信用、交通、医疗、卫生等20余项重要领域,实现公共数据资源合理适度向社会开放。”“在政府和市场的双重催动下,那些原本封存在服务器里的陈年数据,成为一座座蕴藏丰富的“金矿”,兴奋的企业和研究人员一边着手搜寻数据,一边将有价值数据按需筛选出来重构。然而,能真正做深度挖掘的企业并不多,这一领域正在等待着“杀手级”应用的出现,助推金融、医疗健康、零售业、制造业等各行业产生根本性的变革。”~《大数据的痛点》联通正经历着和社会上其他领域一样的探索过程,首先是完成了自身数据的集中整合,接下来就是考虑外部数据整合和应用的事情。对于联通而言,外部用户包括:政府主管部门、资本市场监管和审计机构,有意向的合作伙伴。对外服务合作,特别是收费服务,产品化的要求也就更高。另外,作为一个国企有它必须承担的社会责任,联通的大数据应用也许能够在治理交通拥堵、解决看病难等社会问题、提升居民幸福指数方面发挥点儿自己的作用。各行业的大数据都有同样的感觉,目前缺少“杀手级”的应用。个人认为,“杀手级”应用首先应该是基于大数据的分析预测能力与个性化需求相结合的结果,比如:高德导航提供每条路的拥堵峰值的预测,用户输入出行计划时,就可以预测到一天甚至一周分时段的拥堵情况,选择出行时间,而不是已经在路上了,再纠结于选择哪条路。再比如,最近微信发布的电子发票功能,在为用户解决实际问题,提高效率的同时,撬动企业级的应用,从个人应用深入到企业内部,让银行进一步感觉无力。另外,最近很高兴地收到了高德地图推出的早高峰的预警信息。我想无论怎样的应用,都要站在亲身体验的角度,问问自己需要的是什么,再用负责任和踏实的态度,沉下心来把问题解决到最好,就不会被评价成“简单粗暴”了。4、什么东西需要系统来实现?~~复制、流程、积累,归根到底还是积累最近接连几次有其他部门的朋友跟我抱怨,现在提一张报表的需求需要很长的时间,跟新的同事沟通多次根本不知道我们想要什么,真是无语。这样的事情已经是人员变动之后的常态了。小的事情看,无论是市场部的分析人员、信息化部的需求管理人员、厂商的开发人员,换了人,就会出现一段时间“归零”的状况。大的事情看,人换了,之前的工作没有积累,后来的人根本不明白之前工作做到什么程度了,这项工作似乎也“归零”了。另一个场景,每个月市场部分析人员获取数据编写分析报告,经营分析会开过之后,就“尘埃落定”了。数据部门加班为市场部人员提供的数据及材料,每年都花费了大量的费用。而这些支出到底创造了什么价值?是不是就是为了领导听起汇报来赏心悦目?我们真的需要坐下来好好想想了。曾经见过一个市场部的同事,使用Excel做了一个很复杂的模板,就为了把每月的数据汇总成逐月的数据,然后计算同比、环比、构成、绘制趋势图,而这些东西,用技术手段很容易实现的。为什么他们不把这个模板变成系统能力,让系统帮他?之前曾经有技术弟跟我说,现在懂业务的人才是最有价值的,没有技术实现不了的事儿,主要是要知道用技术做什么。再好的技术也要想好了要做什么,能做什么。个人认为,系统要做的事情就是复制、流程和积累,人都没有解决的问题,系统也不可能替你解决。如果你已经拥有成熟的模板,系统就可以把它复制用于各月、全国,在提高效率的同时,避免了人为操作的错误。如果你制定了完善的闭环流程,系统就能帮助你严格地执行。但是,最最有价值的还是积累,不仅数据应用、流程的积累,还有固化在系统中的“知识”的积累。它帮助后来的人熟悉数据,也不会因为人员的变动让工作归零。“积累”,是需要时时刻刻想到的事儿。 上面这张图,从大数据应用价值、系统能力层次的角度显示了能力积累的层级,也帮助我们很快地定位到我们目前能够达到的层级,清楚自己努力的目标。我们是在满足于提供数据粗加工的原材料,还是已经嵌入到企业的生产环节中,形成了商业合作模式?5、数据专业发展的关键是什么?~~人,还是人。从2008年联通公司重组到2012年数据中心成立,经过了4年的时间,期间多少艰辛不用多说。(此处略去301个字。)做什么事儿也离不开人,特别是数据专业,需要一批懂数据、用数据、踏实肯干、耐得住寂寞的人,团队才是最宝贵的资源。而人才队伍的建设必须具备的条件包括:(1)支持优胜劣汰的干部任免制度;(2)支持留住最优质的员工薪酬体系;(3)帮助员工快速成长的有效的培训交流、知识积累机制;(4)支持我们拥有竞争力的自主开发团队的薪酬体系;(5)支持我们选择最优质的合作伙伴的招标流程;(6)合作伙伴意识到自身的不足,专心积累,认真做事,和我们一起成长。6、总结最后,按照“自己的事儿、别人的事儿、老天爷的事儿”的分类方法,说说我们能做点儿什么“自己的事儿”吧:(1)首先要有稳定的数据管理架构,包括了数据、应用、系统、制度。这样的架构与公司战略目标相结合,形成演进路线和年度工作目标,通过年度目标的达成,循序渐进地逐步实现。数据管理架构需要在数据中心内部(集团、省级分公司),以及公司管理层、信息化部内部、其他业务部门之间达成共识,并坚定地、不打折扣地一起去推进实施。(2)明确岗位职责和分工界面(集团、省级分公司),并保持相对稳定,避免“临时的因事儿设岗”。定期组织员工培训、沟通,做好知识传递、信息共享,年度工作目标在员工层面达成共识,使新来的员工尽快进入新角色。通过专题研究组的形式邀请省公司参与数据的能力建设,调动省公司层面的积极性,养成数据中心人人“看数据、用数据”、“发现问题、解决问题”的良好习惯,做好自我完善、形成有效积累,形成“成长型”数据专业团队。(3)建立定期的用户(数据服务对象)沟通制度,主动介绍我们的数据架构和系统能力的提升情况,职责分工及年度工作目标,在用户层面达成共识。引导用户更多地使用系统能力并从中获益,让用户真实地感受到效率的提升,并愿意和我们一起来积累。(4)多方位整合身边资源,在完善自身能力、提高方法论、产品化水平等方面与合作伙伴达成共识,共同进步。引进咨询机构及高校专业人士参与开展综合指数、客户指标体系等多项专题研究,提升数据产品化和创新能力。(5)建立一个闭环的工作流程,使相对后端的数据流程参与到企业运营的前端流程中,以便及时反映企业的经营的变化,定期更新指标体系、报表架构及相关应用,避免前后脱节的问题,有效实施数据及应用的生命周期管理。说了这么多,一方面是因为这些年积攒的心里话不吐不快,另一方面想着这个专业能抓住机会,取得更好的发展成果。想起某位领导多少年前说的那句话~~“有为才有位”。乘着大数据的东风,我们的队伍已经再次壮大,但是,“理想很丰满,现实很骨感”,我们更应该意识到差距和肩上的责任,切忌浮躁,要脚踏实地。希望新来的同事们尽快适应,进入角色吧。
⑵ 大数据带来的大影响
大数据带来的大影响_数据分析师考试
如果把“数据化”视为信息社会的初级阶段,则名不见经传的英国科学家维克托·迈尔-舍恩伯格,用他别具洞见的天才新著《大数据时代》首次告诉我们:人类正在进入“数据颠覆传统”的信息社会中级阶段。
在此阶段,信息无所不在无所不包,其无限膨胀的天文海量催生了“统计+分类-推理分析=决策”的计算机处理程序(有点像刷卡消费一步到位,节省了算账找补等繁琐环节),悄然挑战“去粗取精、去伪存真、由表及里、由此及彼”的传统认识论模式,冥冥之中潜移默化,对我们的生活、工作与思维,对人类“阶级斗争、生产斗争、科学试验”三大实践活动产生着重大而深刻的影响。
大数据点燃
美国政府曾为定期公布消费物价指数CPI以监控通胀率,雇用了大量人员向全美90个城市的商店、办公室进行电话、传真拜访,耗资2.5亿美元搜集反馈8万种商品价格的延时信息。然而麻省理工学院两位经济学家采取“大数据”方案,通过一个软件在互联网上每天搜集50万种商品价格即时信息。2008年9月雷曼兄弟公司破产后,该软件马上发现了通胀转为通缩的趋势,而官方数据直到11月才发现。之后该软件被畅销到70多个国家。这一案例充分体现出“大数据”颠覆传统的力量和变革思维的智慧。
“小数据”时代追求精准,竭力避免不精准信息误导误判。然而95%被传统数据库拒绝接受的非结构化(非标准)数据,在“大数据”时代的模糊化数据库中发挥了重要的作用,因为数据越模糊越全面,才能有效避免误导误判。
从因果关系到相关关系的思维变革,是“大数据”颠覆传统认识论模式的关键。电脑毕竟不是人脑,电脑永远搞不懂气候与机票价格之间有什么因果关系。公鸡打鸣和天亮之间虽无因果关系,但古人通过公鸡打鸣来预报天亮却很少失败。“如果数百万条医疗记录显示橙汁和阿司匹林的特定组合对癌症治疗有效果,那就用不着通过一次次实验来探索其具体的药理机制了”。“苹果之父”乔布斯就主动试用过一些医疗记录有效但未经临床验证的疗法同癌症抗争。你可以嘲笑乔布斯“不讲科学”,但他却因此多活了好几年。
从根本上说,所谓“大数据挑战传统认识论”,其实是人类把复杂的认识过程“全部打包”给了电脑,而电脑懒得分析推理验证,只通过统计分类对比,交出“最终答案”就OK了。大数据的精髓在于变“少而精”为“多而全”,变“因果”为“相关”。当实地调研开始被数据采集所替代,当严密的实验开始被非线性逻辑所替代,当“唯一真理”开始被多项选择所替代,“大数据”就用事实向人类宣告:“知其然不知其所以然”,既是电脑望尘人脑的劣势,也是电脑超越人脑的优势!
大数据渗透大世界
不要以为“大数据”只是科幻故事或政府与科学家的“专利”。环顾四周,“大数据”早已渗透我们生活和工作的方方面面,衍生出形形色色的数据超市、数据易趣、数据交友、数据联谊、数据作坊、数据课堂、数据IB等传奇版本。从治安管理、交通运输、医疗卫生、商业贸易、批发零售、公益救援直到政治、军事、经济、金融、社会、环境、文艺、体育。
UPS国际快运公司从2000年开始通过“大数据”检测其遍布全美的6万辆货车车队,统计出各损耗零部件的生命周期,改“备份携带”为提前更换,有效预防了半路抛锚造成的严重麻烦和巨大损失,每年节省数百万美元。UPS还依靠“大数据”优化行车路线(例如尽量右转弯,避免左转弯),2011年全公司车辆少跑4828万公里,节省燃料300万加仑,减少碳排放3万公吨。
为纽约提供电力支持的爱迪生电力公司,针对每年多起电缆沙井盖爆炸造成严重事故,采取“大数据”手段统计出106种预警先兆,预测2009年可能出事的沙井盖并严加监控。结果位列前十分之一的高危井盖中,预测准确率达44%。
美国里士满市警察当局凭经验认定枪击事件往往导致犯罪高峰期,“大数据”证明这种高峰期往往出现在枪击事件后2周左右。孟菲斯市2006年启动“大数据”系统锁定了更容易发生犯罪的地点和更容易抓捕罪犯的时间,使重大犯罪发生率下降26%。
沃尔玛2004年依靠“大数据”发现了飓风前夕销量增加的各类商品,进而每逢预报便及时设立飓风用品专区,并将手电筒、早餐零食蛋挞等摆放于专区附近,明显增加了“顺便购买”的销量。
至于“大数据”的经济价值,仅需略举数例:2006年微软以1.1亿美元购买了埃齐奥尼的Farecast公司,2008年谷歌以7亿美元购买了为Farecast提供数据的ITA Software公司。同年在冰岛成立的DataMarket网站干脆专靠搜集提供联合国、世界银行、欧盟统计局等权威机构的免费信息来获利生存,包括倒卖各类研究机构公开发布的研究数据——只要找到买主,往往愿出高价!
大数据创造大金融
金融领域当然是“大数据”的主战场之一。程序化交易也许是现今最主要的“大数据”新式武器。美国股市每天成交量高达70亿股,但其中三分之二的交易量并非由人操作,而是由建立在数学模型和算法之上的计算机程序自动完成。日新月异的程序化交易只能运用海量数据来预测收益、降低风险。几乎所有银行、券商、保险、期货、QFII和投资公司都开发了自己的程序化交易工具。谁的武器更先进?竞争到最后恐怕还是比谁搜集处理的数据更海量。
一家投资基金通过统计大商场周边停车场及路口交通拥挤状况,来预测商场经营及当地经济状况,进而预测相关股价走势,最后居然拿数据统计资料换得了该商场的部分股权。
不少对冲基金通过搜集统计社交网站推特上的市场心情等信息来预测股市的表现。伦敦和加利福尼亚的两家对冲基金,利用“大数据”形成119份表情图和18864项独立的指数,向许多客户推销股市每分钟的“动态表情”:乐观、忧郁、镇静、惊恐、呆滞、害怕、生气、激愤等,以帮助和带动投资决策。
在金融机构竞相拉客理财的今天,如果能及时搜集处理海量的微博、微信、短信,自然也能从茫茫人海中及时发现怦然心动打算开户的,或一气之下打算“跳槽”的投资者。
当然,如果投资者都能通过“大数据”直接决策,将“刷卡消费”拓展成“刷卡投资”,那藏龙卧虎的分析师群体和争雄斗妍的研究报告未来还有市场吗?
大数据暗藏大隐患
像所有新生事物一样,大数据也是一把双刃剑。宏观上看,“大数据”在各个不同的领域将人类虚拟分割为“数据化”与“被数据化”两大阵营。持续发酵的“棱镜门”事件披露了美国政府长期监控全世界的“最高机密”,但美国总统、国会和政府都认定这种监控“天经地义”,是“维护国家核心利益”。虽然社会早已建立起庞大的法律法规体系来保障个人信息安全,但在“大数据”时代,这些体系正蜕变为固若金汤但可以随意绕过的“马其诺防线”。
“大数据”导致个人信息被交易、个人隐私被外泄还不算,更大的危险在于“个人行为被预测”。正如作者预言——“这些能预测我们可能生病、拖欠还款甚至犯罪的算法程序,会让我们无法购买保险、无法贷款,甚至在犯罪实施前就预先被逮捕”——也许你认为这对全社会来说无疑是好事。可是如果预测系统不完善、软硬件出差错、数据搜集处理不当、临时数据未经检验、黑客攻击、有人恶意或善意开玩笑制造假信息……导致你、你的家庭、你的亲朋好友、你的所在单位甚至你的祖国被冤枉被制裁,你还能无动于衷吗?
微观上看,即使是出于正当目的采集的“大数据”,仍可能在“扩展开发”过程中产生无法想象的副作用。例如谷歌的街景拍摄和GPS数据为卫星定位和自动驾驶仪提供了关键的支持,但同时因其有助于黑帮盗贼便捷挑选有利目标而引发了多国民众的强烈抗议。当谷歌对图像背景上的业主房屋、花园等目标进行模糊化处理后,反而引起盗贼更加注意。
无论你惊奇还是恐惧,欢迎还是躲避,关注还是漠视,理解还是拒绝,“大数据”都在加快步伐向我们走来。我们只有顺势而为,趋利避害,才不至于被这个充满机遇和挑战的新时代提前淘汰。
以上是小编为大家分享的关于大数据带来的大影响的相关内容,更多信息可以关注环球青藤分享更多干货