『壹』 数据安全怎么做,安全性更高
数据泄露将面临天价损失
近日,波耐蒙研究所发布了《2018数据泄露成本调研》,对安全事件的年度损失进行评估,首次计算出丢失100-5000万记录的数据泄露事件可致的损失金额。
调研结果显示,数据泄露事件的平均总成本在 220到 690 万美元之间,而对于上述提到的重大数据泄露事件,每百万条记录会导致高达3949万美元的损失,且这一数字会随着泄露记录数量的增加而增加,5000万条记录泄露将会让3.5亿美元巨款不翼而飞。
图:数据泄露平均成本
数据泄露不仅会造成企业经济损失,企业信誉损失影响更为深远。如果客户因数据泄露事件或需等待交易处理而放弃业务合作,就会带来更具破坏力的结果。调研结果显示,现有客户流失1%,就会对企业造成270万美元的损失;客户流失4%,企业的平均损失达到490万美元。
原来数据泄露带来的损失如此巨大!
这也印证了盘石董事长兼CEO田宁在MWC2018世界移动大会上所说的话:“和食物、衣服这些商品不同,数据是反复使用,却越来越值钱的。”
图:盘石董事长兼CEO田宁在MWC2018世界移动大会发表演讲
学会保护数据,是企业的必修课
既然数据泄露损失如此巨大,那企业更应该防患于未然,做好数据的保护工作。
调研报告中给出的解决方案指出,建立一支专业化安全团队可提前为保护数据安全做好充足准备,从而最大程度削减泄露损失。然而对于大多数企业来说,打造一支团队不是那么容易的事,尤其是中小企业。
为打造诚信安全的互联网环境,解决企业数据泄露等问题,北京盘石信用管理有限公司根据国家诚信网站数据库、火眼金睛企业征信数据库及国家公开企业基本信息、舆情信息、法院信息等数据源建立信用模型,以大数据智能分析为核心,建立了一整套互联网安全认证防护生态系统。该系统从对企业PC网站、APP、小程序的信用认证,到安全预警系统、安全信用缺失曝光系统,再到互联网信用安全技术的研究等,对企业和用户数据安全进行全方位的预防和保护。
图:盘石诚信认证生态服务体系
对于想建立互联网安全防护体系的企业来说,这样的一站式安全防护系统,能够最大程度地为他们节省成本,便捷、高效的实现企业的互联网安全,预防数据泄露,尽量减轻互联网安全问题造成的损失。
如今,网络空间已被视为继陆地、海洋、天空、外空之外的第五空间,数据作为各大公司的宝藏,也吸引着不法者的目光。如何最大程度地保护数据安全,是包括盘石信用在内的所有企业应了解并重视的问题。希望在多方的努力下,关于数据泄露的报道会越来越少,用户的隐私数据不再“裸奔”
『贰』 大数据安全的六大挑战
大数据安全的六大挑战_数据分析师考试
大数据的价值为大家公认。业界通常以4个“V”来概括大数据的基本特征——Volume(数据体量巨大)、Variety(数据类型繁多)、Value(价值密度低)、Velocity(处理速度快)。当你准备对大数据所带来的各种光鲜机遇大加利用的同时,请别忘记大数据也会引入新的安全威胁,存在于大数据时代“潘多拉魔盒”中的魔鬼可能会随时出现。
挑战一:大数据的巨大体量使得信息管理成本显著增加
4个“V”中的第一个“V”(Volume),描述了大数据之大,这些巨大、海量数据的管理问题是对每一个大数据运营者的最大挑战。在网络空间,大数据是更容易被“发现”的显著目标,大数据成为网络攻击的第一演兵场所。一方面,大量数据的集中存储增加了泄露风险,黑客的一次成功攻击能获得比以往更多的数据量,无形中降低了黑客的进攻成本,增加了“攻击收益”;另一方面,大数据意味着海量数据的汇集,这里面蕴藏着更复杂、更敏感、价值巨大的数据,这些数据会引来更多的潜在攻击者。
在大数据的消费者方面,公司在未来几年将处理更多的内部生成的数据。然而在许多组织中,不同的部门像财务、工程、生产、市场、IT等之间的信息仍然是孤立的,各部门之间相互设防,造成信息无法共享。那些能够在不破坏壁垒和部门现实优势的前提下更透明地沟通的公司将更具竞争优势。
【解决方案】 首先要找到有安全管理经验并受过大数据管理所需要技能培训的人员,尤其是在今天人力成本和培训成本不断上升的节奏中,这一定足以让许多CEO肝颤,但这些针对大数据管理人员的巨额教育和培训成本,是一种非常必要的开销。
与此同时,在流程的设计上,一定要将数据分散存储,任何一个存储单元被“黑客”攻破,都不可能拿到全集,同时对于不同安全域要进行准确的评估,像关键信息索引的保护一定要加强,“好钢用在刀刃上”,作为数据保全,能够应对部分设施的灾难性损毁。
挑战二:大数据的繁多类型使得信息有效性验证工作大大增加
4个“V”中的第二个“V”(Variety),描述了数据类型之多,大数据时代,由于不再拘泥于特定的数据收集模式,使得数据来自于多维空间,各种非结构化的数据与结构化的数据混杂在一起。
未来面临的挑战将会是从数据中提取需要的数据,很多组织将不得不接受的现实是,太多无用的信息造成的信息不足或信息不匹配。我们可以考虑这样的逻辑:依托于大数据进行算法处理得出预测,但是如果这些收集上来的数据本身有问题又该如何呢?也许大数据的数据规模可以使得我们无视一些偶然非人为的错误,但是如果有个敌手故意放出干扰数据呢?现在非常需要研究相关的算法来确保数据来源的有效性,尤其是比较强调数据有效性的大数据领域。
正是因为这个原因,对于正在收集和储存大量客户数据的公司来说,最显而易见的威胁就是在过去的几年里,存放于企业数据库中数以TB计,不断增加的客户数据是否真实可靠,依然有效。
众所周知,海量数据本身就蕴藏着价值,但是如何将有用的数据与没有价值的数据进行区分看起来是一个棘手的问题,甚至引发越来越多的安全问题。
【解决方案】 尝试尽可能使数据类型具体化,增加对数据更细粒度的了解,使数据本身更加细化,缩小数据的聚焦范围,定义数据的相关参数,数据的筛选要做得更加精致。与此同时,进一步健全特征库,加强数据的交叉验证,通过逻辑冲突去伪存真。
挑战三:大数据的低密度价值分布使得安全防御边界有所扩展
4个“V”中的第三个“V”(Value),描述了大数据单位数据的低价值。这种广种薄收似的价值量度,使得信息效能被摊薄了,大数据的安全预防与攻击事件的分析过程更加复杂,相当于安全管理范围被放大了。
大数据时代的安全与传统信息安全相比,变得更加复杂,具体体现在三个方面:一方面,大量的数据汇集,包括大量的企业运营数据、客户信息、个人的隐私和各种行为的细节记录,这些数据的集中存储增加了数据泄露风险;另一方面,因为一些敏感数据的所有权和使用权并没有被明确界定,很多基于大数据的分析都未考虑到其中涉及的个体隐私问题;再一方面,大数据对数据完整性、可用性和秘密性带来挑战,在防止数据丢失、被盗取、被滥用和被破坏上存在一定的技术难度,传统的安全工具不再像以前那么有用。
【解决方案】 确立有限管理边界,依据保护要求,加强重点保护,构建一体化的数据安全管理体系,遵循网络防护和数据自主预防并重的原则,并不是实施了全面的网络安全护理就能彻底解决大数据的安全问题,数据不丢失只是传统的边界网络安全的一个必要补充,我们还需要对大数据安全管理的盲区进行监控,只有将二者结合在一起,才是一个全面的一体化安全管理的解决方案
挑战四:大数据的快速处理要求使得独立决策的比例显著降低
“4个“V”中最后一个“V”(Velocity),决定了利用海量数据快速得出有用信息的属性。
大数据时代,对事物因果关系的关注,转变为对事物相关关系的关注。如果大数据系统只是一种辅助决策系统,这还不是最可怕的。事实上,今天大数据分析日益成为一项重要的业务决策流程,越来越多的决策结果来自于大数据的分析建议,对于领导者最艰难的事情之一,是让我的逻辑思考来做决定,还是由机器的数据分析做决定,可怕的是,今天看来,机器往往是正确的,这不得不让我们产生依赖。试想一下,如果收集的数据已经被修正过,或是系统逻辑已经被控制了呢!但是面对海量的数据收集、存储、管理、分析和共享,传统意义上的对错分析和奇偶较验已失去作用。
【解决方案】 在依靠大数据进行分析、决策的同时,还应辅助其他的传统决策支持系统,尽可能明智地使用数据所告诉我们的结果,让大数据为我们所用。但绝对不要片面地依赖于大数据系统。
挑战五:大数据独特的导入方式使得攻防双方地位的不对等性大大降低
在大数据时代,数据加工和存储链条上的时空先后顺序已被模糊,可扩展的数据联系使得隐私的保护更加困难。过去传统的安全防护工作,是先扎好篱笆、筑好墙,等待“黑客”的攻击,我们虽然不知道下一个“黑客”是谁,但我们一定知道,它是通过寻求新的漏洞,从前面逐层进入。守方在明处,但相比攻方有明显的压倒性优势。而在大数据时代,任何人都可以是信息的提供者和维护者,这种由先天的结构性导入设计所带来的变化,你很难知道“它”从哪里进来,“哪里”才是前沿。这种变化,使得攻、防双方的力量对比的不对等性大大下降。
同时,由于这种不对等性的降低,在我们用数据挖掘和数据分析等大数据技术获取有价值信息的同时,“黑客”也可以利用这些大数据技术发起新的攻击。“黑客”会最大限度地收集更多有用信息,比如社交网络、邮件、微博、电子商务、电话和家庭住址等信息,大数据分析使“黑客”的攻击更加精准。此外,“黑客”可能会同时控制上百万台傀儡机,利用大数据发起僵尸网络攻击。
【解决方案】 面对大数据所带来新的安全问题,有针对性地更新安全防护手段,增加新型防护手段,混合生产数据和经营数据,多种业务流并行,增加特征标识建设内容,增强对数据资源的管理和控制。
挑战六:大数据网络的相对开放性使得安全加固策略的复杂性有所降低
在大数据环境下,数据的使用者同时也是数据的创造者和供给者,数据间的联系是可持续扩展的,数据集是可以无限延伸的,上述原因就决定了关于大数据的应用策略要有新的变化,并要求大数据网络更加开放。大数据要对复杂多样的数据存储内容做出快速处理,这就要求很多时候,安全管理的敏感度和复杂度不能定得太高。此外,大数据强调广泛的参与性,这将倒逼系统管理者调低许多策略的安全级别。
当然,大数据的大小也影响到安全控制措施能否正确地执行,升级速度无法跟上数据量非线性增长的步伐,就会暴露大数据安全防护的漏洞。
【解决方案】 使用更加开放的分布式部署方式,采用更加灵活、更易于扩充的信息基础设施,基于威胁特征建立实时匹配检测,基于统一的时间源消除高级可持续攻击(APT)的可能性,精确控制大数据设计规模,削弱“黑客”可以利用的空间。
大数据时代已经到来,大数据已经产生出巨大影响力,并对我们的社会经济活动带来深刻影响。充分利用大数据技术来挖掘信息的巨大价值,从而实现并形成强有力的竞争优势,必将是一种趋势。面对大数据时代的六种安全挑战,如果我们能够予以足够重视,采取相应措施,将可以起到未雨绸缪的作用。
以上是小编为大家分享的关于大数据安全的六大挑战的相关内容,更多信息可以关注环球青藤分享更多干货
『叁』 大数据揭秘CEO出身比例最高的岗位
近期随着秋招旺季的深入,各行各业都参与到了如火如荼的抢人大战中。线上招聘平台暴增的岗位量和简历量,还有各大高校招聘会现场的人头攒动,都在凸显着2018年秋招季的火爆。但是小编也注意到一类岗位如同“瘟神”一样,让很多人避之不及,这就是销售类岗位。据调查,很多人理解的销售都是不体面、压力大、从业者素质低、无前途、不稳定……是最一无是处的岗位。但是真实情况又如何呢?山东本土求职招聘网站——齐鲁人才网用18年积累的大数据为您解读。
销售类岗位是妥妥的高薪岗位,跑赢山东省平均薪酬
前惠普全球副总裁孙振耀曾说:世界财富500强公司的CEO当中最多的是销售出身,第二多的人是财务出身,这两者加起来大概超过95%。销售是跟人打交道的一门学问,管理更是如此,他们有很多相通的地方,有个共同的目标就是让一些人去做一些特定的事。销售人员对市场非常了解,包括竞品的优势劣势、消费者习惯和需求等,并且有更多的人脉、资金等资源可以整合,相比其他岗位更容易向管理层发展上升或创业。
综合以上所说的各个方面,销售实乃是一个薪酬高、好就业、从业人员素质水平相对较高、发展空间大的职业。广大求职者在面对销售类岗位时大可放下心中的包袱,只要自己喜欢,果断投下你的简历吧。
『肆』 大数据急需攻克的五大世界性难题
大数据急需攻克的五大世界性难题
世界人民的健康记录:医学领域最急需的资源,人脑图谱:了解身体的各个部分如何运作,统筹世界范围内的铀原料供应:追踪武器化活动与能源供给等这些人们最关注的世界性难题,IBM、谷歌等巨头级企业已经开始对这类高难度挑战发起冲击,这很令人期待。
尽管计算性能、存储容量以及分析技术一直在不断进步,某些现实挑战对于大数据而言仍然过于庞大以至于无法应对。在今天的文章中,我们将探讨五个此类难题 ——看看如何才能将其解决。
如果大数据能够在传统领域之外进一步解决世界性难题,结果会怎么样?到目前为止,IBM、谷歌以及惠普等巨头级企业已经开始对这类高难度挑战发起冲击,其中包括分析繁忙的高速公路上到底会有多少车辆通过某条桥梁,或者计算会有多少用户查看网络浏览器中的一条小广告。谷歌公司甚至公布了一项雄心勃勃的计划,称将解决人类衰老这一历史性难题。
但仍有几大世界性难题等待着我们攻克。在某些情况下,分析所需要的数据根本无迹可寻。在其它情况下,足以应对如此庞大数据量的计算机还没有被发明出来。目前有五大课题值得我们关注。会有大数据技术企业站出来排忧解难吗?我们等待时间带来答案。
世界人民的健康记录:医学领域最急需的资源
大多数人都拥有一份电子健康记录(简称HER),不过其中的内容颇为有限——甚至只包含最近一次健康检查的基本结果。目前足以支撑全世界健康记录资料库的工具与技术已经到位。这样的全球性数据库一旦出现,制药企业就能对其进行分析以开发人民群众最急需的疫苗及药物——也就是说,根据供应链的实际需要进行优先选择。
既然前景一片光明,为什么我们还没有感受到由此带来的益处呢?这是由于目前还缺乏一套访问全球数据的可行机制。“健康记录被保存在一大堆彼此隔离的系统当中,而资料持有者没有足够的动力来分享这些信息,”分布式数据库供应商Cloudant公司联合创始人兼首席科学家 MikeMiller表示。“即使我们真的把所有数据都归拢在一起,也仍然需要通过机器学习算法及实时分析对其进行全面优化。这也正是我们目前正在努力钻研的课题。”
人脑图谱:了解身体的各个部分如何运作
人类大脑模型能够为科学研究带来巨大帮助。医生可以查看肿瘤的生长情况或者了解大脑如何通过一系列功能控制身体的其它器官。目前已经有包括欧洲人类大脑项目在内的多个科学项目尝试在未来十年之内创建出大脑模拟系统。
障碍何在?要完成这项工作,我们需要一台运算速度千倍于当前水平的超级计算机。大脑当中存在数以百万计的神经递质,而且它们彼此之间互相连通、共同数据我们所接触到的“数据”。
“这样的计算规模要求我们从传统的硅芯片领域脱离出来,迈向生物芯片时代——这是分子计算的前提条件,”曾任克林顿政府前副助理国务卿(负责运输体系技术政策)、现任霍华德大学教授的OliverG.McGee解释道。“从直观角度看,分子计算在数据管理方面的运算速度比传统硅芯片高750倍,只有这样的机制才能处理颅腹脑体系当中的关系认知奥秘。”
统筹世界范围内的铀原料供应:追踪武器化活动与能源供给
毫无疑问,在全球范围内收集任何数据都将是一项极为艰巨的任务,但追踪全球铀原料供应至少拥有其积极意义——当然,前提是所有信息碎片都能严丝合缝地被拼接在一起。
数据收集企业Connotate公司CEOKeithCooper指出,我们目前只能解决其中一部分难题,因为某些国家并没有公开其铀原料供应记录。“目前,很多铀储量丰富的国家虽然已经拥有便捷的互联网体系,但却仍然拒绝以标准化方式公布其资源流向。”幸运的是,计算宏观形势倒不太困难——毕竟将铀原料投入武器化领域的国家数量有限。
我们真正需要追踪并掌握的是全球可用铀原料当中最为宝贵的、仅占15%的浓缩铀,他解释道。“我们需要识别并追踪所有与浓缩铀相关的销售活动(通过黑市或者合法渠道)以及矿藏分布,并通过论坛、博客、监管机构及其它周边体系进行数据统计,包括各政府及非政府组织对于铀原料生产数据及开采活动的报道等。为了处理收集到的这些结果,我们还需要设计出一套智能化人机交流方案。”
全球实时犯罪数据:更加主动的警务处理能力
很多地方性执法机构已经掌握着非常丰富的犯罪数据,警务人员则可以在自己的警车内轻松访问犯罪记录数据库,从而根据犯罪嫌疑人的具体情况做出反应。
障碍何在?这些数据只包含过往的罪行,Cloudant公司的Miller表示,其中无法体现刚刚发生或者正在进行中的犯罪活动。由于无法在犯罪活动进行的过程中进行阻止,警方只能被迫采取更为被动的应对措施。
不过情况已经有所转变,Miller指出。举例来说,加利福尼亚州奥克兰市警方已经配备声学监控器用于识别枪声。技术人士将其称为 “ShotSpotter”,配合大数据分析机制即可用于追踪潜在的犯罪发生地点,警员则根据分析结论立即前往对应位置。实时犯罪数据所带来的易处并不局限于执法领域:TruliaLocal热点地图能够提供犯罪活动报告,从而帮助住房买家选择更友善、更安全的生活环境。
追踪儿童行踪:更好、更及时的AmberAlert
时至今日,我们已经拥有很多种通报失踪儿童的方式,例如美国所采用的AmberAlert系统。不过这些通告机制的最大问题在于,只能在事后发起提醒。追踪儿童位置所必要的技术已经存在,当下大部分智能手机都能通过谷歌位置报告功能将儿童的当前所在地发送给父母。与此同时,大众汽车的Car-Net以及福特汽车的MyKey应用也能在青少年驾车到达特殊地理位置时发送报告。
障碍何在?分析。数字营销企业RoundarchIsobar公司副总裁JaisonManian指出,预测技术能够助我们一臂之力。大数据厂商能够分析儿童的行为模式,当然前提是家长愿意分享相关数据。
“预测分析能够追踪儿童的日常行动模式,并在出现严重偏差时立即向父母发出警示,”他表示。只要满足警示条件,信息会被实时发出 ——这能有效阻止重大事故的发生。
以上是小编为大家分享的关于大数据急需攻克的五大世界性难题的相关内容,更多信息可以关注环球青藤分享更多干货
『伍』 大数据常见问题有哪些
为什么大数据工程师被称为企业最需要的人才?
大数据是能为企业创造价值的源动力,大数据的应用能够为企业提升订单量、交易额、合理规划商业布局以及对用户进行精准营销、挖掘深层次用户,大数据工程师是最能为企业赚钱的人,最能帮助高层指定正确战略决策的人群,因此自然会收到企业的重视。
为什么大数据工程师一入职就能成为IT金领?
最主要的原因是大数据工程师可以为企业创造价值,而不是消耗企业的成本,再有就是大数据本身对人才技术层面和行业层面都有较高的要求,普通开发人员难于胜任,因此会造成入职即成为金领的现状。
为什么大数据也要学java?
整个大数据体系是构建在java平台之上的,java作为大数据平台的基础架构支持,直接决定了大数据架构的稳定性、高效性、扩展性等等,因此只有掌握底层的java核心技术,才能够保证上层建筑的稳定运行。
为什么大数据也要学Python?
在一些数据分析领域,python提供了比较多的算法库实现,并且python由于其简单性,会加快开发速度,对很多常规的任务都能够使用python来完成,而且对于非计算机人员,python是比较容易接受和上手的语言,因此python在开发中也是较常见的语言。
关于大数据常见问题有哪些,青藤小编就和您分享到这里了。如果你对大数据工程有浓厚的兴趣,希望这篇文章能够对你有所帮助。如果您还想了解更多数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。
『陆』 大数据创业潮起商业模式尚未成型
大数据创业潮起商业模式尚未成型_数据分析师考试
近一年来,“大数据”已成为最火的IT词汇之一。2012年,美国政府实施大数据计划、联合国发布大数据报告、我国一些城市或园区也宣布发展大数据产业。EMC、IBM、Oracle等跨国IT巨头纷纷发布大数据战略和产品。
数据统计,2012年全球被创建和被复制的数据总量达2.7ZB,是2002年全球数据总量的2亿倍;其中文本、照片、音频、视频、医疗影像等非结构化内容超过85%。庞大的数据蕴含着前所未有的社会价值和商业价值,其发展潜力正被越来越多的人所看好。“数据对于任何一个企业都是竞争优势,大数据将是未来的天然资源。”IBM新任CEO说。
在大数据的未来前景被看好的背景下,已衍生了许多基于数据商用的商业模式,而此领域也正成为创业者和投资机构所追捧的热门领域。
“可能感兴趣的人”“猜你喜欢”“购买此商品的人还购买了……”在你刷微博、网上购物时,经常会在相应的位置上见到如上提示。这些看似简单的用户体验背后,其实正孕育着被誉为“新油田”大数据产业。
面对汹涌而来的巨大商机,一些初创公司已开始在此领域大胆淘金,并且还获得了风险投资的支持。3月28日,晶赞科技获得了北极光及英特尔投资的2000万美元,这是继去年百分点获得IDG投资后,又一起在大数据领域的融资案例。在资本市场低迷的背景下,发生在大数据领域的创业项目显得格外夺人眼球。
事实上,大数据在目前还是个宽泛而笼统的概念。在这个领域里创业,应该从哪个角度切入,以及如何构建自己的商业模式正成为创业者感兴趣的话题。
广告切入是初级阶段
目前,国内数据服务还处于初级阶段,新创数据服务类公司还需整合多种能力。目前来看,从广告切入是最容易获得广告主支持的一种业务模式。
“没有数据支撑的营销,往往会陷入拍脑袋进而无效果之境地。现代消费者不会轻易上钩,你需要消究他们的消费习惯及轨迹,进而找出热商机!”上海戏剧学院新媒体领域的副教授陈永东在微博中这样写到。
确实如此,广告界曾有一句名言:“我知道我的广告费有一半浪费了,但是我不知道是哪一半”正表达了数据缺失给企业带来的窘境。在百分点科技COO张韶峰看来,过去的技术很难满足广告主的需求,而现在通过技术手段完全可以解决这个问题。也就是说,让广告主花钱已能花明白了。
张韶峰表示,过去各家电商企业对其用户的了解都是片面的或者单个维度的,也就是说每个网站只了解用户在自己网站的偏好,但却无法了解用户在自己网站外的行为和偏好。“我们要做的事就是在这些网站之间搭建一个桥梁,这个桥梁能够帮助企业更好地拼出属于自己的用户兴趣拼图。”张韶峰说,一旦打通消费者在多个领域内(比如购物、资讯、交友、娱乐等)的数据,就可以通过大数据构建消费者全面的兴趣图谱,并在自己的网站上进行有针对性的营销和推送。这样,不仅能增强网站的转化率,而且也能大幅改善用户体验。
晶赞科技所做的,也正是把数据服务与广告业结合起来,其核心产品“晶赞雷达”就是在专业数据服务的基础上,实现了广告主精准再营销的广告投放系统。晶赞科技创始人兼CEO汤奇峰告诉《中国经营报》记者:“晶赞科技非常熟悉广告主的投放逻辑,我们的核心能力是建立多种模型,然后分析得出不同维度的有价值的信息,以便为广告主提供有效的投放服务。”
在北大纵横咨询集团高级合伙人刘荣华看来,上述公司的业务只能说是大数据在广告营销行业的应用,而其实大数据行业远不只这些,它的价值及影响力要大得多。可以说在未来,将不会有并不基于数据分析而做出的决策。也就是说,大数据会影响到我们社会生活的方方面面,因此,定性分析也将会成为习惯。
记者了解到:大数据包括数据来源、存储、计算处理和应用等多个环节。在汤奇峰看来,目前国内大数据的发展还处于初级阶段,新创数据服务类公司还需要有更多的整合能力,只有当产业发展到一定程度时,才能进一步地细分,而从广告切入则是最容易获得广告主支持的一种业务模式。
但张韶峰也坦陈:“目前,最难的还是让更多的企业认可数据分析的价值,并由此来提高数据服务的全社会认可度。”汤奇峰也认为:通过不同的案例来不断地告诉目标客户数据服务的价值,这还需要一个过程。
商业模式尚未成型
新创公司进入数据服务领域存在三大挑战:一是有无全面开发技术的能力及实力;二是有无足够多的钱,做数据服务需要很多基础设施、海量数据的存储、计算等,而这些都需要有硬件投入;三是要跑得比大公司快。
大数据领域的创业,看上去一片美好,但在短期内,还需要解决“向谁赚钱”和“怎么赚钱”的问题。
记者了解到:晶赞科技除了推出自己的“晶赞雷达”这个产品外,也在通过其他的产品组合,向客户提供更多的服务,比如通过向客户提供SEM(搜索引擎营销)技术支持、独立广告监测系统等产品,以获得更多的服务费收益。因此,晶赞科技的客户多是大企业,其中尤以互联网垂直领域及电商两个行业的客户居多。
而百分点科技的客户主要是电商公司,通过给电商企业提供个性化的推荐技术服务来获得收益。据张韶峰介绍,百分点科技目前主要采取两种收费模式,一是固定的基础技术服务费,即根据每家企业选用的功能及规模大小来收取基本费用;二是按效果付费,两者的收入占比大致相当。
然而在汤奇峰看来,现在对于数据服务类公司谈商业模式,还为时过早,毕竟未来的变数还可能有很多,因此还需要时间及市场去理解和消化。他认为,晶赞科技的优势在于能站在广告主的角度理解用户,从而做出快速的反应。
对于有意进入大数据领域掘金的创业者,刘荣华提醒:新创公司进入这一领域存在三大挑战:一是有无全面开发技术的能力及实力。数据服务涉及到众多技术,如果创业者只是单一技术,则只能做成某一环节;二是有无足够多的钱。做数据服务需要很多基础设施,海量数据的存储、计算等都需要硬件投入;三是新创公司还需要跑得比大公司还要快,这无疑也是一大挑战。总之,前景广阔的数据服务对于新创公司来说,既是机会也是挑战。
警惕数据来源的合法性陷阱
目前包括网络、淘宝、腾讯在内的大公司都在做用户的数据分析,用户数据获取尚处于灰色地带。因此,需要提醒的是:无论是大公司还是创业型公司,都需要平衡用户隐私及数据质量的关系。
不得不提的是,数据服务的公司还面临着一个数据来源合法性的问题。在今年的“3·15”晚会上,央视曝光了一批做精准营销服务的公司存在侵犯用户隐私的问题,从而引发了人们对数据来源合法性的关注。而这也正成为数据类创业公司的一个隐形的风险。
张韶峰认为,上述风险需要理性地看待。在他看来,技术本身并没有好坏,关键在于使用它的人。技术是把双刃剑,关键需要政府和业界建立规则,设计非常苛刻严格的法律条例和行业规则,全力打击那些提供除了用户同意的服务外,还以伤害用户的方式利用用户隐私牟利的企业。
“投资方对此也非常重视,他们在考查晶赞科技期间,就曾做了严格的审计。”汤奇峰表示,数据来源的合法性关键一点在于是否告之“用户”,用户包括广告主及普通消费者,而且在所有的设置中,必须有一项设计,就是用户有权选择退出。
“百分点科技的数据来源一部分是公司本身收集的核心数据,此外还会与服务的客户签一个数据共享的协议,目前合作的客户都签这个协议。也就是说,以百分点科技牵头建立起了一个数据共享库。”张韶峰说。
在刘荣华看来,目前包括网络、淘宝、腾讯在内的大公司都在做用户的数据分析,用户数据获取尚处于一个灰色地带。因此,创业者还需要及时提醒用户一些数据是自愿被获取。事实上,无论是大公司还是创业型公司,都需要平衡好用户隐私及数据质量的关系。
以上是小编为大家分享的关于大数据创业潮起商业模式尚未成型的相关内容,更多信息可以关注环球青藤分享更多干货
『柒』 互联网大数据现关心的是什么
楼主您好:
首先,我认为大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
其次,想要系统的认知大数据,必须要全面而细致的分解它,我着手从三个层面来展开:
第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。我会从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;从对大数据的现在和未来去洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术,技术是大数据价值体现的手段和前进的基石。我将分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。
第三层面是实践,实践是大数据的最终价值体现。我将分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
和大数据相关的理论
? 特征定义
最早提出大数据时代到来的是麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
业界(IBM 最早定义)将大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,数据体量巨大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T);第二,数据类型繁多。比如,网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。
其实这些V并不能真正说清楚大数据的所有特征,下面这张图对大数据的一些相关特性做出了有效的说明。
36大数据
古语云:三分技术,七分数据,得数据者得天下。先不论谁说的,但是这句话的正确性已经不用去论证了。维克托·迈尔-舍恩伯格在《大数据时代》一书中举了百般例证,都是为了说明一个道理:在大数据时代已经到来的时候要用大数据思维去发掘大数据的潜在价值。书中,作者提及最多的是Google如何利用人们的搜索记录挖掘数据二次利用价值,比如预测某地流感爆发的趋势;Amazon如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐,以此有效提升销售量;Farecast如何利用过去十年所有的航线机票价格打折数据,来预测用户购买机票的时机是否合适。
那么,什么是大数据思维?维克托·迈尔-舍恩伯格认为,1-需要全部数据样本而不是抽样;2-关注效率而不是精确度;3-关注相关性而不是因果关系。
阿里巴巴的王坚对于大数据也有一些独特的见解,比如,
“今天的数据不是大,真正有意思的是数据变得在线了,这个恰恰是互联网的特点。”
“非互联网时期的产品,功能一定是它的价值,今天互联网的产品,数据一定是它的价值。”
“你千万不要想着拿数据去改进一个业务,这不是大数据。你一定是去做了一件以前做不了的事情。”
特别是最后一点,我是非常认同的,大数据的真正价值在于创造,在于填补无数个还未实现过的空白。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。
? 价值探讨
大数据是什么?投资者眼里是金光闪闪的两个字:资产。比如,Facebook上市时,评估机构评定的有效资产中大部分都是其社交网站上的数据。
如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
Target 超市以20多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确的推断出孕妇的具体临盆时间,这样Target的销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠卷。
Target的例子是一个很典型的案例,这样印证了维克托·迈尔-舍恩伯格提过的一个很有指导意义的观点:通过找出一个关联物并监控它,就可以预测未来。Target通过监测购买者购买商品的时间和品种来准确预测顾客的孕期,这就是对数据的二次利用的典型案例。如果,我们通过采集驾驶员手机的GPS数据,就可以分析出当前哪些道路正在堵车,并可以及时发布道路交通提醒;通过采集汽车的GPS位置数据,就可以分析城市的哪些区域停车较多,这也代表该区域有着较为活跃的人群,这些分析数据适合卖给广告投放商。
不管大数据的核心价值是不是预测,但是基于大数据形成决策的模式已经为不少的企业带来了盈利和声誉。
从大数据的价值链条来分析,存在三种模式:
1- 手握大数据,但是没有利用好;比较典型的是金融机构,电信行业,政府机构等。
2- 没有数据,但是知道如何帮助有数据的人利用它;比较典型的是IT咨询和服务企业,比如,埃森哲,IBM,Oracle等。
3- 既有数据,又有大数据思维;比较典型的是Google,Amazon,Mastercard等。
未来在大数据领域最具有价值的是两种事物:1-拥有大数据思维的人,这种人可以将大数据的潜在价值转化为实际利益;2-还未有被大数据触及过的业务领域。这些是还未被挖掘的油井,金矿,是所谓的蓝海。
Wal-Mart作为零售行业的巨头,他们的分析人员会对每个阶段的销售记录进行了全面的分析,有一次他们无意中发现虽不相关但很有价值的数据,在美国的飓风来临季节,超市的蛋挞和抵御飓风物品竟然销量都有大幅增加,于是他们做了一个明智决策,就是将蛋挞的销售位置移到了飓风物品销售区域旁边,看起来是为了方便用户挑选,但是没有想到蛋挞的销量因此又提高了很多。
还有一个有趣的例子,1948年辽沈战役期间,司令员林彪要求每天要进行例常的“每日军情汇报”,由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。那几乎是重复着千篇一律枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少,枪支、物资多少……有一天,参谋照例汇报当日的战况,林彪突然打断他:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”大家都很茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句:“为什么那里缴获的短枪与长枪的比例比其它战斗略高?”“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高?”“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高?”林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!”果然,部队很快就抓住了敌方的指挥官廖耀湘,并取得这场重要战役的胜利。
这些例子真实的反映在各行各业,探求数据价值取决于把握数据的人,关键是人的数据思维;与其说是大数据创造了价值,不如说是大数据思维触发了新的价值增长。
? 现在和未来
我们先看看大数据在当下有怎样的杰出表现:
大数据帮助政府实现市场经济调控、公共卫生安全防范、灾难预警、社会舆论监督;
大数据帮助城市预防犯罪,实现智慧交通,提升紧急应急能力;
大数据帮助医疗机构建立患者的疾病风险跟踪机制,帮助医药企业提升药品的临床使用效果,帮助艾滋病研究机构为患者提供定制的药物;
大数据帮助航空公司节省运营成本,帮助电信企业实现售后服务质量提升,帮助保险企业识别欺诈骗保行为,帮助快递公司监测分析运输车辆的故障险情以提前预警维修,帮助电力公司有效识别预警即将发生故障的设备;
大数据帮助电商公司向用户推荐商品和服务,帮助旅游网站为旅游者提供心仪的旅游路线,帮助二手市场的买卖双方找到最合适的交易目标,帮助用户找到最合适的商品购买时期、商家和最优惠价格;
大数据帮助企业提升营销的针对性,降低物流和库存的成本,减少投资的风险,以及帮助企业提升广告投放精准度;
大数据帮助娱乐行业预测歌手,歌曲,电影,电视剧的受欢迎程度,并为投资者分析评估拍一部电影需要投入多少钱才最合适,否则就有可能收不回成本;
大数据帮助社交网站提供更准确的好友推荐,为用户提供更精准的企业招聘信息,向用户推荐可能喜欢的游戏以及适合购买的商品。
其实,这些还远远不够,未来大数据的身影应该无处不在,就算无法准确预测大数据终会将人类社会带往到哪种最终形态,但我相信只要发展脚步在继续,因大数据而产生的变革浪潮将很快淹没地球的每一个角落。
比如,Amazon的最终期望是:“最成功的书籍推荐应该只有一本书,就是用户要买的下一本书。”
Google也希望当用户在搜索时,最好的体验是搜索结果只包含用户所需要的内容,而这并不需要用户给予Google太多的提示。
而当物联网发展到达一定规模时,借助条形码、二维码、RFID等能够唯一标识产品,传感器、可穿戴设备、智能感知、视频采集、增强现实等技术可实现实时的信息采集和分析,这些数据能够支撑智慧城市,智慧交通,智慧能源,智慧医疗,智慧环保的理念需要,这些都所谓的智慧将是大数据的采集数据来源和服务范围。
未来的大数据除了将更好的解决社会问题,商业营销问题,科学技术问题,还有一个可预见的趋势是以人为本的大数据方针。人才是地球的主宰,大部分的数据都与人类有关,要通过大数据解决人的问题。
比如,建立个人的数据中心,将每个人的日常生活习惯,身体体征,社会网络,知识能力,爱好性情,疾病嗜好,情绪波动……换言之就是记录人从出生那一刻起的每一分每一秒,将除了思维外的一切都储存下来,这些数据可以被充分的利用:
医疗机构将实时的监测用户的身体健康状况;
教育机构更有针对的制定用户喜欢的教育培训计划;
服务行业为用户提供即时健康的符合用户生活习惯的食物和其它服务;
社交网络能为你提供合适的交友对象,并为志同道合的人群组织各种聚会活动;
政府能在用户的心理健康出现问题时有效的干预,防范自杀,刑事案件的发生;
金融机构能帮助用户进行有效的理财管理,为用户的资金提供更有效的使用建议和规划;
道路交通、汽车租赁及运输行业可以为用户提供更合适的出行线路和路途服务安排;
……
当然,上面的一切看起来都很美好,但是否是以牺牲了用户的自由为前提呢?只能说当新鲜事物带来了革新的同时也同样带来了“病菌”。比如,在手机未普及前,大家喜欢聚在一起聊天,自从手机普及后特别是有了互联网,大家不用聚在一起也可以随时随地的聊天,只是“病菌”滋生了另外一种情形,大家慢慢习惯了和手机共渡时光,人与人之间情感交流仿佛永远隔着一张“网”。
? 大数据隐私
你或许并不敏感,当你在不同的网站上注册了个人信息后,可能这些信息已经被扩散出去了,当你莫名其妙的接到各种邮件,电话,短信的滋扰时,你不会想到自己的电话号码,邮箱,生日,购买记录,收入水平,家庭住址,亲朋好友等私人信息早就被各种商业机构非法存储或贱卖给其它任何有需要的企业或个人了。
更可怕的是,这些信息你永远无法删除,它们永远存在于互联网的某些你不知道的角落。除非你更换掉自己的所有信息,但是这代价太大了。
用户隐私问题一直是大数据应用难以绕开的一个问题,如被央视曝光过的分众无线、罗维邓白氏以及网易邮箱都涉及侵犯用户隐私。目前,中国并没有专门的法律法规来界定用户隐私,处理相关问题时多采用其他相关法规条例来解释。但随着民众隐私意识的日益增强,合法合规地获取数据、分析数据和应用数据,是进行大数据分析时必须遵循的原则。
说到隐私被侵犯,爱德华?斯诺登应该占据一席之地,这位前美国中央情报局(CIA)雇员一手引爆了美国“棱镜计划”(PRISM)的内幕消息。“棱镜”项目是一项由美国国家安全局(NSA)自2007年起开始实施的绝密电子监听计划,年耗资近2000亿美元,用于监听全美电话通话记录,据称还可以使情报人员通过“后门”进入9家主要科技公司的服务器,包括微软、雅虎、谷歌、Facebook、PalTalk、美国在线、Skype、YouTube、苹果。这个事件引发了人们对政府使用大数据时对公民隐私侵犯的担心。
再看看我们身边,当微博,微信,QQ空间这些社交平台肆意的吞噬着数亿用户的各种信息时,你就不要指望你还有隐私权了,就算你在某个地方删除了,但也许这些信息已经被其他人转载或保存了,更有可能已经被网络或Google存为快照,早就提供给任意用户搜索了。
因此在大数据的背景下,很多人都在积极的抵制无底线的数字化,这种大数据和个体之间的博弈还会一直继续下去……
专家给予了我们一些如何有效保护大数据背景下隐私权的建议:1-减少信息的数字化;2-隐私权立法;3-数字隐私权基础设施(类似DRM数字版权管理);4-人类改变认知(接受忽略过去);5-创造良性的信息生态;6-语境化。
但是这些都很难立即见效或者有实质性的改善。
比如,现在有一种职业叫删帖人,专门负责帮人到各大网站删帖,删除评论。其实这些人就是通过黑客技术侵入各大网站,破获管理员的密码然后进行手工定向删除。只不过他们保护的不是客户的隐私,而大多是丑闻。还有一种职业叫人肉专家,他们负责从互联网上找到一个与他们根本就无关系用户的任意信息。这是很可怕的事情,也就是说,如果有人想找到你,只需要两个条件:1-你上过网,留下过痕迹;2-你的亲朋好友或仅仅是认识你的人上过网,留下过你的痕迹。这两个条件满足其一,人肉专家就可以很轻松的找到你,可能还知道你现在正在某个餐厅和谁一起共进晚餐。
当很多互联网企业意识到隐私对于用户的重要性时,为了继续得到用户的信任,他们采取了很多办法,比如google承诺仅保留用户的搜索记录9个月,浏览器厂商提供了无痕冲浪模式,社交网站拒绝公共搜索引擎的爬虫进入,并将提供出去的数据全部采取匿名方式处理等。
在这种复杂的环境里面,很多人依然没有建立对于信息隐私的保护意识,让自己一直处于被滋扰,被精心设计,被利用,被监视的处境中。可是,我们能做的几乎微乎其微,因为个人隐私数据已经无法由我们自己掌控了,就像一首诗里说到的:“如果你现在继续麻木,那就别指望这麻木能抵挡得住被”扒光”那一刻的惊恐和绝望……”
和大数据相关的技术
? 云技术
大数据常和云计算联系到一起,因为实时的大型数据集分析需要分布式处理框架来向数十、数百或甚至数万的电脑分配工作。可以说,云计算充当了工业革命时期的发动机的角色,而大数据则是电。
云计算思想的起源是麦卡锡在上世纪60年代提出的:把计算能力作为一种像水和电一样的公用事业提供给用户。
如今,在Google、Amazon、Facebook等一批互联网企业引领下,一种行之有效的模式出现了:云计算提供基础架构平台,大数据应用运行在这个平台上。
业内是这么形容两者的关系:没有大数据的信息积淀,则云计算的计算能力再强大,也难以找到用武之地;没有云计算的处理能力,则大数据的信息积淀再丰富,也终究只是镜花水月。
那么大数据到底需要哪些云计算技术呢?
这里暂且列举一些,比如虚拟化技术,分布式处理技术,海量数据的存储和管理技术,NoSQL、实时流数据处理、智能分析技术(类似模式识别以及自然语言理解)等。
云计算和大数据之间的关系可以用下面的一张图来说明,两者之间结合后会产生如下效应:可以提供更多基于海量业务数据的创新型服务;通过云计算技术的不断发展降低大数据业务的创新成本。
36大数据
如果将云计算与大数据进行一些比较,最明显的区分在两个方面:
第一,在概念上两者有所不同,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构,才能得以顺畅运营。
第二,大数据和云计算的目标受众不同,云计算是CIO等关心的技术层,是一个进阶的IT解决方案。而大数据是CEO关注的、是业务层的产品,而大数据的决策者是业务层。
详情:http://ke..com/view/9424571.htm
『捌』 “大数据杀熟”体现了哪些最深层的问题
中国的移动消费和移动支付这些年发展势头迅猛,也有人执着于现金支付,不希望自己每天的行为轨迹掌握在一些商业公司手里。
近日,网络公司董事长兼CEO李彦宏在2018中国发展高层论坛上有关中国人愿意用隐私交换便捷性的一段发言,也在舆论场上引发争议。李彦宏发言有当时的语境,但遭致网友的质疑。
越大的网络平台,越要理解用户对自身权利保护的无力感和“集体焦虑”,审慎面对公众的授权,小心呵护公众的信任。