导航:首页 > 网络数据 > 大数据时代书摘

大数据时代书摘

发布时间:2023-05-28 15:21:14

⑴ 推荐一本关于大数据,数据分析类似的书籍

1、《Hadoop权威指南》
现在3.1版本刚刚发布,但官方并不推荐在生产环境使用。作为hadoop的入门书籍,从2.x版本开始也不失为良策。
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。刚刚更新的版本中,相比之前的版本增加了介绍YARN , Parquet , Flume, Crunch , Spark的章节,非常适合于Hadoop 初学者。
2、《Learning Spark》
《Spark 快速大数据分析》是一本为Spark 初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark 的用法,它对Spark 的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。
3、《Spark机器学习:核心技术与实践》
以实践方式助你掌握Spark机器学习技术。本书采用理论与大量实例相结合的方式帮助开发人员掌握使用Spark进行分析和实现机器学习算法。通过这些示例和Spark在各种企业级系统中的应用,帮助读者解锁Spark机器学习算法的复杂性,通过数据分析产生有价值的数据洞察力。

⑵ 关于大数据时代的名言

首先你得问题可能有点大,本人才疏学浅回答的可能会有些偏颇,我只能以我的经验来和你谈谈互联网大时代几个比较重要的词句,也可以称之为经典语句吧。
在互联网时代,经典语句主要有以下这些:
1、互联网思维,网聚人的力量
2、互联网营销,无营销不销售
3、粉丝经济,得粉丝者得天下
4、用户至上,客户经济时代已经一去不复返
5、体验为王,用户体验不好的东西就没有市场
6、免费策略,只有免费的还得有价值的,用户才会觉得好
7、颠覆式创新,互联网每个人都可能颠覆所谓的大佬,谁都可以成为时代的弄潮儿
8、互联网时代,大数据营销
以上这八个方面纯凭借自己的经验之谈,简单的对互联网大时代一些具有经典意义的语句写了出来,希望能够帮到你,有什么不明白的可以继续提问,我也是互联网爱好者,希望能一起探讨互联网的点点滴滴。

⑶ 大数据的概念

大数据概述
专业解释:大数据英文名叫big data,是一种IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
通俗解释:大数据通俗的解释就是海量的数据,顾名思义,大就是多、广的意思,而数据就是信息、技术以及数据资料,合起来就是多而广的信息、技术、以及数据资料。
大数据提出时间
“大数据”这个词是由维克托·迈尔-舍恩伯格及肯尼斯·库克耶于2008年8月中旬共同提出。
大数据的特点
Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)-由IBM提出。
大数据存在的意义和用途是什么?
看似大数据是一个很高大上的感觉,和我们普通人的生活相差甚远,但是其实不然!大数据目前已经存在我们生活中的各种角落里了,举个例子,我们现在目前最关心的疫情情况数据,用的就是大数据的技术,可以实时查看确诊人数以及各种疫情数据。
大数据存在的意义是什么?
从刚才的举例中我们基本可以了解,大数据是很重要的,其存在的意义简单来说也是为了帮助人们更直观更方便的去了解数据。而通过了解这些数据后又可以更深一步的去挖掘其他有价值的数据,例如今日头条/抖音等产品,通过对用户进行整理和分析,然后根据用户的各种数据来判断用户的喜爱,进而推荐用户喜欢看的东西,这样做不仅提升了自身产品的体验度,也为用户提供了他们需要的内容。
大数据的用途有哪些?
要说大数据的用途,那可就相当广泛了,基本各行各业都可以运用到大数据的知识。如果简单理解的话,可分为以下四类:
用途一:业务流程优化
大数据更多的是协助业务流程效率的提升。能够根据并运用社交网络数据信息 、网站搜索及其天气预告找出有使用价值的数据信息,这其中大数据的运用普遍的便是供应链管理及其派送线路的提升。在这两个层面,自然地理精准定位和无线通信频率的鉴别跟踪货物和送大货车,运用交通实时路况线路数据信息来选择更好的线路。人力资源管理业务流程也根据大数据的剖析来开展改善,这这其中就包含了职位招聘的调整。
用途二:提高医疗和研发
大型数据分析应用程序的计算能力允许我们在几分钟内解码整个dna。可以创造新的治疗方法。它还能更好地掌握和预测疾病。如同大家配戴智能手表和别的能够转化成的数据信息一样,互联网大数据还可以协助病人尽快医治疾患。现在大数据技术已经被用于医院监测早产儿和生病婴儿的状况。通过记录和分析婴儿的心跳,医生预测可能的不适症状。这有助于医生更好地帮助宝宝。
用途三:改善我们的城市
大数据也被用于改进我们在城市的生活起居。比如,依据城市的交通实时路况信息,运用社交媒体季节变化数据信息,增加新的交通线路。现阶段,很多城市已经开展数据分析和示范点新项目。
用途四:理解客户、满足客户服务需求
互联网大数据的运用在这个行业早已广为人知。重点是如何使用大数据来更好地掌握客户及其兴趣和行为。企业非常喜欢收集社交数据、浏览器日志、分析文本和传感器数据,以更全面地掌握客户。一般来说,建立数据模型是为了预测。
如何利用大数据?
那我们了解了这么多关于大数据的知识,既然大数据这么好,我们怎么去利用大数据呢?那这个就要说到大数据的工具BI了,BI简单理解就是用来分析大数据的工具,从数据的采集到数据的分析以及挖掘等都需要用到BI,BI兴起于国外,比较知名的BI工具有Tableau、Power BI等;而国内比较典型的厂家就是亿信华辰了。虽然BI兴起于国外,但是这些年随着国内科技的进步以及不断的创新,目前国内BI在技术上也不比国外的差,而且因为国内外的差异化,在BI的使用逻辑上,国内BI更符合国内用户的需求。

⑷ 大数据的书摘

题记
一个真正的信息社会,首先是一个公民社会。
P13
除了上帝,任何人都必须用数据来说话。
P35
很多情况下,“数据”和“信息”两个词经常替换使用。但严格的说,数据和信息这两个概念有很大的区别:数据是对信息数字化的记录,其本身并无意义;信息是指把数据放置到一定背景下,对数字进行解释、赋予意义。……但进入信息时代之后,人们趋向把所有存储在计算机上的信息,无论是数字还是音乐、视频,都统称为数据。
P42-43
程序和数据的关系,就好像发动机和燃料,所有的程序,都是靠数据驱动的;数据之于程序,又好比血液之于人体,一旦血液停止流动,人就失去了生命,代码也将停止运行。数据的生命力,甚至比程序更持久。程序可以不停地升级、换代甚至退出使用,但保存数据的数据库却会继续存在,其价值很可能与日俱增、历久弥新。
P42
最小数据集是指通过收集最少的数据,最好的掌握一个研究对象所具有的特点或一件事情、一份工作所处的状态,其核心是针对被观察的对象建立一套精简实用的数据指标。
P57
得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。
P57
“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
P58
大数据的影响,就像4世纪之前人类发明的显微镜一样。
P61
美国这个国家,虽然年轻,但相信数据、使用数据,却有着深厚的传统。 数据被视为科学的度量、知识的来源; 没有数据,无论是学术研究,还是政策制定,都寸步难行。
P69
一起交通事故的数据可能是无序的,一年的数据、一个地区的数据也看不出太多章法,但随着跨年度、跨地区的数据越来越多,群体的行为特点就会在数据上呈现一种“秩序、关联、稳定”,更多规律就会浮出水面。
P82
数据收集和数据分析必须成为基层部门的一种文化,一种管理哲学。
P100-102
图形是解决逻辑问题的视觉方法。……人的创造力不仅仅取决于逻辑思维,还取决于形象思维。数据可视化的技术,可以通过图像在逻辑思维的基础上进一步激发人的形象思维和空间想象能力,吸引、帮助用户洞察数据之间隐藏的关系和规律。
P109
大数据时代的竞争将是知识生产率的竞争。以发现新知识为使命的商务智能,无疑是这个时代最为瞩目的竞争利器。
P116-133
联邦政府这个庞大的数据帝国,是如何运作和管理的呢?
收集法则:减负,为人民减负
使用法则:隐私,文明社会的共识
发布法则:免费,人民已经交税
管理法则:质量,互联网时代的根本
P124
美国隐私权保护重心的变迁:
19世纪:以住宅为重心
20世纪:以人为重心
21世纪:以数据为重心
P136
早在几十年以前,政府所发布数据的质量问题就备受瞩目、广受争议。这是因为,这些数据,往往都关系到行业标准的设定。……每一项新标准的发布、老标准的调整,即使只有零点零几的变化,都可能影响一个行业的竞争、改变一个产业的布局。
P162
在信息时代,计算机内的每一个数据、每一片字节,都是构成一个人隐私的血肉。信息加总和数据整合,对隐私的穿透力不仅仅是“1+1=2”的,很多时候,是大于2的。
P214
开放数据是一石三鸟,不仅服务大众,刺激经济,还调动了大众创新,为政府节省了软件开发的开支。
P239
永远不要怀疑那一小部分有思想并且持续努力的公民能够改变这个世界,事实上,人类的历史从来都是这样。
P262
掌握信息多的人,在社会竞争中处于有利地位,而信息贫乏的人,则处于不利的地位。前者向后者有偿转让信息来获取利益,无偿出让则收获善意,只有信息自由流动,各方掌握相同的信息后,彼此才能建立完全的信任。
P263
如果把信息公开仅仅解读为公众对政府一种单方面的监督,是狭隘的、片面的,信息公开也是政府的一种自我保护。可以看到,政府通过信息公开有效地获得了社会的信任。
P302-303
和其他的生产要素相比,数据无疑有其独特的特点。例如,工业生产过程中的原材料,一般都有排他性,但数据很容易实现共享,而且使用的人越多,其价值越大;数据也不像机器、厂房,会随着使用次数的增多而贬值,相反,重复使用反而可能使它增值。此外,此数据和彼数据如果能有机地结合到一起,可能就会产生新的信息和知识,并且实现大幅增值。
P304
要做到“低成本、高效率”的运营以及决策正确,企业必须广泛推行以事实为基础的决策方法、大量使用数据分析来优化企业的各个运营环节,通过基于数据的优化和对接,把业务流程和觉得过程当中存在的每一分潜在的价值都“挤”出来,从而节约成本、战胜对手、在市场上幸存。
P307
基于数据的分析和竞争已经是零售业的常态,毫不夸张地说,零售业的竞争一定程度上已经成为一种基于数据的竞争,数据就是企业的财富和金矿,数据分析和挖掘能力就是企业的核心竞争力。
P313
在大数据时代,基于层级的社会控制手段将不再适用,基于流程的管理方法也有很大的局限性。……数据的开放和流动,就代表着知识的开放和流动,代表着权力的开放和流动,这种开放和流动,是多中心的、水平的。在这个时代,社会的主体结构将从“分层”转向“结网”,在网状传播的力量的不断冲击下,个人的主体价值将得到前所未有的张扬,集中在政府的权力将开始分散,权力的最终流向,是社会、是大众,是一个个独立的公民个体。大数据时代正在呼唤下一波社会化的浪潮:一个更开放的社会,一个权力更分散的社会,一个网状的大社会。
P325
今天的中国,是一个人口大国、互联网大国、手机大国,但却恰恰还不是一个数据大国。
P327-329
中国缺乏的不是可供收集的数据,也不是收集数据的手段,而是收集数据的意识。……中国人数据意识的淡薄,由来已久,甚至可以称之为国民性的一部分。
P333
收集数据、使用数据、开放数据,都是大数据时代我们中国人需要一一面对的挑战。这三大挑战,没有一个不是任重道远。但这些挑战,也是我们在大数据时代彻底摘掉“差不多先生”文化标签的重大历史机遇。如果在这个数据意义凸显的时代,我们还抓不住这些历史机遇,继续漠视数据、拒绝精准、故步自封,等待我们的,还将是一个落后的100年。
P333
由于互联网的发明,“开放”已经成为人类社会一个不可逆转、不断加速的社会思潮。如雨果所说:你可以阻挡一支入侵的军队,但你无法阻挡一种思想。在这个浩浩荡荡、不断前进的世界大潮当中,我们将发现,中国如果不跟上,我们的处境将会越来越微妙、越来越尴尬、越来越孤立。
P346
小数据只要在纵向上有一定的时间积累,在横向上有细致的记录粒度,再和其他数据整合,就能产生大的价值。从这个角度来看,大数据也可以理解为针对某个对象在时空两个维度上的“全息”数据。这种“全息”,在大数据的时代还表现为“多源”,即有多个源头在从不同方向对同一个对象进行数据记录,数据之间互相印证。
P350
在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料、生活数据自由地流动起来,准确全面应用起来,以推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。
P351
在大数据时代,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志……政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点。

⑸ 大数据时代的内容简介

维克托·迈尔·舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。
维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

⑹ 读书笔记:大数据时代

随着网络的普及、计算机运算和存储能力的提高,我们获取信息越来越容易,越来越多。绝大多数信息对我们来说可能都是噪音,或者用过一次后就被丢弃;而对有大数据思维的公司或个人来说,这些则是零散的金粉,他们可以从中挖掘出许多小数据无法得到的意想不到的结果。比如人们所用的搜索词在搜索完成之时就失去用处,Google偏偏将它们重新利用,用以改善结果的排序,用来预测流感感染情况。word语法检查,小数据下表现最好的算法在大数据下准确率却最差。谁曾想坐姿可以转化成数据,并开发成汽车防盗系统?进而扩展到盗贼识别?

大数据时代真的只有想不到,没有做不到。它深刻的变革着我们的工作、生活、甚至思维方式。

1.不是样本而是全部:得到全部数据并不那么难,而且结果更全面可靠,我们不再依赖小数据时代的随机取样、假设-实验-结论模式,取而代之的是直接对全部数据进行分析挖掘;

2.不是精确性而是混杂性:大数据时代我们不再执着于精确,而是允许一点瑕疵。我们要做的不是以高昂的代价消除所有的不确定性,而是接受这些纷繁的数据并从中获益。以谷歌翻译为例,它搜罗了所有可以利用的数据,虽然搜集的有错误翻译,但巨大的语料库优势完全压倒了缺点,使其好于布朗、微软的班科和布里尔、IBM的Candide。又如word语法检查,小数据下表现最好的算法在大数据下准确率却最差。混杂的大数据能创造比精确的小数据更好的结果!
小数据模式下,小的错误会导致极大的偏差,因此要求精确。值得注意的是,大数据的混杂性只是现实,而不是其固有特性,随着技术的发展将会被改善。

3.不是因果关系而是相互关系:千百年来,我们一直在寻找事件背后的原因。事实上,如果凡事皆有因果的话,我们就没有决定任何事的自由了。
基于大数据分析事物间的相互关系,使我们从因果串联思维变为相互并联思维。相互关系能提醒我们某些事正在发生,这些提醒非常有用。基于相关关系的预测是大数据的核心。通过找出一个关联物并监控它,我们就能预测未来。如塔吉特怀孕预测,美国折扣零售商塔吉特通过对女性消费记录分析,可以发现她是否怀孕,从而在相应阶段寄送相应的折扣券。

戏中主角分别是大数据拥有者、大数据技术公司、大数据思维的公司或个人。第一个吃螃蟹的人早已斩获良多,更多的人也开始去尝试;随着技术的发展,拥有大数据技术的公司的领先优势也越来越弱;而数据本身的价值则与日俱增。试想,一个拥有思维和技术的新公司,如何去跟一个拥有海量数据且知道什么更好的公司去竞争?
随着行业发展,数据中间商也将粉墨登场。因为有些数据的价值只能通过中间人来挖掘。航空公司不到最后一刻不会发布航班晚点,也不会告诉你何时买票最便宜,但只要有数据,你就能知道这些。还有一些公司愿意把数据给非营利机构。

大数据确实给我们带来诸多便利,使我们的生活更便利、更美好。但我们也变得越来越透明,通过你的检索词、购物、评论等就能轻易定位到精确的个人!想想就让人不寒而栗!
亚马逊监视着我们的购物习惯
谷歌监视着我们的网页浏览习惯
微博窃听到了我们心中的TA
而facebook似乎什么都知道,包括我们的社交关系网
我们时刻暴露在第三只眼下(政府除外)。

鉴于此,维克托也建议完善相关司法,制定更完整的隐私保护政策、反垄断。

值得注意的是,大数据给我们提供的不是最终答案,而是参考答案,我们不要过分信任、依赖数据给出的结果。假如一切都可以被预测,而且很精确,而我们想当然的去相信,放弃选择的权利,也会不为结果承担责任,那我们离变成机器人就不远了,人工智能控制人类也并非臆想!

而乐观的人们则会认为一个更美好的未来在像我们招手:

以下为收集内容 。

http://www.ximalaya.com/1000577/sound/412418?from_platform=weixin
【构建一个机器的你】模拟你的知识体系、行为习惯:通过拟合你在社交网络的发言、及其它信息。模拟声音:整合微信里的语音。模拟外貌:通过你发的照片等。将这些东西“导入”到一个机器,你在另一个地方被重生。它知道你所有的所有,宛如镜像孪生。
可以看电影黑镜2。

汽车若能交流 车祸或可避免
http://v.youku.com/v_show/id_XNTcyODU4NjQw.html
实现汽车对话以避免车祸,实际也是大数据的利用:通过数据化位置速度(通过摄像头传感器电脑系统)等信息,然后分析并做出预测。信息与机器结合会使人分为自然人、半自然人、机器人吧。现在的美瞳等改变人的外形,以及研究火热的脑机接口以实现通过意念控制机械,人正在与机器越来越多的整合在一起。

谷歌无人驾驶汽车
http://mp.weixin.qq.com/s?__biz=MjM5NzM5ODU2MA==&mid=200295774&idx=4&sn=&scene=1#rd
什么时候无人驾驶汽车成片的出现在杭州就好了[偷笑][偷笑]或者不用成片,就是有些地方会放着(比如某个山洞某个工厂),嗯,某些方式(某个app,某个电话或者直接与微信集合,或者快的打车,打的车都变成无人驾驶车)可以把他叫过来,然后用完之后他自己回到原来的地方。[傲慢][傲慢]这样社会多美好呀!还可以叫个车,让他把东西/人送到某个地方,就不是为自己叫车而是为他人叫……

如果视野更开阔点, 数据或许是实现人与机器交流的语言 ,,数据能挖掘我们不知道的一面,但也不要全迷信数据,将活生生的、复杂的人等同于毫无生命的一堆数据或机器就不好玩了。。

量化自我,一场二十年前无法想象的运动
http://www.36kr.com/p/204479.html#wechat_redirect

⑺ 大数据之父舍恩伯格:互联网比你更了解你

大数据之父舍恩伯格:互联网比你更了解你

牛津大学网络研究院网络监督及管理学教授,研究领域为网络经济。曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中心网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。

有100多篇论文公开发表在《科学》、《自然》等著名学术期刊上,同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。

信息权威与顾问,咨询客户包括微软、惠普和IBM等全球顶级企业。早在1986年与1995年就担任两家软件公司的总裁兼CEO,1991年跻身奥地利软件企业家前5名之列,2000年被评为奥地利萨尔斯堡州的年度人物。

机构和国家政府高层的信息政策智囊,专注于信息安全与信息政策与战略的研究,是欧盟专家之一,也是世界经济论坛、马歇尔计划基金会等机构的咨询顾问,先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。

超过两年没穿的衣服会送人,拍得不好看的照片要当即删除

大数据之父舍恩伯格:互联网比你更了解你

时代周报记者 韩玮 发自上海

舍恩伯格又要戴着他标志性的约翰·列侬式的圆眼镜来中国了。

9月25日,时代周报举办2015“影响力·中国”秋季峰会,舍恩伯格将受邀出席,讲他最擅长的大数据。

最近两年,这位数据科学领域的权威学者每隔几个月就会出现在中国,而他所到之处,无不受到媒体、读者的簇拥。

舍恩伯格之所以在国内名声大噪,主要是因为他的两本畅销书、关于大数据的先河之作—《大数据:一场将改变我们生活、工作和思考方式的革命》(Big Data :A Revolution That Will Transform How We Live, Work, and Think,中文版又名《大数据时代》)以及《删除:大数据取舍之道》(Delete: The Virtue of Forgetting in the Digital Age)。前者揭示了大数据给人类带来的巨大改变,后者则尝试探索大数据时代人类应该如何构建积极而安全的未来。

作为最早洞悉大数据发展趋势的数据科学家,舍恩伯格在国内受追捧并不奇怪。毕竟,此刻的中国—国务院刚刚印发《促进大数据发展行动纲要》,提出推动大数据发展和应用在未来5-10年逐步实现的目标及主要任务。国内的大数据产业正迎来大发展时期。

而由于大数据太火,在这个新淘金时代,人们对舍恩伯格的兴趣不再停留于他的研究,还延伸至他本人以及他获得一系列学术成就的过程。

恰好,舍恩伯格是个性格有趣而经历丰富的人。比如,他曾因不想继承家业而与父亲争执数十年,最终走上学术之路。

代码少年

“我母亲以前经营一家电影院,我每年都会问她,过去一年最好的电影是什么?她总是说,我知道,是×××。但她总是错的。”

舍恩伯格常常在演讲中提起这个例子,尽管只是为了佐证大多数人都需要数据分析工具这个观点,但无意间却把很多人的兴趣引向了他的过去。

这位如今在全球数据科学领域极具名望的科学家其实算得上是“富二代”。他出生在距离莫扎特故乡奥地利萨尔茨堡两小时车程的一个小镇上,父亲是当地的税务律师,有自己的事务所;母亲则打理着小型电影院、花店等生意。

1966年,舍恩伯格出生那年,他的父亲买来了小镇上的第一台电脑,价格不菲。当时,镇上所有人都觉得他疯了,肯定会破产。而这台巨大的个人电脑运转时发出的嗡嗡声陪伴了舍恩伯格的整个童年。

小时候,舍恩伯格喜欢看阿斯特丽德·林德格伦的童话书。这位已故瑞典作家最著名的作品是那本充满想象力的《长袜子皮皮》。而那时的舍恩伯格梦想成为发明家,因为,让想法变成现实是一件特别诱人的事。

“如果还可以和林德格伦共进午餐,我想问她,她如何激发自身的想象力?爱因斯坦说过,想象力比知识更重要。”舍恩伯格说。

读书时,舍恩伯格最喜欢的科目是物理和数学,进而又对计算机着迷。十一二岁时,他就想用那台嗡嗡作响的电脑编程。

“当时,只有大学才有计算机,我就去当地大学报了一门编程课。但老师觉得我不可能学会,就让我自己玩。于是,我便在角落里自学。”到了高中时期,这位天赋异禀的少年先后在国际物理奥林匹克竞赛和奥地利青年程序员竞赛中获了奖。

17岁时,舍恩伯格第一次触网。当时,他无意间得到一个声音耦合器,其实不过是简陋的调制解调器—使用者得把电话听筒与之连接,从而激活以声音传送方式进行的数据传输。

在此之前,舍恩伯格听说过互联网,但从没体验过。于是,他捣鼓了好几个月,试掉了一大笔电话费,最终连上了一个提供初级的邮件、论坛等商业在线服务的无线电通讯网站“The Source”。此后,舍恩伯格便一发不可收拾,对网络着了迷。

1986年,年仅20岁、没读完大学的舍恩伯格“创业”了—成立杀毒软件公司Ikarus,并开发了一款当时奥地利最畅销的软件Virus Utilities。至今,网络对Virus Utilities的介绍上写着,这是一款剽悍的杀毒软件。1991年,年轻的舍恩伯格还被评选为奥地利最顶尖的5位软件企业家之一。

这段程序员的经历为舍恩伯格的未来打下了基础。许多年后,在《大数据时代》这本书中,舍恩伯格写道,真正的数据科学家是统计学家、软件程序员、图形设计师与作家的结合体。

父与子

在舍恩伯格的学术之路上,很难绕开的一个人物,就是买来了小镇上第一台电脑的父亲。

舍恩伯格与父亲的关系并不差。至今,他记忆最深的关于父母的细节是,每天晚餐后,父亲都会耐心听他讲述那天发生的事以及他的一些想法。舍恩伯格觉得,这是父亲的“超能力”。

不过,父亲始终不希望舍恩伯格满脑子想着如何成为计算机学家,尽管他迁就儿子喜欢计算机。这位在小镇上有头有脸的税务律师总在劝说自己的孩子尽早学完法律,继承家业。在子承父业和投身计算科学之间,舍恩伯格与父亲争执了数十年,直到后者去世。

而在20岁左右的年龄,舍恩伯格还是顺从父亲,先在奥地利萨尔茨堡大学读了法学本科。据说,因为法律太无趣,这位学霸硬是在3年半里读完了7年的书。

接着,父亲要求舍恩伯格继续在法律上深造,但这个年轻人心不甘情不愿,于是便赌气地只申请了一所学校—哈佛。他觉得,自己肯定不会被录取。

收到录取通知书那天,舍恩伯格以为是朋友开玩笑,于是按照上面的电话号码打过去斥责,“这是愚蠢的玩笑!”而电话另一头却有声音说,“不,这里是哈佛。有什么能帮你吗?”

这不是舍恩伯格唯一一次“厚积薄发”。其实,在学生时代的大部分时期,舍恩伯格虽然出色,但不是最出色的那个。但到了最后一个学年,他就像突然间开了窍,过去学过的东西顿时“融会贯通”了。于是,出乎所有人包括他自己的意料,他在毕业前的最后一次考试中获得了学生生涯唯一一次的全A。

而在美国最古老的法学院哈佛法学院,舍恩伯格开始觉得自己学的法律不再像本科时那么了无生趣。尽管如此,他依然不想学成后接手父亲的公司。

有记者采访舍恩伯格时曾问,“你后来为什么当上了大学教授?”他说,“我一直想成为发明家,直到我那个一直‘逼’我接手家业的父亲有天问我,如果不想做税务律师,你想做什么时,我才下定决心当大学教授。至少,对于我父母来说,这会是一个比发明家更容易接受、更受人尊敬的工作。”

从哈佛毕业后,舍恩伯格又拿到了萨尔茨堡大学的法学博士以及伦敦政经学院的理学硕士学位,并依照对父亲的承诺,在伦敦一所大学谋得了教职。

当时,舍恩伯格的父亲面对这样的局面依然感到有些失落,最后竟然猝然辞世。父亲去世的第二天,舍恩伯格选择离开伦敦,放弃自己的事业和学术,回到自家的镇子上,做起了以前无数次拒绝的税务律师。

“我的人生,和大多数人一样,既是连贯的,同时又屡受波折。我最初喜欢物理、数学,转而对计算机产生兴趣,进而关注数据安全和数据编码,并喜欢上了研究隐私法、知识产权法以及网络法。依照这个路径,数据逐渐成为我关注的重点。但我的生活又被一次次打乱。比如,父亲的离世让我放弃了原来的事业规划,回到了老家;但一年后,我又卖掉父亲的公司,艰难地重回学术圈;后来,偶然的机会让我得以到哈佛大学肯尼迪学院任教。某种意义上说,这些波折给我制造了意想不到的困难,但也带来了意想不到的机会。”舍恩伯格告诉时代周报记者。

大数据之父

自1998年始,舍恩伯格的学术研究步入正轨。他进入哈佛大学肯尼迪学院任教,并在那里度过了10年。此后,他曾在新加坡国立大学李光耀公共政策学院做过3年副教授,借机观察亚洲的信息政策,而今则在牛津大学互联网研究院担任治理与监管专业的教授。

这10余年间,互联网飞速发展,人们开始使用手机上网、聊天、购物,完成很多过去必须线下操作的事。而这些变化都被舍恩伯格陆续记录在论著里。

2010年,在舍恩伯格组织的一次研讨会上,几乎所有参会者发言时都开始提及社会运转模式正在发生某种改变,但谁也说不出这种变化的实质是什么。当时,《经济学人》的数据编辑肯尼思·库克耶(Kenn Cukier)也在会场,他不久前刚做过一期《大数据的冲击》的特刊报道。

那场研讨会后,舍恩伯格与库克耶进行了很多次深入交谈,“然后,我们决定合写一本书,探讨大数据对于当下的意义以及大数据时代的本质”。

2012年12月,舍恩伯格与库克耶合写的《大数据时代》出版。这本大数据研究的先河之作不仅广受媒体好评,还让舍恩伯格知名度大涨。

在书里,舍恩伯格通过各种例子展现大数据带来的改变。比如,一家叫Farecast的公司通过近十万亿条价格记录来预测美国国内航班的票价。到2012年为止,票价预测的准确率达到75%,使用Farecast票价预测工具购买机票的旅客,平均每张机票可节省50美元。

“大数据的核心是预测。它通常被视为人工智能的一部分,或者说是一种机器学习。但其实,这种定义具有误导性。大数据不是要教机器像人一样思考,相反,它是把数学算法运用到海量数据上来预测事情发生的可能性。”舍恩伯格写道。

在这本书里,舍恩伯格还提出了一个广为引用的观点—大数据关注的不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。

“具体来说,大数据的目的是全面的数据收集和分析;同时,我们要明白,在数据质量和数据数量之间要有一个平衡,所以,‘不是精确性,而是混杂性’,而‘不是因果关系,而是相关关系’,这是让我们意识到,因果关系不再是解释这个世界的唯一逻辑。”舍恩伯格告诉时代周报记者。

此外,舍恩伯格还是倡导大数据商业应用的第一人。在《大数据时代》中,他指出,如今的数据已经成为一种商业资本、一项重要的经济投入,可以创造新的经济利益。而这也是他屡屡被正在大力推动大数据产业发展的中国人当作座上宾的原因之一。

在关注数据的价值之余,舍恩伯格感兴趣的另一重要领域是如何避免数据被滥用。在早于《大数据时代》出版的《删除:大数据取舍之道》一书中,舍恩伯格提出了数字时代最大的问题:互联网记住了人们希望自己忘记的东西。当遗忘成为例外,记住变成常态,人类理性决策的能力就会受到威胁。所以,在大数据时代,所有人都应该享受“被遗忘的权利”。

事实上,舍恩伯格本人早早地为自己确立了一套关于删除的生活准则。比如,那些超过两年没穿的衣服会被他送人或处理;那些拍得不好看的照片,他会当即删除。因为,“如果不删除,在数字时代,互联网可能会比你自己更加了解你”。

舍恩伯格这些新颖的想法曾一度让读者直呼开了眼界。而目前,他告诉时代周报记者,自己的兴趣点转到了小型无人机上。其实,一直以来,舍恩伯格对飞机驾驶以及基于大数据分析的无人驾驶都颇感兴趣。只是不知道,这位数据科学家未来又会在这个问题上带来怎样“让人感觉脑洞大开”的思考。

对话舍恩伯格:

“只要他们不滥用权力,不必对数据寡头反垄断”

时代周报记者 韩玮 发自上海

9月13日,在接受时代周报记者独家专访时,舍恩伯格讲述了自己对大数据的一些理解,以及收获这些理解的过程。

影响最深的人是高中物理老师

时代周报:今年暑假,以艾伦·图灵为原型的传记电影《模仿游戏》在中国上映,感动了很多人。你看过这部影片吗?艾伦·图灵是计算机科学之父,他对你从事数据科学研究是否有影响?

舍恩伯格:我看过这部电影。事实上,很多年前,我就读过一些图灵的论著。你可能记得,我以前做软件公司时就需要编码,所以,图灵的书肯定要看。

不过,影响我最深的人不是图灵,而是我的高中物理老师。他让我开始接触到熵的概念、相对论、量子理论等。对于我来说,他就像是为我打开了通往新世界的大门。

时代周报:大家都认为你是当今最重要的数据科学家之一。我特别好奇,大数据给你本人的日常生活带来改变了吗?

舍恩伯格:我是大数据服务的“大用户”。平常,我会戴苹果手表,一直以来,它为我的身体健康提供了很多帮助;我也喜欢诸如亚马逊一类的电子商务公司,同时,还经常使用谷歌地图。此外,维基网络对我来说是个难得的好帮手,它让我比过去更加容易获得有用的信息,对我的帮助很大。

时代周报:我今年曾采访过畅销书《大停滞》(The Great Stagnation)的作者、美国经济学家泰勒·考恩。在谈到对大数据的看法时,他告诉我,“大数据被高估了,因为,大多数人都不知道他们手握的这些数据要用来干什么,企业也一样。大数据能帮助我们在某些边缘地带提高效率,比如针对性的广告,但它无法改变全局。这其中,最困难的是问对问题,并且找到问题背后特定的模式,再用数据去加以匹配。这非常难以实现。”你认同他的观点吗?

舍恩伯格:我非常欣赏泰勒·考恩,《大停滞》是一本很棒的著作。我还曾引用过这本书里的一些观点。但在大数据的问题上,我觉得他的观点是错误的,或许,这是因为这方面不是他所研究的核心专业领域。

大数据可减少资源不公平的危害

时代周报:现在,大多数行业提起大数据就言必称“这是一场行业革命,要颠覆过去”。你认为,大数据真的会颠覆那些传统行业吗?

舍恩伯格:会的,这种颠覆已经发生,并在快速进行。施乐帕罗奥尔托研究中心前主管约翰·西里·布朗(John Seely Brown)就发现,过去几十年,超大型企业的寿命正在缩短。与此同时,我们看到,就在最近几年,大数据驱动、估值达到数百亿美元以上的互联网企业不断涌现。在人类历史上,没有哪个时期在比今天更多的领域,发生比今天更快的变化。

时代周报:目前,中国存在网络、阿里巴巴、腾讯三大互联网巨头,分别统治着搜索、电商、社交三个领域,他们不断吸纳着用户的网上行为数据,几乎肯定会成为中国的数据寡头。你认为,在数据层面是否需要反垄断?

舍恩伯格:我认为必要的一点是,互联网要对新的创新主体保持开放的状态。只要大企业不滥用自己的权力,将那些更小但更好的初创企业赶出市场,那么,他们就不会制造太多的威胁。所以,我更关注的是这些企业的实际行为,而非他们的规模。

时代周报:除了数据,我知道,你还对教育问题有着深入研究。今年1月,你出版了一本名为《与大数据同行:学习和教育的未来》的新书,专门探讨大数据研究在教育领域的应用,以求真正实现因材施教。而中国教育的主要问题是教育资源分配不公平,大数据能解决这个问题吗?

舍恩伯格:大数据不能从根本上消除这种不公平,但是,通过大数据的手段,我们能以相对较低的成本提供高度个性化的教育,从而减少这种不公平带来的危害。换言之,大数据能让学生以很低的成本,获得至少像“私人家教”那样的订制教育。所以,大数据可以成为改变整个游戏的因子。

以上是小编为大家分享的关于大数据之父舍恩伯格:互联网比你更了解你的相关内容,更多信息可以关注环球青藤分享更多干货

⑻ 关于互联网思维的书籍哪个最好

市面上关于互联网思维的书籍有不少,大体说的都不全,从基础理论到战略应用分了很多的类别。所以这里列举在学习互联网思维的不同阶段所需的知识点典型书籍,主要有几个阶段:理论知识、移动互联网、商业模式、媒介、大链接数据、产品经理、设计与创意、运营营销。
一、理论知识:了解互联网历史、背景和发展趋势。

1《认知盈余》 克莱舍基 《认知盈余》读书笔记:已被验证的时代潮流
3《未来是湿的 人人时代》克莱舍基 组织之困与情感依附时代——《未来是湿的》
4《从0到1》
5《长尾理论》
6《硅谷之光》
7《失控》
8《引爆点》
9《技术元素》
10《世界是平的》
11《技术垄断:文化向技术投降》
12《第三次工业革命:新经济模式如何改变世界》
13《变革中国》
14《网络素养:数字公民集体智慧和联网力量》
15《数字乌托邦:从反主流文化到赛博文化》
16《信息简史》
17《美丽新世界》
18《网络共和国》
19《奇点临近》
21《数字化生存》
22《新数字秩序的革命》
24《黑客与画家》
----------------------------------------------------------------------
二、移动互联网:了解互联网的应用范围。
1《决胜移动终端》
2《决战第三屏:移动互联网时代的商业与营销新规则》
3《移动风暴》
4《移动的帝国》
5《移动浪潮:移动智能如何改变世界》
----------------------------------------------------------------------
三、商业模式:了解互联网在商业上的应用。
1《免费:商业的未来》
2《商业模式新生代》
3《社交红利》
4《我们如何来到现在:商业、技术与金融趣史》
5《平台战略:正在席卷全球的商业模式革命》
6《需求:缔造伟大商业传奇的根本力量》
----------------------------------------------------------------------
四、媒介:了解互联网媒介的应用。
1《理解媒介:论人的延伸》
2《你不是个玩意儿:被互联网奴役的人》
3《冲击力》
4《浅薄:互联网如何毒化了我们的大脑》在读
5《消失的地域:电子媒介对社会行为的影响》
6《娱乐至死·童年消逝》 互联网时代:更娱乐的,更致死的
7《群体性孤独》
----------------------------------------------------------------------
五、大连接数据:了解数据在互联网中的应用。
1《大连接》
2《第三次浪潮》
3《爆发:大数据时代遇见未来的新思维》
4《决战大数据》
5《驾驭大数据》
6《大数据时代》
7《数据化决策》
----------------------------------------------------------------------
六、产品经理:了解互联网产品开发。
1《结网2》
2《人人都是产品经理》
3《启示录:打造用户喜爱的产品》
4《创业时,我们在知乎聊什么?》
5《产品经理手册》
6《淘宝十年产品事》
7《黏住顾客:Foursquare如何打造忠实客户群》
8《玩法变了:淘宝卖家运赢弱品牌时代》
9《跨越鸿沟: 颠覆性产品营销圣经》
10《赢在用户》
----------------------------------------------------------------------
七、设计与创意:了解互联网产品设计与广告创意。
1《只有偏执狂才能生存》
2《广告狂人》
3《商业秀》
4《乔纳森传》
5《一线之间》
6《打开创意的脑》
7《疯狂的简洁》
8《赖声川的创意学》
9《设计心理学》
10《至关重要的设计》
11《交互设计入门》
12《门后的秘密:卓越管理的故事》
13《病毒循环》《情感化设计》
14《专业主义》
15《高效能人士的七个习惯》
16《金字塔原理》 《金字塔原理》读书书摘
17《影响力》
18《思考的快与慢》
19《乔布斯传》
20《参与感》
21《颠覆式创新》
----------------------------------------------------------------------
八、运营营销:了解互联网渠道运营知识。
1《水平营销》
2《跨越鸿沟》
3《消费者行为》
4《轻公司,互联网变革中国制造》
以上是互联网思维各个阶段的学习书籍,可以选择性阅读学习。

⑼ 大数据相关的书籍有哪些,麻烦推荐一下

初级阶段:《大数据时代》
读完这本书,要求你形成大数据的概念专,对大数据有个全面的认属识和了解。
中级阶段:《失控》
用统计的方法,而不是因果的方法,预测未来,用统计的方法来对某些东西进行预测.
高级阶段:《复杂性》
指明了一个无穷叠代,即 “关系的关系的……关系”,而智能将在这里涌现,解决复杂性问题预测的关键很可能就在这里,这句话打开了一个非常广阔的前景,将象宇宙一样没有穷尽。
高级阶段(2):《量子物理史话》
停止争论吧,上帝真的掷骰子!随机性是世界的基石,当电子出现在这里时,它是一个随机的过程,并不需要有谁给它加上难以忍受的条条框框。……而统计规律则把微观上的无法无天抹平成为宏观上的井井有条。——摘自《量子物理史话》

阅读全文

与大数据时代书摘相关的资料

热点内容
如何提高自己的网络排名 浏览:571
怎么看凯立德导航版本 浏览:871
更新手机依赖文件失败 浏览:327
数据ltc是什么意思 浏览:568
顺序表存储数据结构有哪些特点 浏览:891
苹果手机在微信怎么搜索文件 浏览:375
数据库服务怎么重启 浏览:841
苹果6s通话声音太小 浏览:517
什么是数据分析法 浏览:659
多页双面文件按顺序复印如何操作 浏览:772
diskgen硬盘工具 浏览:642
后端编程哪个好 浏览:540
编程哪个软件最简单 浏览:591
山西运城疫苗用哪个app预约 浏览:413
有线网络电视机顶盒如何看直播 浏览:909
linux挂载硬盘home 浏览:964
word2010全部接受修订 浏览:802
咋找文件管理中找下载路径 浏览:967
冒险小镇怎么快速升级 浏览:573
如何修改5g手机的5g网络 浏览:486

友情链接