❶ 《智能时代》读后感
《智能时代》一书的作者是吴军,该书揭示了大数据和机器智能对于未来社会的影响。以下是我为大家整理的关于这本书的读后感,欢迎大家阅读!
在《智能时代》一书中,作者系统地讲述了大数据和智能革命相关的知识,对我触动最大的是大数据引起的思维革命、大数据对商业的影响以及智能革命对未来社会的影响这三部分的内容。
思维革命
工业革命后人们形成的思维方式是机械思维,即确定性思维。我们可以通过找到特定的模型(公式、定律),找出事物之间的因果关系,而且发现的规律往往是放之四海而皆准的。
然而这个世界是不确定的。首先当我们对世界的了解越来越细致之后,我们会发现影响世界的变量其实非常多,已经无法通过简单的方法或者公式计算出结果。
然后通过量子力学中的测不准原理,我们可以知道不确定性是宇宙的一个特性。面对不确定性的世界我们该怎么办呢?
香农在信息论中借用热力学里熵的概念,他用熵来描述一个信息系统的不确定性。香农指出,信息量与不确定性有关:假如我们需要搞清楚一件非常不确定或一无所知的事情,就需要了解大量的信息。这是一个全新的方法论:信息论建立在不确定性基础上,而想要消除这种不确定性,就要引入信息。要引入多少信息,则要看系统中的不确定性有多大。
在我们无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
大数据与商业
从工业革命开始,几次主要的技术革命都遵循相似的规律。首先,是大部分现有产业加上新技术等于新产业。或者说原有产业需要以新的形态出现。其次,并非每一家公司都要从事新技术产品本身的制造,更多的时候它们是利用新技术改造原有产业。这次以大数据为核心的智能革命也不例外,我们将看到它依然会延续这两个特点。每次技术革命都会诞生新的思维方式和商业模式,企业只有在思维上跟上新的时代,才能在未来的商业中立于不败之地。
智能革命和未来社会
大数据导致机器革命的到来,这对未来社会的影响不仅仅存在于经济领域,而是全方位的。尽管总体上这些影响是正面的,从长远看会使我们未来的社会变得更好;不过,和以唯敏往的技术革命搜塌一样,智能革命也会带来很多负面的影响(个人隐私、失业率等),特别是在它发展的初期,而这些影响很可能会持续很久。
任何一次技术革命,最初收益的都是发展它、使用它的人,而远离它、拒绝接受它的人,在很长的世界里都是迷茫的一代。在智能革命到来之际,作为人和企业指漏枝无疑应该拥抱它,让自己成为那2%的受益者;而作为国家,则需要未雨绸缪,争取不要像过去那样每一次重大的技术革命多伴随半个多世纪的动荡。
在我们还没有经历过机器在智能上全面超越人类的时代,我们需要在这样的环境里学会生存。这将是一个让我们振奋的时代,也是一个给我们带来空前挑战的时代。
作者在书中对很多基础概念和技术发展历史都有较详细的讲解,也列举了很多生动有说服力的案例。在看这本书之前也在很多地方了解过关于人工智能、大数据等方面的案例和知识。但远没有看过书后如此深刻的认识,所以推荐大家还是阅读原书。书名虽然看上去是与科技相关的,实际上与每个人都相关。提前接触和运用新的思维与新的技术也许不能保证你成为前2%的人,但至少可以让你在过程中拥有更多的机会和成功概率。
愿大家对新事物保持好奇心和热情,拥抱智能时代,为成为前2%的'人而努力。
第一次读《智能时代》,是通过朋友的豆瓣阅读邀请码下载到手机上看的。起先并没有太认真阅读,只是在下班路上随手翻几页,以为这就是写现在比较热门的关于智能设备或者智能生活方式的乏善可陈的书,毕竟书名”智能时代“给我第一印象就是如此。实际读的时候才发现,这是一本讲人的智能和计算机能否产生类似智能的书。书的原名是《on Intelligence》,本意是关于智能的讨论,翻译书名《智能时代》和副标题不是很切题,会给人错误的第一印象。
抛开书名不说,《智能时代》是我几年内读过最好的书之一,作者——杰夫霍金斯的文笔很简洁,这本书翻译的水平也很高,文中很客观和批判性地描述了智能和人工智能研究,并阐述了作者自己对智能的理解。本书一推出就获得两个诺贝尔奖得主及专业领域人士的大力推荐,考虑到霍金斯本人是企业家而不是职业科学家这一点,是十分罕见的。
我从小经常思考关于智能的问题,这本书能解答我很多疑惑,读书时那种开悟的感觉只能用醍醐灌顶来形容。还记得初一的某天下课回家,我骑着自行车,突然产生了一个疑问——我的手是怎么掌把的,我没有有意识地控制哪根手指放哪个位置啊?然后我撞了汽车。如果你和我一样,曾经思考过这类问题,那么本书绝对是你的菜。
霍金斯在书中首先回顾了当今人工智能研究的历程以及自己探索的经历,客观批判了"智能行为派",他认为智能是系统的内在属性,和外在表现无关。比如一个人在静静思考的时候,虽然没有表现出任何行为,他也是有智能的。退一步来讲,假使通过行为来判断是否有智能,当下的计算机也不合格。计算机要能识别图片,必须设计一套视觉识别算法,计算灰度、色阶、轮廓等;识别语音要设计语言算法,计算声波频率、音调、匹配语义等。图片算法和声音算法之间没有任何关联,从术语到计算过程完全不同。
但是对于大脑来说,声音和图像在大脑中的处理过程很类似,只是接受刺激的感官不同。把实验动物幼崽的视觉神经接到本来应该发育听觉的位置,这些动物都能发育出正常的视觉——而如果把计算机的摄像头接到话筒上,结果可想而之。作者并非在否定算法本身,无疑,大脑也有自己的算法,这个算法是高度抽象的,能根据信号输入的不同发展出相应的知觉。相比之下,计算机算法毫无变通的可能性。从这两点出发,作者认为以往的计算机智能研究是一条死路。
那么智能应该是什么样的?霍金斯从日常生活出发,通过对学习、记忆、回想等等行为的分解,结合脑部神经结构,提出了产生智能的"记忆——预测"框架。整个推断过程非常精彩,在此就不剧透了,以免破坏了阅读乐趣。
这个系统的核心在于"恒定表征"这样一个概念,霍金斯认为人类(或海豚猴子等其他动物)之所以能认知世界,依赖于对事物高度抽象的能力。这种抽象能力,不是指刻意训练的逻辑思维能力,而是智慧生物由大脑结构决定的固有能力。举个例子:当我看到我家的小狗,我能意识到它在附近;当我听到它熟悉的叫声,我也能意识到它在附近;甚至当我只是看到它掉在沙发上的毛,都能推断出它肯定爬上过沙发。
我并不一定直接看到它,是如何判断它是否在附近呢?这就表明我的大脑有关于这只狗的"恒定表征",不以我观测的方式转移。我认识我家的狗,无论它是蹲着还是趴着还是把脑袋藏在沙发下面,我都能意识到它的独特存在。"恒定表征"也就是人们常说的"理解"某个事物,对于计算机来说,目前的技术只能按部就班地计算,没有理解的产生,更无所谓智能。
恒定表征这个概念并非是霍金斯的原创,很多哲学家和科学家都有过类似的思想。比如大哲学家康德曾论证:人的心智拥有空间和时间的形式,独立于经验。康德称这些形式为直觉,它们是纯粹先天的知识方式,不依据经验和思想,这使理解现实成为可能。比如没有人见过完美的圆形,但不妨碍人理解正圆这个概念,因为空间的形式是先天的,是人的物理形态决定的。霍金斯的“恒定表征”,就是先天知识(人或者计算机物理结构所决定的)加上后天经验的产物。在我看来,计算机对时间和空间都没有先天的知识,如果计算机对什么有先天概念的话,那只能是频率。
不过,计算机并非不能产生智能,只是现在的科技水平不够。最初计算机的设计就是用于处理专项任务,而生命的演化是为了适应各种各样的自然环境,人和计算机"硬件"的不同,体现了自然演化和人工制造的区别。产生人类智慧的大脑,对于现在的技术水平来说,的确很难复制(就算能复制,消耗的电量是相当惊人的),并非说大脑具有什么独特的"精神"层面的东西,是计算机无法模拟的。我相信在科学家们提取出大脑的"算法"之后,人工智能的产生是必然的,十年、二十年内都有可能。
想象一下吧,具有人类智慧的计算机,不仅计算速度快,还能接上定制的感官,不仅有视觉、听觉、触觉、味觉、嗅觉,它还能具有感受磁场的"磁觉"(就像一些鱼),感受整个森林火灾可能性的"安全感",甚至感受股市变化的"发财直觉"(有些人声称自己就有,比如我妈)应用的可能性是无限多的。这也是小伙伴们改变命运,找到下一个蓝海的机会啊!至于我呢,现在就开始着手创办全球第一家”人工智能幼儿早教机构“,并非人工智能来教育人类小孩哦,而是我来教育人工智能小孩……
像我这样每天看的都是小说、历史,会不会让人觉得这个人已经老了,很颓废,不求上进?尤其在这个开口闭口必谈云计算、大数据、人工智能的年头,既听不懂又插不上话,会不会就真的落伍了呢?于是继《浪潮之巅》后,又接着看了吴军先生的《智能时代》(他的《文明之光》也同步在看,只是4本书看完还需要点时间)。没想不看不打紧,这一看,未细思,心已冷。窗外虽是阳光灿烂,心中却早已凉凉的。
作者说:“随着技术革命的发展,并非每一个人的发展机会都是越来越多的,反而可能是越来越少。”“在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只有两条:要么进入前2%的行列,要么被淘汰。”“那么大量淘汰下来的劳动力怎么办?新毕业的学生如何就业?答案是要么去从事一份工资足够低的服务性工作,要么没有工作靠领取救济过活。”多么直接,多么残酷,又多么的冷酷,然而,这就是我们要面对的现实。于是又回到狄更斯那句被引用过无数次的《双城记》中开篇的一句话:“这是最好的时代,也是最坏的时代。”
不要以为智能革命只会威胁到生产线上的工人和只需简单动脑的工作,即使在今天看来依然高大上的职业,未来也会失去工作,譬如医生、律师、编辑记者。先来看看医生,“在过去,像放射科医生这一类工作,被认为需要太多的专业技能,工作性质太复杂,不可能被机器取代。但是,今天智能的模式识别软件通过医学影像的识别和分析,可以比有经验的放射科医生更好地诊断病情,这将从根本上改变医疗行业的现状。”
具有了智能的计算机不仅能帮助诊断,还可以进行手术。“相比医生,计算机在诊断和手术等方面有三大优势:
首先,它们漏判(或者失误)的可能性非常低,也就是说它们能够发现一些医生们忽略的情况。
其次,它们的准确率很高,而且随着数据量(病例)的增加提高得非常快。
最后,也是人所不具备的,这些智能程序的稳定性非常好,它们不会像人那样受情绪的影响。”最要命的是,“这些智能程序的成本,通常不到人工的百分之一。”
再来看看律师,“位于硅谷帕罗奥图市的Blackstone Discovery公司发明了一种处理法律文件的自然语言处理软件,使得律师的效率可以提高500倍,而打官司的成本可以下降99%,这意味着未来将有相当多的律师(尤其是初级水平的律师)可能失去工作。”事实上这件事情在美国已经发生,“新毕业的法学院学生找到正式工作的时间比以前长了很多。”那么记者和编辑呢?“今天美国很多媒体的财经新闻,尤其是对公司财报的评述,其实已经是计算机产生的了。”我想类似我们央视新闻联播和《人民日报》那样的新闻就更没有问题。
有人会问:“文学作品如小说诗歌什么的总还需要人创作吧?”就在今天中午刚看到一条消息:“微软小冰通过对1920年后519位现代诗人的上千首诗经过10000次的迭代学习,小冰每学习一次的时间大约是0.6分钟,10000次需要100个小时。她至今创作了70928首诗,从中精心挑选了139首,结集出版。”也就是说你未来看到的小说或诗集有可能是机器写的。那么,再仔细想想、细思一下,还有什么工作是未来计算机做不了和不能替代的呢?包括你眼下正在干的事情。是不是不思已恐,细思,则极恐、更恐、很恐、非常恐?是否觉得有些危言耸听?
“很多人会天真地认为,船到桥头自然直,劳动力会被自然而然地分配到其他行业中去。”过去几次技术和产业革命不就是这样的吗?“但是,这种劳动力的再分配,一来需要非常长的时间(至少半个世纪),二来依赖于产生新产业。”那么,这一切究竟是怎么发生的?为什么早不来晚不来却偏偏这个时候来、偏偏让我们给赶上了?
回到吴军先生的《智能时代》这本书,还有个副题“大数据与智能革命重新定义未来”。全书一共分为七章,分别介绍了数据的作用,大数据和机器智能,机器智能的原理及其发展历程,大数据思维的核心及其重要性,大数据和机器智能与商业的关系,它们对社会正反两个方面的巨大影响。
❷ 吴军博士认为未来二十年是什么为王的时代
吴军博士认为未来二十年是数据为王的时代,出自吴军博士的课程《大数据改变未来》。
课程中说道:
在过去的五十年里,人类整个的发展根本的这个动力从科技的角度来讲,就是一个摩尔定律,什么意思呢?就是在1965年的时候,英特网公司后来的创始人摩尔先生,他提出来在今后的十几年里,半导体处理器的性能,比如说容量、计算速度和复杂程度每18个月左右可以翻一番。他也没有预想到这件事一直发生了五十年。以至于人整个人类发生了天翻地覆的变化。
可以这么讲,我们过去的整个的社会的科技进步工业进步以及这个GDP的提升都是靠这个摩尔定律,如果我们把这个摩尔定律带来的电信化从过去五十年中拿去,我们会发现我们可能GDP不但没有增加,而且还在减少。那么这是过去五十年的情况。
在今后二十年它又会往哪儿走呢?在未来的二十年里,什么决定世界经济发展的方向?我认为如果说过去五十年是摩尔定律的时代,未来二十年就是数据为王的时代。
大数据会带来机器智能,也就是说让我们的计算机变得非常聪明,以至于它超过我们人类的智能。为什么这么说呢?我们刚才讲了,计算机的发展速度本身是一个指数增长,而我们人的智能的发展速度是一个线性增长,甚至还会稍微慢一点,那么一定在某一个时间点,它会重合。
今天可能就是这个重合的时间点,那可能你又会问了,为什么正好在这个时间点上,我们会有这么多的数据?一个是互联网的收集和积累,再有一个就是今天各种传感器,各种智能设备,各种监控设备,它们无时无刻地不在为我们提供大量的数据。而在我们过去,因为存储量计算量不够的时候,我们把这些数据都抛弃掉了,不是说这些数据在过去不存在现在存在,只是说我们现在因为半导体事业的发展,我们有能力,有可能来存储和处理这样一些数据。
(2)吴军博士认为大数据加上机器智能扩展阅读:
吴军博士简介:
毕业于清华大学计算机系(本科)和清华大学电子工程系(硕士),并于1993-1996年在清华任讲师。于1996年起在美国约翰霍普金斯大学攻读博士,并于2002年获得计算机科学博士学位。
在清华和约翰霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究。他曾获得1995年的全国人机语音智能接口会议的最佳论文奖和2000年Eurospeech的最佳论文奖。
吴军博士于2002年加入Google公司,任Google研究院资深研究员。到Google不久,他和三个同事们开创了网络搜索反作弊的研究领域,并因此获得工程奖。
2003年,他和两个同事共同成立了中日韩文搜索部门。吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google期间,他领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了公司首席执行官埃里克·施密特的高度评价。
吴军博士在国内外发表过数十篇论文并获得和申请了近十项美国和国际专利。他于2005年起,当选为约翰霍普金斯大学计算机系董事会董事。
2010年,吴军博士离开Google,加盟腾讯公司,担任负责搜索业务的副总裁。并担任国家重大专项“新一代搜索引擎和浏览器”项目的总负责人。
❸ 读《智能时代》前两章有感
偶得吴军老师的《智能时代》一书,阅读该书前两章,感觉受益匪浅,尤其是通过对第二章“大数据与机器智能”的阅读,才使我对人工智能的历史有了一个大致的了解,现将感想倾诸于下。
一、“数据”概述
虽然我对人工智能的具体情况尚不了解,但大致知道现阶段的人工智能需要以大数据为基础,而《智能时代》第一章即详细介绍了数据的相关问题。
首先,“在计算机出现之前,一般书籍上的文字内容并不被看成数据,”而今天,不止书籍上的文字内容,连我们的活动,我们每天的言谈举止,喜爱偏好等,都已被看成是某种数据。
在人类社会早期,我们通过观察现象,总结数据,再从数据中提取出有用的信息,并在信息的基础上形成知识(知识具有系统性),从而指导我们的行为。我们使用数据的标准流程如下:
而在过去数据的作用之所以不被重视,“这里面有两个原因,首先是由于过去数据量不足,积累大量的数据所需要的时间太长,以至于在较短的时间里它的作用不明显。其次,数据和所想获得的信息之间的联系通常是间接的,它要通过不同数据之间的相关性才能体现出来。”而这种相关性也有待人们的发掘,吴军老师举了王进喜照片与日本投标之间的关联、谷歌用户对某节目的搜索量和该节目收视率之间的关联以及搜索趋势和流感疫情之间的关联等来说明相关性的重要。
而关于第一个原因,“在互联网出现之前,获得大量的具有代表性的数据其实并非一件容易事,在误差允许的范围内做些统计当然没有问题,但只有在很少的情况下能够单纯依靠数据来解决复杂的问题。因此在20世纪90年代之前,整个社会对数据并不是很看重。”
数据的相关性还要透过建立合适的数学模型来更好的加以利用,“要建立数学模型就要解决两个问题,首先是采用什么样的模型,其次是模型的参数是多少。”“……如果一开始模型选得不好,那么以后修修补补就很困难。因此,在过去,无论在理论上还是工程上,大家都把主要的精力放在寻找模型上。”
“有了模型之后,第二步就是要找到模型的参数,以便让模型至少和以前观察到的数据相吻合。这一点在过去的被重视程度远不如找模型。但是今天他又有了一个比较时髦而高深的词——机器学习。”(程按:既输入数据,不断调整模型,这和今天机器学习的方法类似)
“回到数学模型上,其实只要数据量足够,就可以用若干个简单的模型取代一个复杂的模型。这种方法被称为数据驱动方法,因为它是先有大量的数据,而不是预设的模型,然后用很多简单的模型去契合数据(Fit Data)。虽然这种数据驱动方法在数据量不足时找到的一组模型可能和真实的模型存在一定的偏差,但是在误差允许的范围内,单从结果上看和精确的模型是等效的,这在数学上是有根据的。从原理上讲,这类似于前面提到的切比雪夫大数定律。
当然,数据驱动方法要想成功,除了数据量大之外,还要有一个前提,那就是样本必须非常具有代表性,这在任何统计学教科书里的一句话,但是在现实生活中要做到是非常难的。……”
二、大数据和机器智能
“在2000年以后,由于互联网特别是后来移动互联网的出现,数据量不仅剧增,而且开始相互关联,出现了大数据的概念,在2000 年以后,由于互联网特别是后来移动互联网的出现,科学家和工程师们发现,采用大数据的方法能够使计算机的智能水平产生飞跃,这样在很多领域计算机将获得比人类智能更高的智能。可以说我们正在经历一场由大数据带来的技术革命,其最典型的特征就是计算机智能水平的提高,因此我们不妨把这场革命称为智能革命。当计算机的智能水平赶上甚至超过人类时,我们的社会就要发生天翻地覆的变化,这才是大数据的可怕之处。
那么为什么大数据会最终导致这样的结果,大数据和机器智能是什么关系呢?要说清楚这一一点,首先要说明什么是机器智能。”
“1946年,第一台电子计算机ENIAC诞生,这使得人类重新开始考虑机器能否有智能的问题。”
“真正科学地定义什么是机器智能的还是电子计算机的奠基人阿兰·图灵博士。1950年,图灵在《思想》杂志上发表了一篇题为《计算的机器和智能》的论文。在论文中,图灵既没有讲计算机怎样才能获得智能,也没有提出什么解决复杂问题的智能方法,而只是提出了一种验证机器有无智能的判别方法。”既让一个裁判坐在墓前和幕后的“人”交流,幕后是一台机器和一个人,如果裁判无法判断出与自己交流的是人还是机器,那么就说明这台机器拥有了和人同等的智能。
“这种方法被后人称为图灵测试(Turing Test)。计算机科学家们认为,如果计算机实现了下面几件事情中的一件,就可以认为它有图灵所说的那种智能:
1.语音识别
2.机器翻译
3文本的自动摘要或者写作
4.战胜人类的国际象棋冠军
5.自动回答问题
今天,计算机已经做到了上述这几件事情,有些时候还超额完成了任务,比如在下棋方面,不仅战胜了国际象棋的世界冠军,而且还战胜了围棋的世界冠军,后者的难度比前者高出6~8个数量级。当然,人类走到这一步并非一帆风顺,而是先走了十几年的弯路。”
鸟飞派:人工智能1.0
“据记载,1956年的夏天,香农和一群年轻的学者在达特茅斯学院召开了一次头脑风暴式的研讨会。……事实上,这是一次头脑风暴式的讨论会。这10位年轻的学者讨论的是当时计算机科学尚未解决,甚至尚未开展研究的问题,包括人工智能、自然语言处理和神经网络等。人工智能这个说法便是在这次会议上提出的。”
“人工智能这个名词严格地讲在今天有两个定义,第一个是泛指机器智能,也就是任何可以让计算机通过图灵测试的方法,包括我们在本书中要经常讲的数据驱动方法。第二个是狭义上的概念,即20世纪五六十年代特定的研究机器智能的方法。今天,几乎所有书名含有“人工智能”字样的教科书(包括全球销量最大的由斯图亚特·罗素和诺威格编写的《人工智能:一种现代的方法》一书)依然用主要的篇幅介绍那些“好的老式的人工智能”(Good Old
Fashioned)。后来那些利用其他方法产生机器智能的学者为了划清自己和传统方法的界限,特地强调自己不是用人工智能的方法。因此,学术界将机器智能分为传统人工智能的方法和现代其他的方法(比如数据驱动、知识发现或者机器学习)。当然,计算机领域之外的人在谈到人工智能时,常常是泛指任何机器智能,而并不局限于传统的方法。因此为了便于区分,我们在本书中尽可能地使用机器智能表示广义上的概念,而在使用人工智能表达时,通常是指传统的人工智能方法,甚至我们有时会强调为人工智能1.0。
那么传统的人工智能方法是什么呢?简单地讲,就是首先了解人类是如何产生智能的,然后让计算机按照人的思路去做。今天几乎所有的科学家都不坚持“机器要像人一样思考才能获得智能”,但是很多的门外汉在谈到人工智能时依然想象着“机器在像我们那样思考”,这让他们既兴奋又担心。事实上,当我们回到图灵博士描述机器智能的原点时就能发现,机器智能最重要的是能够解决人脑所能解决的问题,而不在于是否需要采用和人一样的方法。
为什么早期科学家们的想法会和今天的门外汉一样天真呢?这个道理很简单,因为这是根据我们的直觉最容易想到的方法,在人类发明的历史上,很多领域早期的尝试都是模仿人或者动物的行为。比如人类在几千年之前就梦想着飞行,于是就开始模仿鸟,在东方和西方都有类似的记录,将鸟的羽毛做成翅膀绑在人的胳膊上往下跳,当然实验的结果都可想而知。后来人们把这样的方法论称作“鸟飞派”,也就是看看鸟是怎样飞的,就能模仿鸟造出飞机,而不需要了解空气动力学。事实上我们知道,怀特兄弟发明飞机靠的是空气动力学而不是仿生学。在这里,我们不要笑话前辈来自直觉的天真想法,这是人类认识的普遍规律。
在人工智能刚被提出来的时候,这个研究课题在全世界都非常热门,大家仿佛觉得用不了多长时间就可以让计算机变得比人聪明了。遗憾的是,经过十几年的研究,科学家们发现人工智能远不是那么回事,除了做出了几个简单的“玩具”,比如让机器人像猴子一样摘香蕉,解决不了什么实际问题。到了20世纪60年代末,计算机科学的其他分支都发展得非常迅速,但是人工智能研究却开展不下去了。因此,美国计算机学界开始反思人工智能的发展。虽然一些人认为机器之所以智能水平有限,是因为它还不够快、容量不够大,但是,也有一些有识之士认为,科学家们走错了路,照着那条路走下去,计算机再快也解决不了智能问题。”
明斯基在《语义信息处理》引用了巴希勒使用过的一个例子: The pen was
in the box和The box was in the pen,来说明目前人工人工智能的局限性。
“这两句话会得到相同的语法分析树,而仅仅根据这两句话本身,甚至通篇文章,是无法判定pen在哪一句话中应该作为围栏,在哪一句话中应该是钢笔的意思。事实上人对这两句话的理解并非来自语法分析和语意本身,而是来自他们的常识或者说关于世界的知识(world knowledge),这个问题是传统的人工智能方法解决不了的。因此,明斯基给出了他的结论:‘目前’(指1968年)的方法无法让计算机真正有类似于人的智能。由于明斯基在计算机科学界具有崇高的声望,他的这篇论文导致美国政府削减了几乎全部人工智能研究的经费,在之后大约20年左右的时间里,全世界人工智能在学术界的研究是处于低谷的。”
另辟蹊径:统计+数据
“到了20世纪70年代,人类开始尝试机器智能的另一条发展道路,即采用数据驱动和超级计算的方法,而这个尝试始于工业界而非大学。
在那个年代,IBM在全世界计算机乃至整个IT产业可以说是处于独孤求败的地位。……这时,IBM考虑的不能再是如何占有更大的市场份额,而是如何让计算机变得更聪明。
1972年,康奈尔大学的教授弗雷德·贾里尼克(Fred Jelinek,1932-2010)到IBM做学术休假,正好这时IBM想开发“聪明的计算机”,贾里尼克就“临时”负责起这个项目。至于什么是聪明的计算机,当时大家的共识是它要么能够听懂人的话,要么能将一种语言翻译成另一种语言,要么能够赢得了国际象棋的世界冠军。贾里尼克根据自己的特长和IBM的条件,选择了第一个任务,即计算机自动识别人的语音。”
贾里尼克认为语音识别是一个智能问题,而是一个通信问题,既人发出语音是一个大脑编码的过程,编码完成,经过传播,传入听者的耳朵,听者接受并理解则是一个解码的过程,而对于语音识别问题也可以按此处理,他“用当时已经颇为成熟的数字通信的各种技术来实现语音识别,而彻底抛开了人工智能的那一套方法(指传统的方法,让计算机模拟人)”
“贾里尼克和他的同事在研究语音识别时,无意中开创了一种采用统计的方法解决智能问题的途径,因为这种方法需要使用大量的数据,因此又被称为数据驱动方法。这种方法最大的好处是,随着数据量的积累,系统会变得越来越好,相比之下过去人工智能的方法很难受益于数据量的提升。”
“在语音识别之后,欧洲和美国的科学家开始考虑能否用数据驱动方法解决其他智能问题。贾里尼克的同事彼得·布朗(Peter Brown)在20世纪80年代,将这种数据驱动方法用于机器翻译。但是由于缺乏数据,最初的翻译结果并不令人满意,虽然一些学者认可这种方法,但是其他学者,尤其是早期从事这项工作的学者认为,解决机器翻译这样智能的问题,光靠基于数据的统计是不够的。从20世纪80年代初到90年代中期大约十多年的时间里,在计算机界大家一直有个争议,那就是数据驱动方法是否适用于各种领域,语音识别是否只是一个特例。简单地讲,当时无论是做语音识别、机器翻译、图像识别,还是自然语言理解的学者,分成了界限很明确的两派,一派坚持采用传统的人工智能方法解决问题,简单来讲就是模仿人,另一派在倡导数据驱动方法。这两派在不同的领域力量不一样,在语音识别和自然语言理解领域,提倡数据驱动的一派比较快地占了上风;而在图像识别和机器翻译方面,在较长时间里,数据驱动这一派处于下风。这里面主要的原因是,在图像识别和机器翻译领域,过去的数据量非常少,而这种数据的积累非常困难。图像识别就不用讲了,在互联网出现之前,没有一个实验室有上百万张图片。在机器翻译领域,所需要的数据除了一般的文本数据,还需要大量的双语(甚至是多语种)对照的数据,而在互联网出现之前,除了《圣经》和少量联合国文件,再也找不到类似的数据了。”但随着互联网的兴起,数据的获取变得容易起来,2005年谷歌公司打败全世界所有机器翻译研究团队所用的方法依然是数据驱动方法,而之所以能赢,则是因为“用了比其他研究所多几千倍甚至上万倍的数据。”
“如今在很多与“智能”有关的研究领域,比如图像识别和自然语言理解,如果所采用的方法无法利用数据最的优势,会被认为是落伍的。
数据驱动方法从20 世纪70年代开始起步,在八九十年代得到缓慢但稳步的发展。进入21世纪后,由于互联网的出现,使得可用的数据量剧增,数据驱动方法的优势越来越明显,最终完成了从量变到质变的飞跃。如今很多需要类似人类智能才能做的事情,计算机已经可以胜任了,这得益于数据量的增加。
全世界各个领域数据不断向外扩展,渐渐形成了另外一个特点,那就是很多数据开始出现交叉,各个维度的数据从点和线渐渐连成了网,或者说,数据之间的关联性极大地增强,在这样的背景下,就出现了大数据。”
“在有大数据之前,计算机并不擅长解决需要人类智能来解决的问题, 但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。由此,全世界开始了新的一一轮技术革命智能革命。”
尽管过往数年,计算机能做的事情越来越来,但给人的感觉仍然是“快却不够聪明”,但当我们拥有足够多的数据之后,便可以化智能问题为数据问题,机器不再需要像人一样思考才能解决问题,只要输入足够的数据,配合合适的算法(模型),机器便可以做出最优的判断。深蓝即使战胜了卡斯帕罗,“但在这看似聪明的表象背后,其实是大量的数据、并不算复杂的算法和超强计算能力的结合——深蓝从来没有,也不需要像人一样思考。”
“计算机下棋和回答问题,体现出大数据对机器智能的决定作用。我们在后面会看到很多各种各样的机器人,比如 Google自动驾驶汽车、能够诊断癌症或者为报纸写文章的计算机,它们不需要像科幻电影里的机器人那样长着人形,但是它们都在某个方面具有超过人类的智能。在这些机器人的背后,是数据中心强大的服务器集群,而从方法上讲,它们获得智能的方法不是和我们人一样靠推理,而更多的是利用大数据,从数据中学习获得信息和知识。如今,这一场由大数据引发的改变世界的革命已经悄然发生,我们在后面的几章会更深入地介绍它。这次技术革命的特点是机器的智能化,因此我们称之为智能革命也毫不为过。”
❹ 《智能时代大数据与智能革命重新定义未来》epub下载在线阅读全文,求百度网盘云资源
《智能时代》([美国] 吴军)电子书网盘下载免费在线阅读
资源链接:
链接:
书名:智能时代
作者:[美国] 吴军
豆瓣评分:8.4
出版社:中信出版集团
出版年份:2016-8
页数:374
内容简介:
大数据和机器智能的出现,对我们的技术发展、商业和社会都会产生重大的影响。作者吴军在《智能时代:大数据与智能革命重新定义未来》中指出,首先,我们在过去认为非常难以解决的问题,会因为大数据和机器智能的使用而迎刃而解,比如解决癌症个性化治疗的难题。同时,大数据和机器智能还会彻底改变未来的商业模式,很多传统的行业都将采用智能技术实现升级换代,同时改变原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的。
作者简介:
吴军,博士,与2002年加入谷歌公司,2010年加盟腾讯公司,出任负责搜索和搜索广告的副总裁。2012-2014年回到谷歌,领导计算机自动问答项目。2014年,他在硅谷创办了丰元资本风险投资公司。他在美国两家风险投资基金(中国世纪基金和ZPark风险基金)分别担任董事和顾问,也是约翰霍普金斯大学工商学院董事会董事,以及该校国际事务委员会的顾问。
❺ 吴军博士认为未来二十年是什么为王的时代
吴军博士认为未来二十年是数据为王的时代。
出自吴军博士的《大数据改变未来》原话是:
在今后二十年它又会往哪儿走呢?在未来的二十年里,什么决定世界经济发展的方向?我认为,如果说过去五十年是摩尔定律的时代,未来二十年就是数据为王的时代。
大数据会带来机器智能,也就是说让我们的计算机变得非常聪明,以至于它超过我们人类的智能。
(5)吴军博士认为大数据加上机器智能扩展阅读:
吴军博士认为,大数据加上机器智能,它可以把我们以前所有的行业,全部的改造的一遍,或者换一句话说,就是说所有未来公司,都是某种程度上的大数据公司。大数据有一个特点是,可以非常精密地定位和确定世界发生的每一件小事。
从05、06年以后,搜索以前大量数据就不一样了,比如搜到了三十多条信息,再过到07、08年的时候数据量更大,有时甚至不知道原因时就已经知道结果了,这时就有一个思维方式的改变,由于大数据多维度看问题,就从多个方面保障的了结果,这也是大数据的本质。
❻ 《智能时代》读后心得
吴军博士的《智能时代》一书,介绍了数据的产生,发展以及过渡到大数据的过程;详细介绍了大数据的特点,及人工智能对思维方式的促进转变;阐明了技术革命对各类型产业发展的推动;从辩证的角度详列大数据智能时代带来的负面影响和对策;展望了大数据的前景和对知识精英的素质要求。整体上深入浅出,通俗易懂。对我这个“门外汉”来说,技术科普类书籍写出了故事性,加深了兴趣,收获颇多!
一、数据引起的对抗。 数据成为重要资源,那么占有了大规模,各类型的数据信息,就把握了商机,把握了主动。因此数据资源的争夺必将趋于激烈,并且波及政治、经济、生活等方面。美国打着信息安全的幌子,制约华为在5G领域的全面铺开,根本上还是数据信息领域的主动权争夺。“棱镜门”,“维基解密”等系列曝光的信息安全问题,都是由美国主导。利用技术优势,美国占有了大量数据资源全球监控,甚至不顾及敌我,不顾及外交,不顾及游戏规则,几近“疯狂”。因为他们看到了大数据发展的潜在影响,想要大量占有数据资源。有争夺就有保护,保护更多的建立在技术层面。我国的中兴被美国芯片公司“卡了脖子”,庞大的“躯体”轰然倒下。现在“列强们”又故技重施,想要制裁华为,理由还是数据安全。所以数据的保护扩展到技术、科技层面,对抗和突破也趋于白热化。对于数据本身,在互联网时代本身就真假难辨,那么数据质量的差异也会产生对抗。同领域、同模式的项目,质量差异导致的结果不尽相同,谁能够把握数据背后的真相,这要根据数据的数量规模、维度、时效来制作模型,那么收集数据的手段必然带来多样的争夺。所有智能化的设备都成为传感器、记录仪,谁又能占有最大的份额呢?
二、 数据展示的力量。 阅读《智能时代》,我忽然眼界开阔了。因为过往的典型故事背后是大数据智能分析的支撑。以色列农业的惊人成就给人类食品生产供应带来了福音;美国勇士篮球队短期高效的成绩提高给了篮球爱好者超高的震撼。 华尔街投资大神、对冲基金公司桥水创始人瑞·达利欧在其代表作《原则》中提到了自己工作的方法,其实也是大数据思维的一种模式,可以说,他的成功也是大数据使用的一个成功版本。生活中,商业采购,个人定制,精准贴心服务哪一件都有大数据在展示力量,我们已经与大数据“水乳交融”。目前大数据智能时代才刚刚兴起,它的力量在未来各领域必将带来更多更大的变化。
三、数据带来的隐忧。 没有人、集团、国家喜欢赤裸裸地暴露在公众面前,没有一点隐私。本书中也提到了保护隐私的一些方法,有很强的借鉴意义。但是大数据确实让我们享受了便利,同时又不得不模糊了隐私保护的概念,甚至根本意识不到便利背后的隐私泄露。作为国家机器的重要部分,国防和军队面对大数据该怎么权衡呢?保守秘密——毋庸置疑。怎么保护?这个课题就有点复杂,管理、教育、技术防范、制度约束都不能缺失。我认为关键在人,关键在忠诚。任何科技的影响都有规律可循,都可以有防范措施方法,但是忠诚缺失,任何方法都无济于事。有了忠诚,就有了自觉,提高了警觉,警醒自己不触红线。——所以政治合格是根本。当然利用大数据分析窃取国防军队秘密的案例肯定会有,那么研究保护技术,做好内部风险防控是必不可少的。真心期盼在智能时代有合理、人性的解决办法。
四、迎接智能时代。 二十年以前,人们的交流方式以写信为主,当时人们的文字写作能力应该很强;后来有了BP机,可以留言,有事可以找公用电话交流,感觉到联系起来挺方便,只是月服务费不少,设备的价格不菲;那时的网络流行QQ聊天,发邮件,时髦的年轻人喜欢到遍地开花的网吧泡一泡;十年前手机开始流行,打电话发信息让许多人爱不释手,就是信号不太好,价格挺贵,一般人不好“养活”;同时期还出现了价格优惠的“小灵通”,但是流行两三年后消失在劳苦大众的记忆里;再后来智能手机发展起来,生活方式彻底变了天——智能时代改变了太多生活。聊天用微信,购物用微信,视频用微信,看书用手机,游戏用手机,看电视机电影用手机——手机已经无所不能。特别是驾车出行,高德、网络、腾讯三家导航软件非常给力,“路盲”基本消失,虽然偶尔也有导错的现象,但是如果细心些,你会发现只要每次版本更新,它的服务越来越可心。这是科技发展的成果,它的背后是大数据的影子。今后,只要感觉到生活方便了,你就说那是大数据时代的标志,准没错。大数据智能时代来了,我们做点什么呢?首先要 做到融入不能排斥 。比如智能驾驶,许多搞这项研究的学者也怀着深深的担忧——一旦智能识别出错,将会带来灾难性问题——但是仍然积极投入到智能驾驶的研究测试当中,更多引入复杂模型来确保真正的万无一失。这种科学精神就是面对科技发展的良好状态。作为普通公众,积极的学习大数据的知识,搞清来龙去脉,用尊重科学的心态融入大数据智能时代,充分运用大数据成果就是最好的科学素养。另外 大数据也带来新的思维,我们需要熟练运用这样的思维 。太多的不确定性是人类恐惧的根源。但是大数据研究的方法在数据足够充分的时候能够降低不确定性,减少人类思维上的畏惧感。所以提供客观真实的数据也是普通大众的一项工作。经常用大数据的思维来浇灌一下传统的脑袋,相信也会带来满满的新科技感。 大数据促使人类创新创业拓展发展领域 。不要担心智能时代抢走了多数人的工作,智能时代是个渐进的过程,在工作岗位淘汰的过程中,新的岗位会被“挤”出来,人类的创新能力会被“压”出来;物质领域丰富了,精神领域的开发前景广阔。
❼ 吴军博士认为过去五十年是什么时代
过去五十年是摩尔定律的时代。
原话是:“我认为,如果说过去五十年是摩尔定律的时代,未来二十年就是数据为网的时代"
参考资料
摩尔定律由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来,其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。这一定律揭示了信息技术进步的速度。
尽管这种趋势已经持续了超过半个世纪,摩尔定律仍应该被认为是观测或推测,而不是一个物理或自然法。预计定律将持续到至少2015年或2020年。然而,2010年国际半导体技术发展路线图的更新增长已经放缓在2013年年底,之后的时间里晶体管数量密度预计只会每三年翻一番。
❽ 吴军:互联网创业到底有多蠢
以下内容来自高山大学2019年经典课程。授课老师:吴军,著名学者,投资人,人工智能、语音识别和互联网搜索专家。丰元创投创始合伙人,前Google智能搜索科学家,前腾讯副总裁。著有《数学之美》《浪潮之巅》《硅谷之谜》《文明之光》《智能时代》等多部畅销图书。
今天主要给大家讲讲硅谷的技术趋势。
为什么硅谷今天的技术是这样的,他有一个很重要的前提叫做: 预先要求 。
比如说我们能在2007年的时候用上智能手机,原因是20年前也就是1987年左右,伯克利发明了双触屏技术。这就是预先要求。
再一个就是要有足够的市场规模。比如互联网市场其实就是一个很小的市场,养不活那么多公司。全世界有上百万家互联网公司,但99.9%是亏钱的。
今天我用一个投资人而不是教授的眼光来看看在硅谷投资,看看硅谷的技术发展趋势 。
大概从2008年开始有两个热门的词,一个是云计算,一个是移动互联网。当时标志性的事件就是亚马逊和Google开始对外提供收费的云计算服务,而不是仅仅是他自己的企业级内部的服务。另外一个就是当时安卓系统出来了。
这两件事的发生带来了企业级的软件和服务的升级。
2010年前后,全世界的企业级软件和服务的市场大概约5000多亿美元。当时美国一个IT企业里平均每个员工IT费用约5000美元左右,即使是一个UPS的投递员,一年所花的企业级软件费用大概也有500美元,到现在这个规模就更大了。所以这个市场很大。这也是为什么微软、IBM这样的公司很成功的主要原因之一。
5000亿美元是什么样一个概念呢?拿互联网行业来比的话,2016年全世界互联网市场是3800亿美元,2018年估计是4500亿美元。互联网市场增长很快,但是依然没有达到肆基企业级软件服务的水平。
然而全世界的互联网公司比软件公司要多得多,所以这也是为什么全世界互联网公司大部分不挣钱。当然,更主要的是,互联网公司和软件公司不一样,Google一家占了全世界1/4的市场,1/3的互联网收入,再加上阿里巴巴、腾讯、Facebook、亚马逊等等,共占到了80%,然后剩下全世界一百多万家互联网公司(其中一大半在中国)去争不到1000亿美元的市场,所以是不可能挣得着钱的。
所以就创业来讲, 互联网创业是很蠢的一个行为 。
企业级软件和服务这个轿高市场在中国大家并不熟悉,因为中国大部分都是不付软件费,付也付得很少 。所以这种环境就生生把一个本来可以很做的很大市场给做没了。今天中国做企业级软件的公司像东软、金山、用友等上市公司市值全部加起来,都不到Adobe的一半,而Adobe还只是一个中型的软件公司。
中国出了一个新概念,其实就是这件事的一个翻版。叫工业互联网或者企业互联网。
那么话说回来,为什么从2008年到2016年大概8年时间里,美国要通过这两件事把企业级的软件做转型升级呢?
因为如果用亚马逊的云服务或者Google微软的云服务,加上原来的企业级的软件服务这种解决方案。相比过去买IBM的计算机和Oracle的计算机服务器,再用他们数据库,成本要低70%左右裂帆谨。所以大家都觉得这是一个趋势。
今天大家都在说,为什么微软好像又重新起步了,市值超过1万亿美元。但是仔细去读微软财报,就会发现它利润其实并没有增长。
它的市值涨了一倍多,原因在于它的估值PE涨了一倍多。为什么PE涨?原因很简单。微软原来卖软件,现在变成了在云计算上卖服务,大家觉得这是未来的发展方向,所以它估值又高了。
中国过去在企业及软件和服务这件事上收不来钱,但今天有可能收得来钱 ,为什么?因为现在不卖软件,而是把软件放在云端卖服务了。这已经慢慢的形成一个趋势了。
趋势能够形成,就在于它的预先条件成熟了。
有了云计算,有了移动互联网,有了传感器技术,就带来了大数据。很多数据原来不是没有,而是有但我们无法收集。 过去3年里,我们收集的数据是人类有史以来到3年前所有数据的总和 。
有了云计算和大数据,机器智能或者说人工智能就产生了。
今天之所以有人工智能,有三个重要原因。
一是处理器的处理速度非常快 。
处理器进步的速度有多快,你们可能想不到。举例来说,就是如果我们用1946年的计算机技术来实现2016年Google AlphaGo赢李世石的那台计算机,用电量要多少?
要用掉几百万个三峡的发电量。
这就是一个基本技术进步。正是因为有这样快的技术进步,今天的计算机才变得如此聪明。
第二个是数学模型比较好 ,能把我们现实生活中很多看上去不是数学问题的问题变成数学问题,然后用计算器计算。
第三个就是大数据 。
面对大量的数据,如果用的还是用我们传统的方法先建数学模型再去琢磨,那是不行的。用到大数据,就需要机器智能。有了机器智能,有了移动互联网,有了传感器,自然而然就到了今天很热门的一个概念:万物互联IoT。
IoT这个市场有多大呢?
当我们周围全部是智能设备的时候,智能 汽车 、智能家居等等,都能够直接上网,这里不是说通过你手机或者通过Wifi上网,而是每个智能设备都会有一个类似于我们手机SIM卡,通过这个卡来上网。这个时候我们现在的4G就不够用了。因为不可能并发处理这么多信息,那么就需要5G,所以这两个是关联的。
IoT和5G的结合,最保守的估计,到2030年,可以把这目前这两个市场的总和翻一番 。每年增长6%不算太快,跟中国的GDP比的话。
但是在世界整个IT行业的增长来讲,这是一个很令人振奋的信息。为什么呢?
刚才我提到全世界互联网市场大概4000多亿美元,那电信市场有多大呢?大10倍,将近4万亿。
电信市场是个十倍大的市场,而且从业的公司没有那么多。到2030年,这个市场大概能扩大到8万多亿美元。差4万亿。4万亿什么概念呢?今天日本的GDP就是4万多亿,德国是3.8万亿。80多年前,日本人说大东亚共荣根本不可能实现,但现在, 中国要是真在IoT+5G时代占了一个主要的大的市场份额,创造出相当于日本现在的GDP的市场,其实也就是相当于实现了大工业大东亚共荣。
通过技术的方式,能做到这一点,这是一个未来大的市场。
从投资角度来讲,为什么有些技术我们投有些不投呢?
原因在于,首先这些预先的技术你是否满足了。
第二个就是市场规模的前景要很大。我一直觉得大家来高山大学学习特别好,就在于高山大学教大家科学,学习科学你就会算这笔账。很多 科技 媒体报道,甚至有一些大学商学院讲他们不会教你科学的底层逻辑,糊里糊涂告诉你一个趋势,这个趋势没有科学基础是不行的。
再接下来就是大数据。机器智能和生物医疗技术结合起来,就形成一个大产业,就是IT+医疗,这也是一个非常大的市场。
我们现在检查身体的很多设备其实都很老,听诊器大概用了几百年了,心电图也有上百年的 历史 了,CT和MRI都现在也有40多年了,但这些都被认为是目前比较先进的诊疗手段。仔细想想,我们的手机是什么样的,更新迭代的速度有多块,如果我们用的一个IT产品还是40年前的,你肯定会觉得这东西基本上没法用了,但是我们的医疗设备就是这样的。
此外,我们做的检查也很老套,比如你心脏不舒服了,去医院医生会让你测一下心电图,但如果检测的时候心脏正好正常的话,那就测不出来任何问题。我们希望有什么样的检查方法呢?那就是最好有一些设备,能够随时监控跟踪我们整个人的新陈代谢,细到我们身体出了任何问题它都会马上知道。
特斯拉 汽车 与宝马或者奔驰车相比,最大的区别就在于,一旦车出了什么问题,给他们一个电话,他们能立刻预约维修。因为特斯拉对自己的车有监控,能够随时进行分析。但是奔驰宝马不一样,他们有记录,但没有互联网监控,一旦车出了什么问题,就会要比较长的维修时间。
今天很多工业设备是有监控的,比如说像商用的喷气式飞机的发动机,上面有一千多个传感器,每天运行一下,能够收集大概超过1G的原始数据,就是它里头温度、燃烧、湿度等等各方面都记录得很好。
再比如说机场维修发动机也是很快的一件事情,因为他们也有非常好的记录和监控。但是我们身体没有一个传感器。所以说智能与医疗结合会产生一个大的市场。
那么这个市场到底有多大呢?
美国2018年GDP为20万亿美元,医疗方面费用约占18%的GDP,也就是3.6万亿美元。中国市场多大?如果除掉其他杂费,只按照医院的收费,这个市场非常小,占GDP的不到5%。如果把买保健品等各种医药杂费都算上,占比就很大,但是这个没法估算。
上海交大商学院有一个大概估计,约占GDP 13%到14%,跟美国也差不多。所以这两个国家AI+医疗的市场就差不多6万亿。所以这是一个很大的市场。我讲这些东西就是要告诉大家 眼界要开阔一些,不要老想着技术,或者老想着互联网上我能琢磨点什么东西,市场太小,格局太低。
另外,当我们有了人工智能,有了IoT、有了区块链,整个世界就会形成一个超级智能。单个蜜蜂的智能水平非常差,但是一旦形成了一个群体的智能的时候,就会很强。相比于人而言的个体决策,人工智能收集了很多数据,最终形成综合的决策,所以这在未来会是一个很大的市场。
❾ 机械思维、大数据思维与人的世界
吴军博士的新书叫《智能时代》,副标题是“大数据与智能革命重新定义未来”,因为这个智能革命恰恰源于数据驱动,与此相对应的是机械思维驱动了工业革命。从历史的角度来看,这似乎只是不同的发展阶段,但如果从底层逻辑来看,我认为这只是不同数据尺度的体现。
机械思维到大数据思维既不对立互斥也并不彼此相邻。如果笼统地总结,机械思维当隶属小数世界,大数据则隶属大数世界,而处于两者中间的是我们的日常更常面对的中数世界。
一、机械思维与小数世界
在当今的我们看来,“机械思维”好像是滞后的、呆板的象征,甚至“机械”本身也成为了对某个人的形容,然而绝非褒义。然而在17世纪,机械思维就像当今的所谓互联网思维一样时髦。
机械思维的方法论如果用八字箴言来概括我觉得没有比“大胆假设、小裂燃心求证”更合适的了。大体上就是做出假设、建构模型、数据证实、优化模型肆腊虚、预测未来。这也是沿用至今的一套思路。成果也是显然的,比如,牛顿——他用力学三定律和万有引力定律几个简单明了的公式说明了大千世界宇宙万物的运动规律。
这里面有三个点, 一是公式的确定,二是公式的简明,三是公式的普适 。这也是机械思维的三大特质。
先看确定性和普适性。牛顿的定律无论应用于什么样的场合,都可以用一样的公式推出相应的确定的结论。这对于人们来说非常重要,因为根据种种确定的定律和原理,世界对于我们而言成为可知,我们也可以借此预测系统中其他变量的反馈、预测未来。
简明性一样重要。牛顿所处的时代宇宙的复杂程度并不比现在弱,不一样的只是思维方式决定的模型差异。太阳系中有成千上万的天体,按照完全的计算,就复杂了去了。然而万有引力定律非常简洁优雅,将万千天体的作用回归到依次考虑两两天体的互相作用力中。甚至更进一步,由于太阳独一无二的巨大质量,牛顿将每个行星和太阳看成一个独立的二物系统,得到了更进一步简化。回归到两物体系统自然是个“小数”,然而这个所谓的小数世界原本其实并不那么小。比如,在一个仅考虑两物体的系统中,涉及到两物体各自的情况、彼此相互作用的情况和它们所在的系统的情况。如果借用数学和力学概念来描述,那么两物体系统涉及到孤立方程、相互作用方程和场方程共4个方程。此系统每增加一个物体,场方程数量保持1不变,孤立方程线性增长1个,但相互作用方程数就呈指数级增长了。所以,简化也是其核心。
二、大数据与大数世界
与上述机械思维一脉相承,苏联在设计武器和航天器时依赖牛逼的数学家建立复杂而精准的数学模型,希望可以用之皆准。美国的科学家数学底子弱一些,所以走了不同的道路——建立简单的数学模型,但依赖于计算机和大量数据。结果是美国的路子胜出了。
吴军博士在《智能时代》中还举了另一局槐个例子——德国拥有完美的光学仪器技术,所以做出了高难度的非球面透镜,仪器小巧而完美;日本缺乏这样的技术,所以用多个球面镜组合来获得同样的效果,这样的机器笨重然而容易大规模生产使用。二战后,成为光学仪器第一大国的不是德国,而是日本。
在这两个例子中,都通过 多个简单模型来胜过单一的精确模型 。然而这样的胜出是有前提的——基于大数据。如果说机械思维下的精美模型是纯净的晶体,那么大数据绝对是散漫无章的气体。气体的分子们本身是无序而复杂的,但我们却可以预测整体的扩散情况、确定其整体的物理性状。这跟每一个分子的“随机性”离不开,正是随机性让统计有了意义。如果某地有一场流感正在蔓延,我们很难判断某个单一个体是否会感染,但谷歌甚至可以根据人们的搜索数据来计算出接下来将蔓延到哪里,至于感染率有多少就更是一个简单的统计计算数字了。
在上面这个流感的例子中不难发现,面对大数据,精确的数值其实反而没有那么重要了,我们关心的点也不必精确到个位数。比如运营一个app,用户达到千万量级的时候,每天关注的DAU肯定就是多少万,甚至更简略一些就只具体到十万位、百万位了,个位数是几不再重要。但面对大数据,个体依然是独一无二的,我只有感染、不被感染两种结果。那么对于这种情况,大数据的感染率就成为了个体是否会感染的背景概率,个体自己的健康情况、活动区域灯则成为其他的调整概率项。
由上也可见,概率性思维的价值更凸显了。事实上,基于大数据的思维方式不做假设,只根据海量数据做出相关性分析;不care因果确定,只判断概率大小、相关性强弱。
除了 混杂取代精确、相关取代因果、不确定性取代确定性 ,大数据思维最显而易见的就是 全量取代样本 ,这也就是大数据之为“大数”的原因。不用考虑怎么抽选有质有量的随机样本,大数据的风格是全量数据纳入计算。正因如此,从搜索引擎到语言识别到机器翻译,算法技术相当的前提下,谷歌却能异军突起——他家的数据量沉淀太可观了。然而海量的数据只是燃气,终究受制于燃灶的处理能力。正因为计算机的计算能力的增长赶不上数据的指数增长,服务器的数量就更赶不上,所以,面对大数据,简化的算法尤显重要。比如马尔可夫链,比如维特比算法。
三、复杂的生活与中数世界
管理上,我们或许会把一个个的个体抽象为单元,然后用机械思维统筹管理;决策上,我们又可能会根据大数据跑出的强相关性分析结果,决定下一步去打什么市场。无论是小数世界的机械思维还是大数世界的大数据思维,都是基于过去可以预测未来的假设的,目的也都是为了预测。
然而,我们现实生活中遇到的大多数情况既不是小数也不是大数。如果说机械思维是晶体、大数据思维是气体,那么中间还隔着一个液体——中数的世界。某家上市公司有多少人?是个中数;一台计算机里面有多少零部件?是个中数;这片森林里有多少只鸟?是个中数……生活在其中的我们是尴尬的,就像高中数学老师的吐槽——你们做物理什么没有摩擦力,哪里没有摩擦力?还匀加速运动,你匀加速一个我看看!
小数、中数、大数本身并不是在量级上有一个数字清晰的划分,事实上这种划分是抽象的、概念式的。 对于身处其中的中数世界,我认为可以采取的应对方式之一是根据不同的情况,或者靠拢小数世界借鉴机械思维,或者靠近大数世界借鉴大数据思维。
先看靠近小数世界和机械思维。假设-求证-应用的方法论应用场景其实非常广阔。比如,这两年非常热的精益创业,精益思维最核心的点就在于最小化可行性验证。由于现实生活中我们的成本是有限的,不可能有个主意就全量铺开,这也是不经济的。我们需要用最小的成本先行测试验证某一想法,就创业者而言就需要用最小的成本在真实场景中验证用户是否真的有此需求。但此时得出的归纳性结论并不是机械定律般确定性的、因果明晰的,事实上,归纳无法确立因果,只能提供强相关、弱相关或不相关的参考。
再看靠近大数世界。国人爱好读史,历史本身何尝不是大数据。但我们阅读的史书只能是寥阔史料中挑选过的非随机样本(中数),即便如此,依旧是“太阳底下没有新鲜事”——基于过去预测未来一定程度上确实是有应用价值的。过去给我们对于未来的预测提供了一个外部视角,可以作为我们做具体预测的背景概率(曾看到有人戏称经验是人类的大数据,我觉得蛮有意思,但个人经验远达不到“大数据”的程度,充其量只是中数,然而已经可以为今后的预测和决策提供一个背景概率)。所以, 大数思维对于日常生活最大的借鉴价值我认为是提供一个外部视角的背景概率。当面对具体的情况的时候,在这个背景概率的基础上,分析具体情况做各个独立的概率修正 。
我们的知识要么源于自身和他人(同时代或历史上)的经验,要么源于前人已经提炼出来的原理。
对于自身和他人的经验,有两种借鉴方式——一是直接复制,二是追究因果(虽然大多时候只是相关关系)予以应用。 都会觉得第二种好,但现实中大多数情况我们都在不自觉地按照第一种思路应用,因为第二种不仅难,而且违背直觉——也就是说,大多人(包括我在内)大多时候是达不到机械思维的标准的。
对于前人已经提炼出来的原理,也有两种应用方式——一是一元思维模型,二是多元思维模型。 查理·芒格说过,如果你只有锤子,那么在你眼里什么都是钉子。因为如果一个人只有一两个思维模型,那么当他思考现实的时候就不得不扭曲现实来符合自己的思维模型。这个时候,模型越精确具象,对一个人的思维限制就越厉害。所以查理·芒格指出,我们必须有多元思维模型,且这些模型必须来源于各个不同的学科(在这个学科细分的世界,永远别指望在一个院系中发现世间全部真理)。这种多元思维模型其实跟数据驱动下的多个简单模型胜过单一精确模型是一样的。即使我们面对的数据量很多时候达不到“大数”的层面,但一个人建立多元思维模型的前提就是比一元思维模型的人吸收了不同量级的底层数据。因为每一个模型都源于不少的经验数据得出的原理,多个模型背后就是不同维度、不同量级的数据。这样的多元模型容错性高,面对具体问题的分析也真正可以从不同侧面不同维度得出尽量贴近真实的结论和对未来的预测。
本文参考书籍:
1、吴军《智能时代》
2、吴军《数学之美》
3、维克托《大数据时代:生活、工作与思维的大变革》
4、温伯格《系统化思维导论》
5、查理《穷查理宝典》