❶ 《智能時代》讀後感
《智能時代》一書的作者是吳軍,該書揭示了大數據和機器智能對於未來社會的影響。以下是我為大家整理的關於這本書的讀後感,歡迎大家閱讀!
在《智能時代》一書中,作者系統地講述了大數據和智能革命相關的知識,對我觸動最大的是大數據引起的思維革命、大數據對商業的影響以及智能革命對未來社會的影響這三部分的內容。
思維革命
工業革命後人們形成的思維方式是機械思維,即確定性思維。我們可以通過找到特定的模型(公式、定律),找出事物之間的因果關系,而且發現的規律往往是放之四海而皆準的。
然而這個世界是不確定的。首先當我們對世界的了解越來越細致之後,我們會發現影響世界的變數其實非常多,已經無法通過簡單的方法或者公式計算出結果。
然後通過量子力學中的測不準原理,我們可以知道不確定性是宇宙的一個特性。面對不確定性的世界我們該怎麼辦呢?
香農在資訊理論中借用熱力學里熵的概念,他用熵來描述一個信息系統的不確定性。香農指出,信息量與不確定性有關:假如我們需要搞清楚一件非常不確定或一無所知的事情,就需要了解大量的信息。這是一個全新的方法論:資訊理論建立在不確定性基礎上,而想要消除這種不確定性,就要引入信息。要引入多少信息,則要看系統中的不確定性有多大。
在我們無法確定因果關系時,數據為我們提供了解決問題的新方法,數據中所包含的信息可以幫助我們消除不確定性,而數據之間的相關性在某種程度上可以取代原來的因果關系,幫助我們得到我們想知道的答案,這便是大數據思維的核心。
大數據與商業
從工業革命開始,幾次主要的技術革命都遵循相似的規律。首先,是大部分現有產業加上新技術等於新產業。或者說原有產業需要以新的形態出現。其次,並非每一家公司都要從事新技術產品本身的製造,更多的時候它們是利用新技術改造原有產業。這次以大數據為核心的智能革命也不例外,我們將看到它依然會延續這兩個特點。每次技術革命都會誕生新的思維方式和商業模式,企業只有在思維上跟上新的時代,才能在未來的商業中立於不敗之地。
智能革命和未來社會
大數據導致機器革命的到來,這對未來社會的影響不僅僅存在於經濟領域,而是全方位的。盡管總體上這些影響是正面的,從長遠看會使我們未來的社會變得更好;不過,和以唯敏往的技術革命搜塌一樣,智能革命也會帶來很多負面的影響(個人隱私、失業率等),特別是在它發展的初期,而這些影響很可能會持續很久。
任何一次技術革命,最初收益的都是發展它、使用它的人,而遠離它、拒絕接受它的人,在很長的世界裡都是迷茫的一代。在智能革命到來之際,作為人和企業指漏枝無疑應該擁抱它,讓自己成為那2%的受益者;而作為國家,則需要未雨綢繆,爭取不要像過去那樣每一次重大的技術革命多伴隨半個多世紀的動盪。
在我們還沒有經歷過機器在智能上全面超越人類的時代,我們需要在這樣的環境里學會生存。這將是一個讓我們振奮的時代,也是一個給我們帶來空前挑戰的時代。
作者在書中對很多基礎概念和技術發展歷史都有較詳細的講解,也列舉了很多生動有說服力的案例。在看這本書之前也在很多地方了解過關於人工智慧、大數據等方面的案例和知識。但遠沒有看過書後如此深刻的認識,所以推薦大家還是閱讀原書。書名雖然看上去是與科技相關的,實際上與每個人都相關。提前接觸和運用新的思維與新的技術也許不能保證你成為前2%的人,但至少可以讓你在過程中擁有更多的機會和成功概率。
願大家對新事物保持好奇心和熱情,擁抱智能時代,為成為前2%的'人而努力。
第一次讀《智能時代》,是通過朋友的豆瓣閱讀邀請碼下載到手機上看的。起先並沒有太認真閱讀,只是在下班路上隨手翻幾頁,以為這就是寫現在比較熱門的關於智能設備或者智能生活方式的乏善可陳的書,畢竟書名」智能時代「給我第一印象就是如此。實際讀的時候才發現,這是一本講人的智能和計算機能否產生類似智能的書。書的原名是《on Intelligence》,本意是關於智能的討論,翻譯書名《智能時代》和副標題不是很切題,會給人錯誤的第一印象。
拋開書名不說,《智能時代》是我幾年內讀過最好的書之一,作者——傑夫霍金斯的文筆很簡潔,這本書翻譯的水平也很高,文中很客觀和批判性地描述了智能和人工智慧研究,並闡述了作者自己對智能的理解。本書一推出就獲得兩個諾貝爾獎得主及專業領域人士的大力推薦,考慮到霍金斯本人是企業家而不是職業科學家這一點,是十分罕見的。
我從小經常思考關於智能的問題,這本書能解答我很多疑惑,讀書時那種開悟的感覺只能用醍醐灌頂來形容。還記得初一的某天下課回家,我騎著自行車,突然產生了一個疑問——我的手是怎麼掌把的,我沒有有意識地控制哪根手指放哪個位置啊?然後我撞了汽車。如果你和我一樣,曾經思考過這類問題,那麼本書絕對是你的菜。
霍金斯在書中首先回顧了當今人工智慧研究的歷程以及自己探索的經歷,客觀批判了"智能行為派",他認為智能是系統的內在屬性,和外在表現無關。比如一個人在靜靜思考的時候,雖然沒有表現出任何行為,他也是有智能的。退一步來講,假使通過行為來判斷是否有智能,當下的計算機也不合格。計算機要能識別圖片,必須設計一套視覺識別演算法,計算灰度、色階、輪廓等;識別語音要設計語言演算法,計算聲波頻率、音調、匹配語義等。圖片演算法和聲音演算法之間沒有任何關聯,從術語到計算過程完全不同。
但是對於大腦來說,聲音和圖像在大腦中的處理過程很類似,只是接受刺激的感官不同。把實驗動物幼崽的視覺神經接到本來應該發育聽覺的位置,這些動物都能發育出正常的視覺——而如果把計算機的攝像頭接到話筒上,結果可想而之。作者並非在否定演算法本身,無疑,大腦也有自己的演算法,這個演算法是高度抽象的,能根據信號輸入的不同發展出相應的知覺。相比之下,計算機演算法毫無變通的可能性。從這兩點出發,作者認為以往的計算機智能研究是一條死路。
那麼智能應該是什麼樣的?霍金斯從日常生活出發,通過對學習、記憶、回想等等行為的分解,結合腦部神經結構,提出了產生智能的"記憶——預測"框架。整個推斷過程非常精彩,在此就不劇透了,以免破壞了閱讀樂趣。
這個系統的核心在於"恆定表徵"這樣一個概念,霍金斯認為人類(或海豚猴子等其他動物)之所以能認知世界,依賴於對事物高度抽象的能力。這種抽象能力,不是指刻意訓練的邏輯思維能力,而是智慧生物由大腦結構決定的固有能力。舉個例子:當我看到我家的小狗,我能意識到它在附近;當我聽到它熟悉的叫聲,我也能意識到它在附近;甚至當我只是看到它掉在沙發上的毛,都能推斷出它肯定爬上過沙發。
我並不一定直接看到它,是如何判斷它是否在附近呢?這就表明我的大腦有關於這只狗的"恆定表徵",不以我觀測的方式轉移。我認識我家的狗,無論它是蹲著還是趴著還是把腦袋藏在沙發下面,我都能意識到它的獨特存在。"恆定表徵"也就是人們常說的"理解"某個事物,對於計算機來說,目前的技術只能按部就班地計算,沒有理解的產生,更無所謂智能。
恆定表徵這個概念並非是霍金斯的原創,很多哲學家和科學家都有過類似的思想。比如大哲學家康德曾論證:人的心智擁有空間和時間的形式,獨立於經驗。康德稱這些形式為直覺,它們是純粹先天的知識方式,不依據經驗和思想,這使理解現實成為可能。比如沒有人見過完美的圓形,但不妨礙人理解正圓這個概念,因為空間的形式是先天的,是人的物理形態決定的。霍金斯的「恆定表徵」,就是先天知識(人或者計算機物理結構所決定的)加上後天經驗的產物。在我看來,計算機對時間和空間都沒有先天的知識,如果計算機對什麼有先天概念的話,那隻能是頻率。
不過,計算機並非不能產生智能,只是現在的科技水平不夠。最初計算機的設計就是用於處理專項任務,而生命的演化是為了適應各種各樣的自然環境,人和計算機"硬體"的不同,體現了自然演化和人工製造的區別。產生人類智慧的大腦,對於現在的技術水平來說,的確很難復制(就算能復制,消耗的電量是相當驚人的),並非說大腦具有什麼獨特的"精神"層面的東西,是計算機無法模擬的。我相信在科學家們提取出大腦的"演算法"之後,人工智慧的產生是必然的,十年、二十年內都有可能。
想像一下吧,具有人類智慧的計算機,不僅計算速度快,還能接上定製的感官,不僅有視覺、聽覺、觸覺、味覺、嗅覺,它還能具有感受磁場的"磁覺"(就像一些魚),感受整個森林火災可能性的"安全感",甚至感受股市變化的"發財直覺"(有些人聲稱自己就有,比如我媽)應用的可能性是無限多的。這也是小夥伴們改變命運,找到下一個藍海的機會啊!至於我呢,現在就開始著手創辦全球第一家」人工智慧幼兒早教機構「,並非人工智慧來教育人類小孩哦,而是我來教育人工智慧小孩……
像我這樣每天看的都是小說、歷史,會不會讓人覺得這個人已經老了,很頹廢,不求上進?尤其在這個開口閉口必談雲計算、大數據、人工智慧的年頭,既聽不懂又插不上話,會不會就真的落伍了呢?於是繼《浪潮之巔》後,又接著看了吳軍先生的《智能時代》(他的《文明之光》也同步在看,只是4本書看完還需要點時間)。沒想不看不打緊,這一看,未細思,心已冷。窗外雖是陽光燦爛,心中卻早已涼涼的。
作者說:「隨著技術革命的發展,並非每一個人的發展機會都是越來越多的,反而可能是越來越少。」「在歷次技術革命中,一個人、一家企業,甚至一個國家,可以選擇的道路只有兩條:要麼進入前2%的行列,要麼被淘汰。」「那麼大量淘汰下來的勞動力怎麼辦?新畢業的學生如何就業?答案是要麼去從事一份工資足夠低的服務性工作,要麼沒有工作靠領取救濟過活。」多麼直接,多麼殘酷,又多麼的冷酷,然而,這就是我們要面對的現實。於是又回到狄更斯那句被引用過無數次的《雙城記》中開篇的一句話:「這是最好的時代,也是最壞的時代。」
不要以為智能革命只會威脅到生產線上的工人和只需簡單動腦的工作,即使在今天看來依然高大上的職業,未來也會失去工作,譬如醫生、律師、編輯記者。先來看看醫生,「在過去,像放射科醫生這一類工作,被認為需要太多的專業技能,工作性質太復雜,不可能被機器取代。但是,今天智能的模式識別軟體通過醫學影像的識別和分析,可以比有經驗的放射科醫生更好地診斷病情,這將從根本上改變醫療行業的現狀。」
具有了智能的計算機不僅能幫助診斷,還可以進行手術。「相比醫生,計算機在診斷和手術等方面有三大優勢:
首先,它們漏判(或者失誤)的可能性非常低,也就是說它們能夠發現一些醫生們忽略的情況。
其次,它們的准確率很高,而且隨著數據量(病例)的增加提高得非常快。
最後,也是人所不具備的,這些智能程序的穩定性非常好,它們不會像人那樣受情緒的影響。」最要命的是,「這些智能程序的成本,通常不到人工的百分之一。」
再來看看律師,「位於矽谷帕羅奧圖市的Blackstone Discovery公司發明了一種處理法律文件的自然語言處理軟體,使得律師的效率可以提高500倍,而打官司的成本可以下降99%,這意味著未來將有相當多的律師(尤其是初級水平的律師)可能失去工作。」事實上這件事情在美國已經發生,「新畢業的法學院學生找到正式工作的時間比以前長了很多。」那麼記者和編輯呢?「今天美國很多媒體的財經新聞,尤其是對公司財報的評述,其實已經是計算機產生的了。」我想類似我們央視新聞聯播和《人民日報》那樣的新聞就更沒有問題。
有人會問:「文學作品如小說詩歌什麼的總還需要人創作吧?」就在今天中午剛看到一條消息:「微軟小冰通過對1920年後519位現代詩人的上千首詩經過10000次的迭代學習,小冰每學習一次的時間大約是0.6分鍾,10000次需要100個小時。她至今創作了70928首詩,從中精心挑選了139首,結集出版。」也就是說你未來看到的小說或詩集有可能是機器寫的。那麼,再仔細想想、細思一下,還有什麼工作是未來計算機做不了和不能替代的呢?包括你眼下正在乾的事情。是不是不思已恐,細思,則極恐、更恐、很恐、非常恐?是否覺得有些危言聳聽?
「很多人會天真地認為,船到橋頭自然直,勞動力會被自然而然地分配到其他行業中去。」過去幾次技術和產業革命不就是這樣的嗎?「但是,這種勞動力的再分配,一來需要非常長的時間(至少半個世紀),二來依賴於產生新產業。」那麼,這一切究竟是怎麼發生的?為什麼早不來晚不來卻偏偏這個時候來、偏偏讓我們給趕上了?
回到吳軍先生的《智能時代》這本書,還有個副題「大數據與智能革命重新定義未來」。全書一共分為七章,分別介紹了數據的作用,大數據和機器智能,機器智能的原理及其發展歷程,大數據思維的核心及其重要性,大數據和機器智能與商業的關系,它們對社會正反兩個方面的巨大影響。
❷ 吳軍博士認為未來二十年是什麼為王的時代
吳軍博士認為未來二十年是數據為王的時代,出自吳軍博士的課程《大數據改變未來》。
課程中說道:
在過去的五十年裡,人類整個的發展根本的這個動力從科技的角度來講,就是一個摩爾定律,什麼意思呢?就是在1965年的時候,英特網公司後來的創始人摩爾先生,他提出來在今後的十幾年裡,半導體處理器的性能,比如說容量、計算速度和復雜程度每18個月左右可以翻一番。他也沒有預想到這件事一直發生了五十年。以至於人整個人類發生了天翻地覆的變化。
可以這么講,我們過去的整個的社會的科技進步工業進步以及這個GDP的提升都是靠這個摩爾定律,如果我們把這個摩爾定律帶來的電信化從過去五十年中拿去,我們會發現我們可能GDP不但沒有增加,而且還在減少。那麼這是過去五十年的情況。
在今後二十年它又會往哪兒走呢?在未來的二十年裡,什麼決定世界經濟發展的方向?我認為如果說過去五十年是摩爾定律的時代,未來二十年就是數據為王的時代。
大數據會帶來機器智能,也就是說讓我們的計算機變得非常聰明,以至於它超過我們人類的智能。為什麼這么說呢?我們剛才講了,計算機的發展速度本身是一個指數增長,而我們人的智能的發展速度是一個線性增長,甚至還會稍微慢一點,那麼一定在某一個時間點,它會重合。
今天可能就是這個重合的時間點,那可能你又會問了,為什麼正好在這個時間點上,我們會有這么多的數據?一個是互聯網的收集和積累,再有一個就是今天各種感測器,各種智能設備,各種監控設備,它們無時無刻地不在為我們提供大量的數據。而在我們過去,因為存儲量計算量不夠的時候,我們把這些數據都拋棄掉了,不是說這些數據在過去不存在現在存在,只是說我們現在因為半導體事業的發展,我們有能力,有可能來存儲和處理這樣一些數據。
(2)吳軍博士認為大數據加上機器智能擴展閱讀:
吳軍博士簡介:
畢業於清華大學計算機系(本科)和清華大學電子工程系(碩士),並於1993-1996年在清華任講師。於1996年起在美國約翰霍普金斯大學攻讀博士,並於2002年獲得計算機科學博士學位。
在清華和約翰霍普金斯大學期間,吳軍博士致力於語音識別、自然語言處理,特別是統計語言模型的研究。他曾獲得1995年的全國人機語音智能介面會議的最佳論文獎和2000年Eurospeech的最佳論文獎。
吳軍博士於2002年加入Google公司,任Google研究院資深研究員。到Google不久,他和三個同事們開創了網路搜索反作弊的研究領域,並因此獲得工程獎。
2003年,他和兩個同事共同成立了中日韓文搜索部門。吳軍博士是當前Google中日韓文搜索演算法的主要設計者。在Google期間,他領導了許多研發項目,包括許多與中文相關的產品和自然語言處理的項目,並得到了公司首席執行官埃里克·施密特的高度評價。
吳軍博士在國內外發表過數十篇論文並獲得和申請了近十項美國和國際專利。他於2005年起,當選為約翰霍普金斯大學計算機系董事會董事。
2010年,吳軍博士離開Google,加盟騰訊公司,擔任負責搜索業務的副總裁。並擔任國家重大專項「新一代搜索引擎和瀏覽器」項目的總負責人。
❸ 讀《智能時代》前兩章有感
偶得吳軍老師的《智能時代》一書,閱讀該書前兩章,感覺受益匪淺,尤其是通過對第二章「大數據與機器智能」的閱讀,才使我對人工智慧的歷史有了一個大致的了解,現將感想傾諸於下。
一、「數據」概述
雖然我對人工智慧的具體情況尚不了解,但大致知道現階段的人工智慧需要以大數據為基礎,而《智能時代》第一章即詳細介紹了數據的相關問題。
首先,「在計算機出現之前,一般書籍上的文字內容並不被看成數據,」而今天,不止書籍上的文字內容,連我們的活動,我們每天的言談舉止,喜愛偏好等,都已被看成是某種數據。
在人類社會早期,我們通過觀察現象,總結數據,再從數據中提取出有用的信息,並在信息的基礎上形成知識(知識具有系統性),從而指導我們的行為。我們使用數據的標准流程如下:
而在過去數據的作用之所以不被重視,「這裡面有兩個原因,首先是由於過去數據量不足,積累大量的數據所需要的時間太長,以至於在較短的時間里它的作用不明顯。其次,數據和所想獲得的信息之間的聯系通常是間接的,它要通過不同數據之間的相關性才能體現出來。」而這種相關性也有待人們的發掘,吳軍老師舉了王進喜照片與日本投標之間的關聯、谷歌用戶對某節目的搜索量和該節目收視率之間的關聯以及搜索趨勢和流感疫情之間的關聯等來說明相關性的重要。
而關於第一個原因,「在互聯網出現之前,獲得大量的具有代表性的數據其實並非一件容易事,在誤差允許的范圍內做些統計當然沒有問題,但只有在很少的情況下能夠單純依靠數據來解決復雜的問題。因此在20世紀90年代之前,整個社會對數據並不是很看重。」
數據的相關性還要透過建立合適的數學模型來更好的加以利用,「要建立數學模型就要解決兩個問題,首先是採用什麼樣的模型,其次是模型的參數是多少。」「……如果一開始模型選得不好,那麼以後修修補補就很困難。因此,在過去,無論在理論上還是工程上,大家都把主要的精力放在尋找模型上。」
「有了模型之後,第二步就是要找到模型的參數,以便讓模型至少和以前觀察到的數據相吻合。這一點在過去的被重視程度遠不如找模型。但是今天他又有了一個比較時髦而高深的詞——機器學習。」(程按:既輸入數據,不斷調整模型,這和今天機器學習的方法類似)
「回到數學模型上,其實只要數據量足夠,就可以用若干個簡單的模型取代一個復雜的模型。這種方法被稱為數據驅動方法,因為它是先有大量的數據,而不是預設的模型,然後用很多簡單的模型去契合數據(Fit Data)。雖然這種數據驅動方法在數據量不足時找到的一組模型可能和真實的模型存在一定的偏差,但是在誤差允許的范圍內,單從結果上看和精確的模型是等效的,這在數學上是有根據的。從原理上講,這類似於前面提到的切比雪夫大數定律。
當然,數據驅動方法要想成功,除了數據量大之外,還要有一個前提,那就是樣本必須非常具有代表性,這在任何統計學教科書里的一句話,但是在現實生活中要做到是非常難的。……」
二、大數據和機器智能
「在2000年以後,由於互聯網特別是後來移動互聯網的出現,數據量不僅劇增,而且開始相互關聯,出現了大數據的概念,在2000 年以後,由於互聯網特別是後來移動互聯網的出現,科學家和工程師們發現,採用大數據的方法能夠使計算機的智能水平產生飛躍,這樣在很多領域計算機將獲得比人類智能更高的智能。可以說我們正在經歷一場由大數據帶來的技術革命,其最典型的特徵就是計算機智能水平的提高,因此我們不妨把這場革命稱為智能革命。當計算機的智能水平趕上甚至超過人類時,我們的社會就要發生天翻地覆的變化,這才是大數據的可怕之處。
那麼為什麼大數據會最終導致這樣的結果,大數據和機器智能是什麼關系呢?要說清楚這一一點,首先要說明什麼是機器智能。」
「1946年,第一台電子計算機ENIAC誕生,這使得人類重新開始考慮機器能否有智能的問題。」
「真正科學地定義什麼是機器智能的還是電子計算機的奠基人阿蘭·圖靈博士。1950年,圖靈在《思想》雜志上發表了一篇題為《計算的機器和智能》的論文。在論文中,圖靈既沒有講計算機怎樣才能獲得智能,也沒有提出什麼解決復雜問題的智能方法,而只是提出了一種驗證機器有無智能的判別方法。」既讓一個裁判坐在墓前和幕後的「人」交流,幕後是一台機器和一個人,如果裁判無法判斷出與自己交流的是人還是機器,那麼就說明這台機器擁有了和人同等的智能。
「這種方法被後人稱為圖靈測試(Turing Test)。計算機科學家們認為,如果計算機實現了下面幾件事情中的一件,就可以認為它有圖靈所說的那種智能:
1.語音識別
2.機器翻譯
3文本的自動摘要或者寫作
4.戰勝人類的國際象棋冠軍
5.自動回答問題
今天,計算機已經做到了上述這幾件事情,有些時候還超額完成了任務,比如在下棋方面,不僅戰勝了國際象棋的世界冠軍,而且還戰勝了圍棋的世界冠軍,後者的難度比前者高出6~8個數量級。當然,人類走到這一步並非一帆風順,而是先走了十幾年的彎路。」
鳥飛派:人工智慧1.0
「據記載,1956年的夏天,香農和一群年輕的學者在達特茅斯學院召開了一次頭腦風暴式的研討會。……事實上,這是一次頭腦風暴式的討論會。這10位年輕的學者討論的是當時計算機科學尚未解決,甚至尚未開展研究的問題,包括人工智慧、自然語言處理和神經網路等。人工智慧這個說法便是在這次會議上提出的。」
「人工智慧這個名詞嚴格地講在今天有兩個定義,第一個是泛指機器智能,也就是任何可以讓計算機通過圖靈測試的方法,包括我們在本書中要經常講的數據驅動方法。第二個是狹義上的概念,即20世紀五六十年代特定的研究機器智能的方法。今天,幾乎所有書名含有「人工智慧」字樣的教科書(包括全球銷量最大的由斯圖亞特·羅素和諾威格編寫的《人工智慧:一種現代的方法》一書)依然用主要的篇幅介紹那些「好的老式的人工智慧」(Good Old
Fashioned)。後來那些利用其他方法產生機器智能的學者為了劃清自己和傳統方法的界限,特地強調自己不是用人工智慧的方法。因此,學術界將機器智能分為傳統人工智慧的方法和現代其他的方法(比如數據驅動、知識發現或者機器學習)。當然,計算機領域之外的人在談到人工智慧時,常常是泛指任何機器智能,而並不局限於傳統的方法。因此為了便於區分,我們在本書中盡可能地使用機器智能表示廣義上的概念,而在使用人工智慧表達時,通常是指傳統的人工智慧方法,甚至我們有時會強調為人工智慧1.0。
那麼傳統的人工智慧方法是什麼呢?簡單地講,就是首先了解人類是如何產生智能的,然後讓計算機按照人的思路去做。今天幾乎所有的科學家都不堅持「機器要像人一樣思考才能獲得智能」,但是很多的門外漢在談到人工智慧時依然想像著「機器在像我們那樣思考」,這讓他們既興奮又擔心。事實上,當我們回到圖靈博士描述機器智能的原點時就能發現,機器智能最重要的是能夠解決人腦所能解決的問題,而不在於是否需要採用和人一樣的方法。
為什麼早期科學家們的想法會和今天的門外漢一樣天真呢?這個道理很簡單,因為這是根據我們的直覺最容易想到的方法,在人類發明的歷史上,很多領域早期的嘗試都是模仿人或者動物的行為。比如人類在幾千年之前就夢想著飛行,於是就開始模仿鳥,在東方和西方都有類似的記錄,將鳥的羽毛做成翅膀綁在人的胳膊上往下跳,當然實驗的結果都可想而知。後來人們把這樣的方法論稱作「鳥飛派」,也就是看看鳥是怎樣飛的,就能模仿鳥造出飛機,而不需要了解空氣動力學。事實上我們知道,懷特兄弟發明飛機靠的是空氣動力學而不是仿生學。在這里,我們不要笑話前輩來自直覺的天真想法,這是人類認識的普遍規律。
在人工智慧剛被提出來的時候,這個研究課題在全世界都非常熱門,大家彷彿覺得用不了多長時間就可以讓計算機變得比人聰明了。遺憾的是,經過十幾年的研究,科學家們發現人工智慧遠不是那麼回事,除了做出了幾個簡單的「玩具」,比如讓機器人像猴子一樣摘香蕉,解決不了什麼實際問題。到了20世紀60年代末,計算機科學的其他分支都發展得非常迅速,但是人工智慧研究卻開展不下去了。因此,美國計算機學界開始反思人工智慧的發展。雖然一些人認為機器之所以智能水平有限,是因為它還不夠快、容量不夠大,但是,也有一些有識之士認為,科學家們走錯了路,照著那條路走下去,計算機再快也解決不了智能問題。」
明斯基在《語義信息處理》引用了巴希勒使用過的一個例子: The pen was
in the box和The box was in the pen,來說明目前人工人工智慧的局限性。
「這兩句話會得到相同的語法分析樹,而僅僅根據這兩句話本身,甚至通篇文章,是無法判定pen在哪一句話中應該作為圍欄,在哪一句話中應該是鋼筆的意思。事實上人對這兩句話的理解並非來自語法分析和語意本身,而是來自他們的常識或者說關於世界的知識(world knowledge),這個問題是傳統的人工智慧方法解決不了的。因此,明斯基給出了他的結論:『目前』(指1968年)的方法無法讓計算機真正有類似於人的智能。由於明斯基在計算機科學界具有崇高的聲望,他的這篇論文導致美國政府削減了幾乎全部人工智慧研究的經費,在之後大約20年左右的時間里,全世界人工智慧在學術界的研究是處於低谷的。」
另闢蹊徑:統計+數據
「到了20世紀70年代,人類開始嘗試機器智能的另一條發展道路,即採用數據驅動和超級計算的方法,而這個嘗試始於工業界而非大學。
在那個年代,IBM在全世界計算機乃至整個IT產業可以說是處於獨孤求敗的地位。……這時,IBM考慮的不能再是如何佔有更大的市場份額,而是如何讓計算機變得更聰明。
1972年,康奈爾大學的教授弗雷德·賈里尼克(Fred Jelinek,1932-2010)到IBM做學術休假,正好這時IBM想開發「聰明的計算機」,賈里尼克就「臨時」負責起這個項目。至於什麼是聰明的計算機,當時大家的共識是它要麼能夠聽懂人的話,要麼能將一種語言翻譯成另一種語言,要麼能夠贏得了國際象棋的世界冠軍。賈里尼克根據自己的特長和IBM的條件,選擇了第一個任務,即計算機自動識別人的語音。」
賈里尼克認為語音識別是一個智能問題,而是一個通信問題,既人發出語音是一個大腦編碼的過程,編碼完成,經過傳播,傳入聽者的耳朵,聽者接受並理解則是一個解碼的過程,而對於語音識別問題也可以按此處理,他「用當時已經頗為成熟的數字通信的各種技術來實現語音識別,而徹底拋開了人工智慧的那一套方法(指傳統的方法,讓計算機模擬人)」
「賈里尼克和他的同事在研究語音識別時,無意中開創了一種採用統計的方法解決智能問題的途徑,因為這種方法需要使用大量的數據,因此又被稱為數據驅動方法。這種方法最大的好處是,隨著數據量的積累,系統會變得越來越好,相比之下過去人工智慧的方法很難受益於數據量的提升。」
「在語音識別之後,歐洲和美國的科學家開始考慮能否用數據驅動方法解決其他智能問題。賈里尼克的同事彼得·布朗(Peter Brown)在20世紀80年代,將這種數據驅動方法用於機器翻譯。但是由於缺乏數據,最初的翻譯結果並不令人滿意,雖然一些學者認可這種方法,但是其他學者,尤其是早期從事這項工作的學者認為,解決機器翻譯這樣智能的問題,光靠基於數據的統計是不夠的。從20世紀80年代初到90年代中期大約十多年的時間里,在計算機界大家一直有個爭議,那就是數據驅動方法是否適用於各種領域,語音識別是否只是一個特例。簡單地講,當時無論是做語音識別、機器翻譯、圖像識別,還是自然語言理解的學者,分成了界限很明確的兩派,一派堅持採用傳統的人工智慧方法解決問題,簡單來講就是模仿人,另一派在倡導數據驅動方法。這兩派在不同的領域力量不一樣,在語音識別和自然語言理解領域,提倡數據驅動的一派比較快地佔了上風;而在圖像識別和機器翻譯方面,在較長時間里,數據驅動這一派處於下風。這裡面主要的原因是,在圖像識別和機器翻譯領域,過去的數據量非常少,而這種數據的積累非常困難。圖像識別就不用講了,在互聯網出現之前,沒有一個實驗室有上百萬張圖片。在機器翻譯領域,所需要的數據除了一般的文本數據,還需要大量的雙語(甚至是多語種)對照的數據,而在互聯網出現之前,除了《聖經》和少量聯合國文件,再也找不到類似的數據了。」但隨著互聯網的興起,數據的獲取變得容易起來,2005年穀歌公司打敗全世界所有機器翻譯研究團隊所用的方法依然是數據驅動方法,而之所以能贏,則是因為「用了比其他研究所多幾千倍甚至上萬倍的數據。」
「如今在很多與「智能」有關的研究領域,比如圖像識別和自然語言理解,如果所採用的方法無法利用數據最的優勢,會被認為是落伍的。
數據驅動方法從20 世紀70年代開始起步,在八九十年代得到緩慢但穩步的發展。進入21世紀後,由於互聯網的出現,使得可用的數據量劇增,數據驅動方法的優勢越來越明顯,最終完成了從量變到質變的飛躍。如今很多需要類似人類智能才能做的事情,計算機已經可以勝任了,這得益於數據量的增加。
全世界各個領域數據不斷向外擴展,漸漸形成了另外一個特點,那就是很多數據開始出現交叉,各個維度的數據從點和線漸漸連成了網,或者說,數據之間的關聯性極大地增強,在這樣的背景下,就出現了大數據。」
「在有大數據之前,計算機並不擅長解決需要人類智能來解決的問題, 但是今天這些問題換個思路就可以解決了,其核心就是變智能問題為數據問題。由此,全世界開始了新的一一輪技術革命智能革命。」
盡管過往數年,計算機能做的事情越來越來,但給人的感覺仍然是「快卻不夠聰明」,但當我們擁有足夠多的數據之後,便可以化智能問題為數據問題,機器不再需要像人一樣思考才能解決問題,只要輸入足夠的數據,配合合適的演算法(模型),機器便可以做出最優的判斷。深藍即使戰勝了卡斯帕羅,「但在這看似聰明的表象背後,其實是大量的數據、並不算復雜的演算法和超強計算能力的結合——深藍從來沒有,也不需要像人一樣思考。」
「計算機下棋和回答問題,體現出大數據對機器智能的決定作用。我們在後面會看到很多各種各樣的機器人,比如 Google自動駕駛汽車、能夠診斷癌症或者為報紙寫文章的計算機,它們不需要像科幻電影里的機器人那樣長著人形,但是它們都在某個方面具有超過人類的智能。在這些機器人的背後,是數據中心強大的伺服器集群,而從方法上講,它們獲得智能的方法不是和我們人一樣靠推理,而更多的是利用大數據,從數據中學習獲得信息和知識。如今,這一場由大數據引發的改變世界的革命已經悄然發生,我們在後面的幾章會更深入地介紹它。這次技術革命的特點是機器的智能化,因此我們稱之為智能革命也毫不為過。」
❹ 《智能時代大數據與智能革命重新定義未來》epub下載在線閱讀全文,求百度網盤雲資源
《智能時代》([美國] 吳軍)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:
書名:智能時代
作者:[美國] 吳軍
豆瓣評分:8.4
出版社:中信出版集團
出版年份:2016-8
頁數:374
內容簡介:
大數據和機器智能的出現,對我們的技術發展、商業和社會都會產生重大的影響。作者吳軍在《智能時代:大數據與智能革命重新定義未來》中指出,首先,我們在過去認為非常難以解決的問題,會因為大數據和機器智能的使用而迎刃而解,比如解決癌症個性化治療的難題。同時,大數據和機器智能還會徹底改變未來的商業模式,很多傳統的行業都將採用智能技術實現升級換代,同時改變原有的商業模式。大數據和機器智能對於未來社會的影響是全方位的。
作者簡介:
吳軍,博士,與2002年加入谷歌公司,2010年加盟騰訊公司,出任負責搜索和搜索廣告的副總裁。2012-2014年回到谷歌,領導計算機自動問答項目。2014年,他在矽谷創辦了豐元資本風險投資公司。他在美國兩家風險投資基金(中國世紀基金和ZPark風險基金)分別擔任董事和顧問,也是約翰霍普金斯大學工商學院董事會董事,以及該校國際事務委員會的顧問。
❺ 吳軍博士認為未來二十年是什麼為王的時代
吳軍博士認為未來二十年是數據為王的時代。
出自吳軍博士的《大數據改變未來》原話是:
在今後二十年它又會往哪兒走呢?在未來的二十年裡,什麼決定世界經濟發展的方向?我認為,如果說過去五十年是摩爾定律的時代,未來二十年就是數據為王的時代。
大數據會帶來機器智能,也就是說讓我們的計算機變得非常聰明,以至於它超過我們人類的智能。
(5)吳軍博士認為大數據加上機器智能擴展閱讀:
吳軍博士認為,大數據加上機器智能,它可以把我們以前所有的行業,全部的改造的一遍,或者換一句話說,就是說所有未來公司,都是某種程度上的大數據公司。大數據有一個特點是,可以非常精密地定位和確定世界發生的每一件小事。
從05、06年以後,搜索以前大量數據就不一樣了,比如搜到了三十多條信息,再過到07、08年的時候數據量更大,有時甚至不知道原因時就已經知道結果了,這時就有一個思維方式的改變,由於大數據多維度看問題,就從多個方面保障的了結果,這也是大數據的本質。
❻ 《智能時代》讀後心得
吳軍博士的《智能時代》一書,介紹了數據的產生,發展以及過渡到大數據的過程;詳細介紹了大數據的特點,及人工智慧對思維方式的促進轉變;闡明了技術革命對各類型產業發展的推動;從辯證的角度詳列大數據智能時代帶來的負面影響和對策;展望了大數據的前景和對知識精英的素質要求。整體上深入淺出,通俗易懂。對我這個「門外漢」來說,技術科普類書籍寫出了故事性,加深了興趣,收獲頗多!
一、數據引起的對抗。 數據成為重要資源,那麼佔有了大規模,各類型的數據信息,就把握了商機,把握了主動。因此數據資源的爭奪必將趨於激烈,並且波及政治、經濟、生活等方面。美國打著信息安全的幌子,制約華為在5G領域的全面鋪開,根本上還是數據信息領域的主動權爭奪。「棱鏡門」,「維基解密」等系列曝光的信息安全問題,都是由美國主導。利用技術優勢,美國佔有了大量數據資源全球監控,甚至不顧及敵我,不顧及外交,不顧及游戲規則,幾近「瘋狂」。因為他們看到了大數據發展的潛在影響,想要大量佔有數據資源。有爭奪就有保護,保護更多的建立在技術層面。我國的中興被美國晶元公司「卡了脖子」,龐大的「軀體」轟然倒下。現在「列強們」又故技重施,想要制裁華為,理由還是數據安全。所以數據的保護擴展到技術、科技層面,對抗和突破也趨於白熱化。對於數據本身,在互聯網時代本身就真假難辨,那麼數據質量的差異也會產生對抗。同領域、同模式的項目,質量差異導致的結果不盡相同,誰能夠把握數據背後的真相,這要根據數據的數量規模、維度、時效來製作模型,那麼收集數據的手段必然帶來多樣的爭奪。所有智能化的設備都成為感測器、記錄儀,誰又能佔有最大的份額呢?
二、 數據展示的力量。 閱讀《智能時代》,我忽然眼界開闊了。因為過往的典型故事背後是大數據智能分析的支撐。以色列農業的驚人成就給人類食品生產供應帶來了福音;美國勇士籃球隊短期高效的成績提高給了籃球愛好者超高的震撼。 華爾街投資大神、對沖基金公司橋水創始人瑞·達利歐在其代表作《原則》中提到了自己工作的方法,其實也是大數據思維的一種模式,可以說,他的成功也是大數據使用的一個成功版本。生活中,商業采購,個人定製,精準貼心服務哪一件都有大數據在展示力量,我們已經與大數據「水乳交融」。目前大數據智能時代才剛剛興起,它的力量在未來各領域必將帶來更多更大的變化。
三、數據帶來的隱憂。 沒有人、集團、國家喜歡赤裸裸地暴露在公眾面前,沒有一點隱私。本書中也提到了保護隱私的一些方法,有很強的借鑒意義。但是大數據確實讓我們享受了便利,同時又不得不模糊了隱私保護的概念,甚至根本意識不到便利背後的隱私泄露。作為國家機器的重要部分,國防和軍隊面對大數據該怎麼權衡呢?保守秘密——毋庸置疑。怎麼保護?這個課題就有點復雜,管理、教育、技術防範、制度約束都不能缺失。我認為關鍵在人,關鍵在忠誠。任何科技的影響都有規律可循,都可以有防範措施方法,但是忠誠缺失,任何方法都無濟於事。有了忠誠,就有了自覺,提高了警覺,警醒自己不觸紅線。——所以政治合格是根本。當然利用大數據分析竊取國防軍隊秘密的案例肯定會有,那麼研究保護技術,做好內部風險防控是必不可少的。真心期盼在智能時代有合理、人性的解決辦法。
四、迎接智能時代。 二十年以前,人們的交流方式以寫信為主,當時人們的文字寫作能力應該很強;後來有了BP機,可以留言,有事可以找公用電話交流,感覺到聯系起來挺方便,只是月服務費不少,設備的價格不菲;那時的網路流行QQ聊天,發郵件,時髦的年輕人喜歡到遍地開花的網吧泡一泡;十年前手機開始流行,打電話發信息讓許多人愛不釋手,就是信號不太好,價格挺貴,一般人不好「養活」;同時期還出現了價格優惠的「小靈通」,但是流行兩三年後消失在勞苦大眾的記憶里;再後來智能手機發展起來,生活方式徹底變了天——智能時代改變了太多生活。聊天用微信,購物用微信,視頻用微信,看書用手機,游戲用手機,看電視機電影用手機——手機已經無所不能。特別是駕車出行,高德、網路、騰訊三家導航軟體非常給力,「路盲」基本消失,雖然偶爾也有導錯的現象,但是如果細心些,你會發現只要每次版本更新,它的服務越來越可心。這是科技發展的成果,它的背後是大數據的影子。今後,只要感覺到生活方便了,你就說那是大數據時代的標志,准沒錯。大數據智能時代來了,我們做點什麼呢?首先要 做到融入不能排斥 。比如智能駕駛,許多搞這項研究的學者也懷著深深的擔憂——一旦智能識別出錯,將會帶來災難性問題——但是仍然積極投入到智能駕駛的研究測試當中,更多引入復雜模型來確保真正的萬無一失。這種科學精神就是面對科技發展的良好狀態。作為普通公眾,積極的學習大數據的知識,搞清來龍去脈,用尊重科學的心態融入大數據智能時代,充分運用大數據成果就是最好的科學素養。另外 大數據也帶來新的思維,我們需要熟練運用這樣的思維 。太多的不確定性是人類恐懼的根源。但是大數據研究的方法在數據足夠充分的時候能夠降低不確定性,減少人類思維上的畏懼感。所以提供客觀真實的數據也是普通大眾的一項工作。經常用大數據的思維來澆灌一下傳統的腦袋,相信也會帶來滿滿的新科技感。 大數據促使人類創新創業拓展發展領域 。不要擔心智能時代搶走了多數人的工作,智能時代是個漸進的過程,在工作崗位淘汰的過程中,新的崗位會被「擠」出來,人類的創新能力會被「壓」出來;物質領域豐富了,精神領域的開發前景廣闊。
❼ 吳軍博士認為過去五十年是什麼時代
過去五十年是摩爾定律的時代。
原話是:「我認為,如果說過去五十年是摩爾定律的時代,未來二十年就是數據為網的時代"
參考資料
摩爾定律由英特爾(Intel)創始人之一戈登·摩爾(Gordon Moore)提出來,其內容為:當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個月翻一倍以上。這一定律揭示了信息技術進步的速度。
盡管這種趨勢已經持續了超過半個世紀,摩爾定律仍應該被認為是觀測或推測,而不是一個物理或自然法。預計定律將持續到至少2015年或2020年。然而,2010年國際半導體技術發展路線圖的更新增長已經放緩在2013年年底,之後的時間里晶體管數量密度預計只會每三年翻一番。
❽ 吳軍:互聯網創業到底有多蠢
以下內容來自高山大學2019年經典課程。授課老師:吳軍,著名學者,投資人,人工智慧、語音識別和互聯網搜索專家。豐元創投創始合夥人,前Google智能搜索科學家,前騰訊副總裁。著有《數學之美》《浪潮之巔》《矽谷之謎》《文明之光》《智能時代》等多部暢銷圖書。
今天主要給大家講講矽谷的技術趨勢。
為什麼矽谷今天的技術是這樣的,他有一個很重要的前提叫做: 預先要求 。
比如說我們能在2007年的時候用上智能手機,原因是20年前也就是1987年左右,伯克利發明了雙觸屏技術。這就是預先要求。
再一個就是要有足夠的市場規模。比如互聯網市場其實就是一個很小的市場,養不活那麼多公司。全世界有上百萬家互聯網公司,但99.9%是虧錢的。
今天我用一個投資人而不是教授的眼光來看看在矽谷投資,看看矽谷的技術發展趨勢 。
大概從2008年開始有兩個熱門的詞,一個是雲計算,一個是移動互聯網。當時標志性的事件就是亞馬遜和Google開始對外提供收費的雲計算服務,而不是僅僅是他自己的企業級內部的服務。另外一個就是當時安卓系統出來了。
這兩件事的發生帶來了企業級的軟體和服務的升級。
2010年前後,全世界的企業級軟體和服務的市場大概約5000多億美元。當時美國一個IT企業里平均每個員工IT費用約5000美元左右,即使是一個UPS的投遞員,一年所花的企業級軟體費用大概也有500美元,到現在這個規模就更大了。所以這個市場很大。這也是為什麼微軟、IBM這樣的公司很成功的主要原因之一。
5000億美元是什麼樣一個概念呢?拿互聯網行業來比的話,2016年全世界互聯網市場是3800億美元,2018年估計是4500億美元。互聯網市場增長很快,但是依然沒有達到肆基企業級軟體服務的水平。
然而全世界的互聯網公司比軟體公司要多得多,所以這也是為什麼全世界互聯網公司大部分不掙錢。當然,更主要的是,互聯網公司和軟體公司不一樣,Google一家佔了全世界1/4的市場,1/3的互聯網收入,再加上阿里巴巴、騰訊、Facebook、亞馬遜等等,共佔到了80%,然後剩下全世界一百多萬家互聯網公司(其中一大半在中國)去爭不到1000億美元的市場,所以是不可能掙得著錢的。
所以就創業來講, 互聯網創業是很蠢的一個行為 。
企業級軟體和服務這個轎高市場在中國大家並不熟悉,因為中國大部分都是不付軟體費,付也付得很少 。所以這種環境就生生把一個本來可以很做的很大市場給做沒了。今天中國做企業級軟體的公司像東軟、金山、用友等上市公司市值全部加起來,都不到Adobe的一半,而Adobe還只是一個中型的軟體公司。
中國出了一個新概念,其實就是這件事的一個翻版。叫工業互聯網或者企業互聯網。
那麼話說回來,為什麼從2008年到2016年大概8年時間里,美國要通過這兩件事把企業級的軟體做轉型升級呢?
因為如果用亞馬遜的雲服務或者Google微軟的雲服務,加上原來的企業級的軟體服務這種解決方案。相比過去買IBM的計算機和Oracle的計算機伺服器,再用他們資料庫,成本要低70%左右裂帆謹。所以大家都覺得這是一個趨勢。
今天大家都在說,為什麼微軟好像又重新起步了,市值超過1萬億美元。但是仔細去讀微軟財報,就會發現它利潤其實並沒有增長。
它的市值漲了一倍多,原因在於它的估值PE漲了一倍多。為什麼PE漲?原因很簡單。微軟原來賣軟體,現在變成了在雲計算上賣服務,大家覺得這是未來的發展方向,所以它估值又高了。
中國過去在企業及軟體和服務這件事上收不來錢,但今天有可能收得來錢 ,為什麼?因為現在不賣軟體,而是把軟體放在雲端賣服務了。這已經慢慢的形成一個趨勢了。
趨勢能夠形成,就在於它的預先條件成熟了。
有了雲計算,有了移動互聯網,有了感測器技術,就帶來了大數據。很多數據原來不是沒有,而是有但我們無法收集。 過去3年裡,我們收集的數據是人類有史以來到3年前所有數據的總和 。
有了雲計算和大數據,機器智能或者說人工智慧就產生了。
今天之所以有人工智慧,有三個重要原因。
一是處理器的處理速度非常快 。
處理器進步的速度有多快,你們可能想不到。舉例來說,就是如果我們用1946年的計算機技術來實現2016年Google AlphaGo贏李世石的那台計算機,用電量要多少?
要用掉幾百萬個三峽的發電量。
這就是一個基本技術進步。正是因為有這樣快的技術進步,今天的計算機才變得如此聰明。
第二個是數學模型比較好 ,能把我們現實生活中很多看上去不是數學問題的問題變成數學問題,然後用計算器計算。
第三個就是大數據 。
面對大量的數據,如果用的還是用我們傳統的方法先建數學模型再去琢磨,那是不行的。用到大數據,就需要機器智能。有了機器智能,有了移動互聯網,有了感測器,自然而然就到了今天很熱門的一個概念:萬物互聯IoT。
IoT這個市場有多大呢?
當我們周圍全部是智能設備的時候,智能 汽車 、智能家居等等,都能夠直接上網,這里不是說通過你手機或者通過Wifi上網,而是每個智能設備都會有一個類似於我們手機SIM卡,通過這個卡來上網。這個時候我們現在的4G就不夠用了。因為不可能並發處理這么多信息,那麼就需要5G,所以這兩個是關聯的。
IoT和5G的結合,最保守的估計,到2030年,可以把這目前這兩個市場的總和翻一番 。每年增長6%不算太快,跟中國的GDP比的話。
但是在世界整個IT行業的增長來講,這是一個很令人振奮的信息。為什麼呢?
剛才我提到全世界互聯網市場大概4000多億美元,那電信市場有多大呢?大10倍,將近4萬億。
電信市場是個十倍大的市場,而且從業的公司沒有那麼多。到2030年,這個市場大概能擴大到8萬多億美元。差4萬億。4萬億什麼概念呢?今天日本的GDP就是4萬多億,德國是3.8萬億。80多年前,日本人說大東亞共榮根本不可能實現,但現在, 中國要是真在IoT+5G時代佔了一個主要的大的市場份額,創造出相當於日本現在的GDP的市場,其實也就是相當於實現了大工業大東亞共榮。
通過技術的方式,能做到這一點,這是一個未來大的市場。
從投資角度來講,為什麼有些技術我們投有些不投呢?
原因在於,首先這些預先的技術你是否滿足了。
第二個就是市場規模的前景要很大。我一直覺得大家來高山大學學習特別好,就在於高山大學教大家科學,學習科學你就會算這筆賬。很多 科技 媒體報道,甚至有一些大學商學院講他們不會教你科學的底層邏輯,糊里糊塗告訴你一個趨勢,這個趨勢沒有科學基礎是不行的。
再接下來就是大數據。機器智能和生物醫療技術結合起來,就形成一個大產業,就是IT+醫療,這也是一個非常大的市場。
我們現在檢查身體的很多設備其實都很老,聽診器大概用了幾百年了,心電圖也有上百年的 歷史 了,CT和MRI都現在也有40多年了,但這些都被認為是目前比較先進的診療手段。仔細想想,我們的手機是什麼樣的,更新迭代的速度有多塊,如果我們用的一個IT產品還是40年前的,你肯定會覺得這東西基本上沒法用了,但是我們的醫療設備就是這樣的。
此外,我們做的檢查也很老套,比如你心臟不舒服了,去醫院醫生會讓你測一下心電圖,但如果檢測的時候心臟正好正常的話,那就測不出來任何問題。我們希望有什麼樣的檢查方法呢?那就是最好有一些設備,能夠隨時監控跟蹤我們整個人的新陳代謝,細到我們身體出了任何問題它都會馬上知道。
特斯拉 汽車 與寶馬或者賓士車相比,最大的區別就在於,一旦車出了什麼問題,給他們一個電話,他們能立刻預約維修。因為特斯拉對自己的車有監控,能夠隨時進行分析。但是賓士寶馬不一樣,他們有記錄,但沒有互聯網監控,一旦車出了什麼問題,就會要比較長的維修時間。
今天很多工業設備是有監控的,比如說像商用的噴氣式飛機的發動機,上面有一千多個感測器,每天運行一下,能夠收集大概超過1G的原始數據,就是它里頭溫度、燃燒、濕度等等各方面都記錄得很好。
再比如說機場維修發動機也是很快的一件事情,因為他們也有非常好的記錄和監控。但是我們身體沒有一個感測器。所以說智能與醫療結合會產生一個大的市場。
那麼這個市場到底有多大呢?
美國2018年GDP為20萬億美元,醫療方面費用約佔18%的GDP,也就是3.6萬億美元。中國市場多大?如果除掉其他雜費,只按照醫院的收費,這個市場非常小,佔GDP的不到5%。如果把買保健品等各種醫葯雜費都算上,佔比就很大,但是這個沒法估算。
上海交大商學院有一個大概估計,約佔GDP 13%到14%,跟美國也差不多。所以這兩個國家AI+醫療的市場就差不多6萬億。所以這是一個很大的市場。我講這些東西就是要告訴大家 眼界要開闊一些,不要老想著技術,或者老想著互聯網上我能琢磨點什麼東西,市場太小,格局太低。
另外,當我們有了人工智慧,有了IoT、有了區塊鏈,整個世界就會形成一個超級智能。單個蜜蜂的智能水平非常差,但是一旦形成了一個群體的智能的時候,就會很強。相比於人而言的個體決策,人工智慧收集了很多數據,最終形成綜合的決策,所以這在未來會是一個很大的市場。
❾ 機械思維、大數據思維與人的世界
吳軍博士的新書叫《智能時代》,副標題是「大數據與智能革命重新定義未來」,因為這個智能革命恰恰源於數據驅動,與此相對應的是機械思維驅動了工業革命。從歷史的角度來看,這似乎只是不同的發展階段,但如果從底層邏輯來看,我認為這只是不同數據尺度的體現。
機械思維到大數據思維既不對立互斥也並不彼此相鄰。如果籠統地總結,機械思維當隸屬小數世界,大數據則隸屬大數世界,而處於兩者中間的是我們的日常更常面對的中數世界。
一、機械思維與小數世界
在當今的我們看來,「機械思維」好像是滯後的、呆板的象徵,甚至「機械」本身也成為了對某個人的形容,然而絕非褒義。然而在17世紀,機械思維就像當今的所謂互聯網思維一樣時髦。
機械思維的方法論如果用八字箴言來概括我覺得沒有比「大膽假設、小裂燃心求證」更合適的了。大體上就是做出假設、建構模型、數據證實、優化模型肆臘虛、預測未來。這也是沿用至今的一套思路。成果也是顯然的,比如,牛頓——他用力學三定律和萬有引力定律幾個簡單明了的公式說明了大千世界宇宙萬物的運動規律。
這裡面有三個點, 一是公式的確定,二是公式的簡明,三是公式的普適 。這也是機械思維的三大特質。
先看確定性和普適性。牛頓的定律無論應用於什麼樣的場合,都可以用一樣的公式推出相應的確定的結論。這對於人們來說非常重要,因為根據種種確定的定律和原理,世界對於我們而言成為可知,我們也可以藉此預測系統中其他變數的反饋、預測未來。
簡明性一樣重要。牛頓所處的時代宇宙的復雜程度並不比現在弱,不一樣的只是思維方式決定的模型差異。太陽系中有成千上萬的天體,按照完全的計算,就復雜了去了。然而萬有引力定律非常簡潔優雅,將萬千天體的作用回歸到依次考慮兩兩天體的互相作用力中。甚至更進一步,由於太陽獨一無二的巨大質量,牛頓將每個行星和太陽看成一個獨立的二物系統,得到了更進一步簡化。回歸到兩物體系統自然是個「小數」,然而這個所謂的小數世界原本其實並不那麼小。比如,在一個僅考慮兩物體的系統中,涉及到兩物體各自的情況、彼此相互作用的情況和它們所在的系統的情況。如果借用數學和力學概念來描述,那麼兩物體系統涉及到孤立方程、相互作用方程和場方程共4個方程。此系統每增加一個物體,場方程數量保持1不變,孤立方程線性增長1個,但相互作用方程數就呈指數級增長了。所以,簡化也是其核心。
二、大數據與大數世界
與上述機械思維一脈相承,蘇聯在設計武器和航天器時依賴牛逼的數學家建立復雜而精準的數學模型,希望可以用之皆準。美國的科學家數學底子弱一些,所以走了不同的道路——建立簡單的數學模型,但依賴於計算機和大量數據。結果是美國的路子勝出了。
吳軍博士在《智能時代》中還舉了另一局槐個例子——德國擁有完美的光學儀器技術,所以做出了高難度的非球面透鏡,儀器小巧而完美;日本缺乏這樣的技術,所以用多個球面鏡組合來獲得同樣的效果,這樣的機器笨重然而容易大規模生產使用。二戰後,成為光學儀器第一大國的不是德國,而是日本。
在這兩個例子中,都通過 多個簡單模型來勝過單一的精確模型 。然而這樣的勝出是有前提的——基於大數據。如果說機械思維下的精美模型是純凈的晶體,那麼大數據絕對是散漫無章的氣體。氣體的分子們本身是無序而復雜的,但我們卻可以預測整體的擴散情況、確定其整體的物理性狀。這跟每一個分子的「隨機性」離不開,正是隨機性讓統計有了意義。如果某地有一場流感正在蔓延,我們很難判斷某個單一個體是否會感染,但谷歌甚至可以根據人們的搜索數據來計算出接下來將蔓延到哪裡,至於感染率有多少就更是一個簡單的統計計算數字了。
在上面這個流感的例子中不難發現,面對大數據,精確的數值其實反而沒有那麼重要了,我們關心的點也不必精確到個位數。比如運營一個app,用戶達到千萬量級的時候,每天關注的DAU肯定就是多少萬,甚至更簡略一些就只具體到十萬位、百萬位了,個位數是幾不再重要。但面對大數據,個體依然是獨一無二的,我只有感染、不被感染兩種結果。那麼對於這種情況,大數據的感染率就成為了個體是否會感染的背景概率,個體自己的健康情況、活動區域燈則成為其他的調整概率項。
由上也可見,概率性思維的價值更凸顯了。事實上,基於大數據的思維方式不做假設,只根據海量數據做出相關性分析;不care因果確定,只判斷概率大小、相關性強弱。
除了 混雜取代精確、相關取代因果、不確定性取代確定性 ,大數據思維最顯而易見的就是 全量取代樣本 ,這也就是大數據之為「大數」的原因。不用考慮怎麼抽選有質有量的隨機樣本,大數據的風格是全量數據納入計算。正因如此,從搜索引擎到語言識別到機器翻譯,演算法技術相當的前提下,谷歌卻能異軍突起——他家的數據量沉澱太可觀了。然而海量的數據只是燃氣,終究受制於燃灶的處理能力。正因為計算機的計算能力的增長趕不上數據的指數增長,伺服器的數量就更趕不上,所以,面對大數據,簡化的演算法尤顯重要。比如馬爾可夫鏈,比如維特比演算法。
三、復雜的生活與中數世界
管理上,我們或許會把一個個的個體抽象為單元,然後用機械思維統籌管理;決策上,我們又可能會根據大數據跑出的強相關性分析結果,決定下一步去打什麼市場。無論是小數世界的機械思維還是大數世界的大數據思維,都是基於過去可以預測未來的假設的,目的也都是為了預測。
然而,我們現實生活中遇到的大多數情況既不是小數也不是大數。如果說機械思維是晶體、大數據思維是氣體,那麼中間還隔著一個液體——中數的世界。某家上市公司有多少人?是個中數;一台計算機裡面有多少零部件?是個中數;這片森林裡有多少只鳥?是個中數……生活在其中的我們是尷尬的,就像高中數學老師的吐槽——你們做物理什麼沒有摩擦力,哪裡沒有摩擦力?還勻加速運動,你勻加速一個我看看!
小數、中數、大數本身並不是在量級上有一個數字清晰的劃分,事實上這種劃分是抽象的、概念式的。 對於身處其中的中數世界,我認為可以採取的應對方式之一是根據不同的情況,或者靠攏小數世界借鑒機械思維,或者靠近大數世界借鑒大數據思維。
先看靠近小數世界和機械思維。假設-求證-應用的方法論應用場景其實非常廣闊。比如,這兩年非常熱的精益創業,精益思維最核心的點就在於最小化可行性驗證。由於現實生活中我們的成本是有限的,不可能有個主意就全量鋪開,這也是不經濟的。我們需要用最小的成本先行測試驗證某一想法,就創業者而言就需要用最小的成本在真實場景中驗證用戶是否真的有此需求。但此時得出的歸納性結論並不是機械定律般確定性的、因果明晰的,事實上,歸納無法確立因果,只能提供強相關、弱相關或不相關的參考。
再看靠近大數世界。國人愛好讀史,歷史本身何嘗不是大數據。但我們閱讀的史書只能是寥闊史料中挑選過的非隨機樣本(中數),即便如此,依舊是「太陽底下沒有新鮮事」——基於過去預測未來一定程度上確實是有應用價值的。過去給我們對於未來的預測提供了一個外部視角,可以作為我們做具體預測的背景概率(曾看到有人戲稱經驗是人類的大數據,我覺得蠻有意思,但個人經驗遠達不到「大數據」的程度,充其量只是中數,然而已經可以為今後的預測和決策提供一個背景概率)。所以, 大數思維對於日常生活最大的借鑒價值我認為是提供一個外部視角的背景概率。當面對具體的情況的時候,在這個背景概率的基礎上,分析具體情況做各個獨立的概率修正 。
我們的知識要麼源於自身和他人(同時代或歷史上)的經驗,要麼源於前人已經提煉出來的原理。
對於自身和他人的經驗,有兩種借鑒方式——一是直接復制,二是追究因果(雖然大多時候只是相關關系)予以應用。 都會覺得第二種好,但現實中大多數情況我們都在不自覺地按照第一種思路應用,因為第二種不僅難,而且違背直覺——也就是說,大多人(包括我在內)大多時候是達不到機械思維的標準的。
對於前人已經提煉出來的原理,也有兩種應用方式——一是一元思維模型,二是多元思維模型。 查理·芒格說過,如果你只有錘子,那麼在你眼裡什麼都是釘子。因為如果一個人只有一兩個思維模型,那麼當他思考現實的時候就不得不扭曲現實來符合自己的思維模型。這個時候,模型越精確具象,對一個人的思維限制就越厲害。所以查理·芒格指出,我們必須有多元思維模型,且這些模型必須來源於各個不同的學科(在這個學科細分的世界,永遠別指望在一個院系中發現世間全部真理)。這種多元思維模型其實跟數據驅動下的多個簡單模型勝過單一精確模型是一樣的。即使我們面對的數據量很多時候達不到「大數」的層面,但一個人建立多元思維模型的前提就是比一元思維模型的人吸收了不同量級的底層數據。因為每一個模型都源於不少的經驗數據得出的原理,多個模型背後就是不同維度、不同量級的數據。這樣的多元模型容錯性高,面對具體問題的分析也真正可以從不同側面不同維度得出盡量貼近真實的結論和對未來的預測。
本文參考書籍:
1、吳軍《智能時代》
2、吳軍《數學之美》
3、維克托《大數據時代:生活、工作與思維的大變革》
4、溫伯格《系統化思維導論》
5、查理《窮查理寶典》