⑴ 推薦一本關於大數據,數據分析類似的書籍
1、《Hadoop權威指南》
現在3.1版本剛剛發布,但官方並不推薦在生產環境使用。作為hadoop的入門書籍,從2.x版本開始也不失為良策。
本書從Hadoop的緣起開始,由淺入深,結合理論和實踐,全方位地介紹Hadoop這一高性能處理海量數據集的理想工具。剛剛更新的版本中,相比之前的版本增加了介紹YARN , Parquet , Flume, Crunch , Spark的章節,非常適合於Hadoop 初學者。
2、《Learning Spark》
《Spark 快速大數據分析》是一本為Spark 初學者准備的書,它沒有過多深入實現細節,而是更多關註上層用戶的具體用法。不過,本書絕不僅僅限於Spark 的用法,它對Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然。
3、《Spark機器學習:核心技術與實踐》
以實踐方式助你掌握Spark機器學習技術。本書採用理論與大量實例相結合的方式幫助開發人員掌握使用Spark進行分析和實現機器學習演算法。通過這些示例和Spark在各種企業級系統中的應用,幫助讀者解鎖Spark機器學習演算法的復雜性,通過數據分析產生有價值的數據洞察力。
⑵ 關於大數據時代的名言
首先你得問題可能有點大,本人才疏學淺回答的可能會有些偏頗,我只能以我的經驗來和你談談互聯網大時代幾個比較重要的詞句,也可以稱之為經典語句吧。
在互聯網時代,經典語句主要有以下這些:
1、互聯網思維,網聚人的力量
2、互聯網營銷,無營銷不銷售
3、粉絲經濟,得粉絲者得天下
4、用戶至上,客戶經濟時代已經一去不復返
5、體驗為王,用戶體驗不好的東西就沒有市場
6、免費策略,只有免費的還得有價值的,用戶才會覺得好
7、顛覆式創新,互聯網每個人都可能顛覆所謂的大佬,誰都可以成為時代的弄潮兒
8、互聯網時代,大數據營銷
以上這八個方面純憑借自己的經驗之談,簡單的對互聯網大時代一些具有經典意義的語句寫了出來,希望能夠幫到你,有什麼不明白的可以繼續提問,我也是互聯網愛好者,希望能一起探討互聯網的點點滴滴。
⑶ 大數據的概念
大數據概述
專業解釋:大數據英文名叫big data,是一種IT行業術語,是指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
通俗解釋:大數據通俗的解釋就是海量的數據,顧名思義,大就是多、廣的意思,而數據就是信息、技術以及數據資料,合起來就是多而廣的信息、技術、以及數據資料。
大數據提出時間
「大數據」這個詞是由維克托·邁爾-舍恩伯格及肯尼斯·庫克耶於2008年8月中旬共同提出。
大數據的特點
Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)-由IBM提出。
大數據存在的意義和用途是什麼?
看似大數據是一個很高大上的感覺,和我們普通人的生活相差甚遠,但是其實不然!大數據目前已經存在我們生活中的各種角落裡了,舉個例子,我們現在目前最關心的疫情情況數據,用的就是大數據的技術,可以實時查看確診人數以及各種疫情數據。
大數據存在的意義是什麼?
從剛才的舉例中我們基本可以了解,大數據是很重要的,其存在的意義簡單來說也是為了幫助人們更直觀更方便的去了解數據。而通過了解這些數據後又可以更深一步的去挖掘其他有價值的數據,例如今日頭條/抖音等產品,通過對用戶進行整理和分析,然後根據用戶的各種數據來判斷用戶的喜愛,進而推薦用戶喜歡看的東西,這樣做不僅提升了自身產品的體驗度,也為用戶提供了他們需要的內容。
大數據的用途有哪些?
要說大數據的用途,那可就相當廣泛了,基本各行各業都可以運用到大數據的知識。如果簡單理解的話,可分為以下四類:
用途一:業務流程優化
大數據更多的是協助業務流程效率的提升。能夠根據並運用社交網路數據信息 、網站搜索及其天氣預告找出有使用價值的數據信息,這其中大數據的運用普遍的便是供應鏈管理及其派送線路的提升。在這兩個層面,自然地理精準定位和無線通信頻率的鑒別跟蹤貨物和送大貨車,運用交通實時路況線路數據信息來選擇更好的線路。人力資源管理業務流程也根據大數據的剖析來開展改善,這這其中就包含了職位招聘的調整。
用途二:提高醫療和研發
大型數據分析應用程序的計算能力允許我們在幾分鍾內解碼整個dna。可以創造新的治療方法。它還能更好地掌握和預測疾病。如同大家配戴智能手錶和別的能夠轉化成的數據信息一樣,互聯網大數據還可以協助病人盡快醫治疾患。現在大數據技術已經被用於醫院監測早產兒和生病嬰兒的狀況。通過記錄和分析嬰兒的心跳,醫生預測可能的不適症狀。這有助於醫生更好地幫助寶寶。
用途三:改善我們的城市
大數據也被用於改進我們在城市的生活起居。比如,依據城市的交通實時路況信息,運用社交媒體季節變化數據信息,增加新的交通線路。現階段,很多城市已經開展數據分析和示範點新項目。
用途四:理解客戶、滿足客戶服務需求
互聯網大數據的運用在這個行業早已廣為人知。重點是如何使用大數據來更好地掌握客戶及其興趣和行為。企業非常喜歡收集社交數據、瀏覽器日誌、分析文本和感測器數據,以更全面地掌握客戶。一般來說,建立數據模型是為了預測。
如何利用大數據?
那我們了解了這么多關於大數據的知識,既然大數據這么好,我們怎麼去利用大數據呢?那這個就要說到大數據的工具BI了,BI簡單理解就是用來分析大數據的工具,從數據的採集到數據的分析以及挖掘等都需要用到BI,BI興起於國外,比較知名的BI工具有Tableau、Power BI等;而國內比較典型的廠家就是億信華辰了。雖然BI興起於國外,但是這些年隨著國內科技的進步以及不斷的創新,目前國內BI在技術上也不比國外的差,而且因為國內外的差異化,在BI的使用邏輯上,國內BI更符合國內用戶的需求。
⑷ 大數據的書摘
題記
一個真正的信息社會,首先是一個公民社會。
P13
除了上帝,任何人都必須用數據來說話。
P35
很多情況下,「數據」和「信息」兩個詞經常替換使用。但嚴格的說,數據和信息這兩個概念有很大的區別:數據是對信息數字化的記錄,其本身並無意義;信息是指把數據放置到一定背景下,對數字進行解釋、賦予意義。……但進入信息時代之後,人們趨向把所有存儲在計算機上的信息,無論是數字還是音樂、視頻,都統稱為數據。
P42-43
程序和數據的關系,就好像發動機和燃料,所有的程序,都是靠數據驅動的;數據之於程序,又好比血液之於人體,一旦血液停止流動,人就失去了生命,代碼也將停止運行。數據的生命力,甚至比程序更持久。程序可以不停地升級、換代甚至退出使用,但保存數據的資料庫卻會繼續存在,其價值很可能與日俱增、歷久彌新。
P42
最小數據集是指通過收集最少的數據,最好的掌握一個研究對象所具有的特點或一件事情、一份工作所處的狀態,其核心是針對被觀察的對象建立一套精簡實用的數據指標。
P57
得益於計算機技術和海量資料庫的發展,個人在真實世界的活動得到了前所未有的記錄,這種記錄的粒度很高,頻度在不斷增加,為社會科學的定量分析提供了極為豐富的數據。社會科學將脫下「准科學」的外衣,在21世紀全面邁進科學的殿堂。
P57
「大數據」之「大」,更多的意義在於:人類可以「分析和使用」的數據在大量增加,通過這些數據的交換、整合和分析,人類可以發現新的知識,創造新的價值,帶來「大知識」、「大科技」、「大利潤」和「大發展」。
P58
大數據的影響,就像4世紀之前人類發明的顯微鏡一樣。
P61
美國這個國家,雖然年輕,但相信數據、使用數據,卻有著深厚的傳統。 數據被視為科學的度量、知識的來源; 沒有數據,無論是學術研究,還是政策制定,都寸步難行。
P69
一起交通事故的數據可能是無序的,一年的數據、一個地區的數據也看不出太多章法,但隨著跨年度、跨地區的數據越來越多,群體的行為特點就會在數據上呈現一種「秩序、關聯、穩定」,更多規律就會浮出水面。
P82
數據收集和數據分析必須成為基層部門的一種文化,一種管理哲學。
P100-102
圖形是解決邏輯問題的視覺方法。……人的創造力不僅僅取決於邏輯思維,還取決於形象思維。數據可視化的技術,可以通過圖像在邏輯思維的基礎上進一步激發人的形象思維和空間想像能力,吸引、幫助用戶洞察數據之間隱藏的關系和規律。
P109
大數據時代的競爭將是知識生產率的競爭。以發現新知識為使命的商務智能,無疑是這個時代最為矚目的競爭利器。
P116-133
聯邦政府這個龐大的數據帝國,是如何運作和管理的呢?
收集法則:減負,為人民減負
使用法則:隱私,文明社會的共識
發布法則:免費,人民已經交稅
管理法則:質量,互聯網時代的根本
P124
美國隱私權保護重心的變遷:
19世紀:以住宅為重心
20世紀:以人為重心
21世紀:以數據為重心
P136
早在幾十年以前,政府所發布數據的質量問題就備受矚目、廣受爭議。這是因為,這些數據,往往都關繫到行業標準的設定。……每一項新標準的發布、老標準的調整,即使只有零點零幾的變化,都可能影響一個行業的競爭、改變一個產業的布局。
P162
在信息時代,計算機內的每一個數據、每一片位元組,都是構成一個人隱私的血肉。信息加總和數據整合,對隱私的穿透力不僅僅是「1+1=2」的,很多時候,是大於2的。
P214
開放數據是一石三鳥,不僅服務大眾,刺激經濟,還調動了大眾創新,為政府節省了軟體開發的開支。
P239
永遠不要懷疑那一小部分有思想並且持續努力的公民能夠改變這個世界,事實上,人類的歷史從來都是這樣。
P262
掌握信息多的人,在社會競爭中處於有利地位,而信息貧乏的人,則處於不利的地位。前者向後者有償轉讓信息來獲取利益,無償出讓則收獲善意,只有信息自由流動,各方掌握相同的信息後,彼此才能建立完全的信任。
P263
如果把信息公開僅僅解讀為公眾對政府一種單方面的監督,是狹隘的、片面的,信息公開也是政府的一種自我保護。可以看到,政府通過信息公開有效地獲得了社會的信任。
P302-303
和其他的生產要素相比,數據無疑有其獨特的特點。例如,工業生產過程中的原材料,一般都有排他性,但數據很容易實現共享,而且使用的人越多,其價值越大;數據也不像機器、廠房,會隨著使用次數的增多而貶值,相反,重復使用反而可能使它增值。此外,此數據和彼數據如果能有機地結合到一起,可能就會產生新的信息和知識,並且實現大幅增值。
P304
要做到「低成本、高效率」的運營以及決策正確,企業必須廣泛推行以事實為基礎的決策方法、大量使用數據分析來優化企業的各個運營環節,通過基於數據的優化和對接,把業務流程和覺得過程當中存在的每一分潛在的價值都「擠」出來,從而節約成本、戰勝對手、在市場上倖存。
P307
基於數據的分析和競爭已經是零售業的常態,毫不誇張地說,零售業的競爭一定程度上已經成為一種基於數據的競爭,數據就是企業的財富和金礦,數據分析和挖掘能力就是企業的核心競爭力。
P313
在大數據時代,基於層級的社會控制手段將不再適用,基於流程的管理方法也有很大的局限性。……數據的開放和流動,就代表著知識的開放和流動,代表著權力的開放和流動,這種開放和流動,是多中心的、水平的。在這個時代,社會的主體結構將從「分層」轉向「結網」,在網狀傳播的力量的不斷沖擊下,個人的主體價值將得到前所未有的張揚,集中在政府的權力將開始分散,權力的最終流向,是社會、是大眾,是一個個獨立的公民個體。大數據時代正在呼喚下一波社會化的浪潮:一個更開放的社會,一個權力更分散的社會,一個網狀的大社會。
P325
今天的中國,是一個人口大國、互聯網大國、手機大國,但卻恰恰還不是一個數據大國。
P327-329
中國缺乏的不是可供收集的數據,也不是收集數據的手段,而是收集數據的意識。……中國人數據意識的淡薄,由來已久,甚至可以稱之為國民性的一部分。
P333
收集數據、使用數據、開放數據,都是大數據時代我們中國人需要一一面對的挑戰。這三大挑戰,沒有一個不是任重道遠。但這些挑戰,也是我們在大數據時代徹底摘掉「差不多先生」文化標簽的重大歷史機遇。如果在這個數據意義凸顯的時代,我們還抓不住這些歷史機遇,繼續漠視數據、拒絕精準、故步自封,等待我們的,還將是一個落後的100年。
P333
由於互聯網的發明,「開放」已經成為人類社會一個不可逆轉、不斷加速的社會思潮。如雨果所說:你可以阻擋一支入侵的軍隊,但你無法阻擋一種思想。在這個浩浩盪盪、不斷前進的世界大潮當中,我們將發現,中國如果不跟上,我們的處境將會越來越微妙、越來越尷尬、越來越孤立。
P346
小數據只要在縱向上有一定的時間積累,在橫向上有細致的記錄粒度,再和其他數據整合,就能產生大的價值。從這個角度來看,大數據也可以理解為針對某個對象在時空兩個維度上的「全息」數據。這種「全息」,在大數據的時代還表現為「多源」,即有多個源頭在從不同方向對同一個對象進行數據記錄,數據之間互相印證。
P350
在大數據的時代,開放數據的意義,不僅僅是滿足公民的知情權,更在於讓大數據時代最重要的生產資料、生活數據自由地流動起來,准確全面應用起來,以推動知識經濟和網路經濟的發展,促進中國的經濟增長由粗放型向精細型轉型升級。
P351
在大數據時代,公共決策最重要的依據將是系統的數據,而不是個人經驗和長官意志……政府應加大數據治國的輿論宣傳,將數據的知識納入公務員的常規培訓體系,力爭在全社會形成「用數據來說話、用數據來管理、用數據來決策、用數據來創新」的文化氛圍和時代特點。
⑸ 大數據時代的內容簡介
維克托·邁爾·舍恩伯格在書中前瞻性地指出,大數據帶來的信息風暴正在變革我們的生活、工作和思維,大數據開啟了一次重大的時代轉型,並用三個部分講述了大數據時代的思維變革、商業變革和管理變革。
維克托最具洞見之處在於,他明確指出,大數據時代最大的轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道「是什麼」,而不需要知道「為什麼」。這就顛覆了千百年來人類的思維慣例,對人類的認知和與世界交流的方式提出了全新的挑戰。
本書認為大數據的核心就是預測。大數據將為人類的生活創造前所未有的可量化的維度。大數據已經成為了新發明和新服務的源泉,而更多的改變正蓄勢待發。書中展示了谷歌、微軟、亞馬遜、IBM、蘋果、facebook、twitter、VISA等大數據先鋒們最具價值的應用案例。
⑹ 讀書筆記:大數據時代
隨著網路的普及、計算機運算和存儲能力的提高,我們獲取信息越來越容易,越來越多。絕大多數信息對我們來說可能都是噪音,或者用過一次後就被丟棄;而對有大數據思維的公司或個人來說,這些則是零散的金粉,他們可以從中挖掘出許多小數據無法得到的意想不到的結果。比如人們所用的搜索詞在搜索完成之時就失去用處,Google偏偏將它們重新利用,用以改善結果的排序,用來預測流感感染情況。word語法檢查,小數據下表現最好的演算法在大數據下准確率卻最差。誰曾想坐姿可以轉化成數據,並開發成汽車防盜系統?進而擴展到盜賊識別?
大數據時代真的只有想不到,沒有做不到。它深刻的變革著我們的工作、生活、甚至思維方式。
1.不是樣本而是全部:得到全部數據並不那麼難,而且結果更全面可靠,我們不再依賴小數據時代的隨機取樣、假設-實驗-結論模式,取而代之的是直接對全部數據進行分析挖掘;
2.不是精確性而是混雜性:大數據時代我們不再執著於精確,而是允許一點瑕疵。我們要做的不是以高昂的代價消除所有的不確定性,而是接受這些紛繁的數據並從中獲益。以谷歌翻譯為例,它搜羅了所有可以利用的數據,雖然搜集的有錯誤翻譯,但巨大的語料庫優勢完全壓倒了缺點,使其好於布朗、微軟的班科和布里爾、IBM的Candide。又如word語法檢查,小數據下表現最好的演算法在大數據下准確率卻最差。混雜的大數據能創造比精確的小數據更好的結果!
小數據模式下,小的錯誤會導致極大的偏差,因此要求精確。值得注意的是,大數據的混雜性只是現實,而不是其固有特性,隨著技術的發展將會被改善。
3.不是因果關系而是相互關系:千百年來,我們一直在尋找事件背後的原因。事實上,如果凡事皆有因果的話,我們就沒有決定任何事的自由了。
基於大數據分析事物間的相互關系,使我們從因果串聯思維變為相互並聯思維。相互關系能提醒我們某些事正在發生,這些提醒非常有用。基於相關關系的預測是大數據的核心。通過找出一個關聯物並監控它,我們就能預測未來。如塔吉特懷孕預測,美國折扣零售商塔吉特通過對女性消費記錄分析,可以發現她是否懷孕,從而在相應階段寄送相應的折扣券。
戲中主角分別是大數據擁有者、大數據技術公司、大數據思維的公司或個人。第一個吃螃蟹的人早已斬獲良多,更多的人也開始去嘗試;隨著技術的發展,擁有大數據技術的公司的領先優勢也越來越弱;而數據本身的價值則與日俱增。試想,一個擁有思維和技術的新公司,如何去跟一個擁有海量數據且知道什麼更好的公司去競爭?
隨著行業發展,數據中間商也將粉墨登場。因為有些數據的價值只能通過中間人來挖掘。航空公司不到最後一刻不會發布航班晚點,也不會告訴你何時買票最便宜,但只要有數據,你就能知道這些。還有一些公司願意把數據給非營利機構。
大數據確實給我們帶來諸多便利,使我們的生活更便利、更美好。但我們也變得越來越透明,通過你的檢索詞、購物、評論等就能輕易定位到精確的個人!想想就讓人不寒而慄!
亞馬遜監視著我們的購物習慣
谷歌監視著我們的網頁瀏覽習慣
微博竊聽到了我們心中的TA
而facebook似乎什麼都知道,包括我們的社交關系網
我們時刻暴露在第三隻眼下(政府除外)。
鑒於此,維克托也建議完善相關司法,制定更完整的隱私保護政策、反壟斷。
值得注意的是,大數據給我們提供的不是最終答案,而是參考答案,我們不要過分信任、依賴數據給出的結果。假如一切都可以被預測,而且很精確,而我們想當然的去相信,放棄選擇的權利,也會不為結果承擔責任,那我們離變成機器人就不遠了,人工智慧控制人類也並非臆想!
而樂觀的人們則會認為一個更美好的未來在像我們招手:
以下為收集內容 。
http://www.ximalaya.com/1000577/sound/412418?from_platform=weixin
【構建一個機器的你】模擬你的知識體系、行為習慣:通過擬合你在社交網路的發言、及其它信息。模擬聲音:整合微信里的語音。模擬外貌:通過你發的照片等。將這些東西「導入」到一個機器,你在另一個地方被重生。它知道你所有的所有,宛如鏡像孿生。
可以看電影黑鏡2。
汽車若能交流 車禍或可避免
http://v.youku.com/v_show/id_XNTcyODU4NjQw.html
實現汽車對話以避免車禍,實際也是大數據的利用:通過數據化位置速度(通過攝像頭感測器電腦系統)等信息,然後分析並做出預測。信息與機器結合會使人分為自然人、半自然人、機器人吧。現在的美瞳等改變人的外形,以及研究火熱的腦機介面以實現通過意念控制機械,人正在與機器越來越多的整合在一起。
谷歌無人駕駛汽車
http://mp.weixin.qq.com/s?__biz=MjM5NzM5ODU2MA==&mid=200295774&idx=4&sn=&scene=1#rd
什麼時候無人駕駛汽車成片的出現在杭州就好了[偷笑][偷笑]或者不用成片,就是有些地方會放著(比如某個山洞某個工廠),嗯,某些方式(某個app,某個電話或者直接與微信集合,或者快的打車,打的車都變成無人駕駛車)可以把他叫過來,然後用完之後他自己回到原來的地方。[傲慢][傲慢]這樣社會多美好呀!還可以叫個車,讓他把東西/人送到某個地方,就不是為自己叫車而是為他人叫……
如果視野更開闊點, 數據或許是實現人與機器交流的語言 ,,數據能挖掘我們不知道的一面,但也不要全迷信數據,將活生生的、復雜的人等同於毫無生命的一堆數據或機器就不好玩了。。
量化自我,一場二十年前無法想像的運動
http://www.36kr.com/p/204479.html#wechat_redirect
⑺ 大數據之父舍恩伯格:互聯網比你更了解你
大數據之父舍恩伯格:互聯網比你更了解你
牛津大學網路研究院網路監督及管理學教授,研究領域為網路經濟。曾任哈佛大學肯尼迪學院信息監管科研項目負責人,哈佛國家電子商務研究中心網路監管項目負責人;曾任新加坡國立大學李光耀學院信息與創新策略研究中心主任。並擔任耶魯大學、芝加哥大學、弗吉尼亞大學、聖地亞哥大學、維也納大學的客座教授。
有100多篇論文公開發表在《科學》、《自然》等著名學術期刊上,同時也是哈佛大學出版社、麻省理工出版社、通信政策期刊、美國社會學期刊等多家出版機構的特約評論員。
信息權威與顧問,咨詢客戶包括微軟、惠普和IBM等全球頂級企業。早在1986年與1995年就擔任兩家軟體公司的總裁兼CEO,1991年躋身奧地利軟體企業家前5名之列,2000年被評為奧地利薩爾斯堡州的年度人物。
機構和國家政府高層的信息政策智囊,專注於信息安全與信息政策與戰略的研究,是歐盟專家之一,也是世界經濟論壇、馬歇爾計劃基金會等機構的咨詢顧問,先後擔任新加坡商務部高層、汶萊國防部高層、科威特商務部高層、迪拜及中東政府高層的咨詢顧問。
超過兩年沒穿的衣服會送人,拍得不好看的照片要當即刪除
大數據之父舍恩伯格:互聯網比你更了解你
時代周報記者 韓瑋 發自上海
舍恩伯格又要戴著他標志性的約翰·列儂式的圓眼鏡來中國了。
9月25日,時代周報舉辦2015「影響力·中國」秋季峰會,舍恩伯格將受邀出席,講他最擅長的大數據。
最近兩年,這位數據科學領域的權威學者每隔幾個月就會出現在中國,而他所到之處,無不受到媒體、讀者的簇擁。
舍恩伯格之所以在國內名聲大噪,主要是因為他的兩本暢銷書、關於大數據的先河之作—《大數據:一場將改變我們生活、工作和思考方式的革命》(Big Data :A Revolution That Will Transform How We Live, Work, and Think,中文版又名《大數據時代》)以及《刪除:大數據取捨之道》(Delete: The Virtue of Forgetting in the Digital Age)。前者揭示了大數據給人類帶來的巨大改變,後者則嘗試探索大數據時代人類應該如何構建積極而安全的未來。
作為最早洞悉大數據發展趨勢的數據科學家,舍恩伯格在國內受追捧並不奇怪。畢竟,此刻的中國—國務院剛剛印發《促進大數據發展行動綱要》,提出推動大數據發展和應用在未來5-10年逐步實現的目標及主要任務。國內的大數據產業正迎來大發展時期。
而由於大數據太火,在這個新淘金時代,人們對舍恩伯格的興趣不再停留於他的研究,還延伸至他本人以及他獲得一系列學術成就的過程。
恰好,舍恩伯格是個性格有趣而經歷豐富的人。比如,他曾因不想繼承家業而與父親爭執數十年,最終走上學術之路。
代碼少年
「我母親以前經營一家電影院,我每年都會問她,過去一年最好的電影是什麼?她總是說,我知道,是×××。但她總是錯的。」
舍恩伯格常常在演講中提起這個例子,盡管只是為了佐證大多數人都需要數據分析工具這個觀點,但無意間卻把很多人的興趣引向了他的過去。
這位如今在全球數據科學領域極具名望的科學家其實算得上是「富二代」。他出生在距離莫扎特故鄉奧地利薩爾茨堡兩小時車程的一個小鎮上,父親是當地的稅務律師,有自己的事務所;母親則打理著小型電影院、花店等生意。
1966年,舍恩伯格出生那年,他的父親買來了小鎮上的第一台電腦,價格不菲。當時,鎮上所有人都覺得他瘋了,肯定會破產。而這台巨大的個人電腦運轉時發出的嗡嗡聲陪伴了舍恩伯格的整個童年。
小時候,舍恩伯格喜歡看阿斯特麗德·林德格倫的童話書。這位已故瑞典作家最著名的作品是那本充滿想像力的《長襪子皮皮》。而那時的舍恩伯格夢想成為發明家,因為,讓想法變成現實是一件特別誘人的事。
「如果還可以和林德格倫共進午餐,我想問她,她如何激發自身的想像力?愛因斯坦說過,想像力比知識更重要。」舍恩伯格說。
讀書時,舍恩伯格最喜歡的科目是物理和數學,進而又對計算機著迷。十一二歲時,他就想用那台嗡嗡作響的電腦編程。
「當時,只有大學才有計算機,我就去當地大學報了一門編程課。但老師覺得我不可能學會,就讓我自己玩。於是,我便在角落裡自學。」到了高中時期,這位天賦異稟的少年先後在國際物理奧林匹克競賽和奧地利青年程序員競賽中獲了獎。
17歲時,舍恩伯格第一次觸網。當時,他無意間得到一個聲音耦合器,其實不過是簡陋的數據機—使用者得把電話聽筒與之連接,從而激活以聲音傳送方式進行的數據傳輸。
在此之前,舍恩伯格聽說過互聯網,但從沒體驗過。於是,他搗鼓了好幾個月,試掉了一大筆電話費,最終連上了一個提供初級的郵件、論壇等商業在線服務的無線電通訊網站「The Source」。此後,舍恩伯格便一發不可收拾,對網路著了迷。
1986年,年僅20歲、沒讀完大學的舍恩伯格「創業」了—成立殺毒軟體公司Ikarus,並開發了一款當時奧地利最暢銷的軟體Virus Utilities。至今,網路對Virus Utilities的介紹上寫著,這是一款剽悍的殺毒軟體。1991年,年輕的舍恩伯格還被評選為奧地利最頂尖的5位軟體企業家之一。
這段程序員的經歷為舍恩伯格的未來打下了基礎。許多年後,在《大數據時代》這本書中,舍恩伯格寫道,真正的數據科學家是統計學家、軟體程序員、圖形設計師與作家的結合體。
父與子
在舍恩伯格的學術之路上,很難繞開的一個人物,就是買來了小鎮上第一台電腦的父親。
舍恩伯格與父親的關系並不差。至今,他記憶最深的關於父母的細節是,每天晚餐後,父親都會耐心聽他講述那天發生的事以及他的一些想法。舍恩伯格覺得,這是父親的「超能力」。
不過,父親始終不希望舍恩伯格滿腦子想著如何成為計算機學家,盡管他遷就兒子喜歡計算機。這位在小鎮上有頭有臉的稅務律師總在勸說自己的孩子盡早學完法律,繼承家業。在子承父業和投身計算科學之間,舍恩伯格與父親爭執了數十年,直到後者去世。
而在20歲左右的年齡,舍恩伯格還是順從父親,先在奧地利薩爾茨堡大學讀了法學本科。據說,因為法律太無趣,這位學霸硬是在3年半里讀完了7年的書。
接著,父親要求舍恩伯格繼續在法律上深造,但這個年輕人心不甘情不願,於是便賭氣地只申請了一所學校—哈佛。他覺得,自己肯定不會被錄取。
收到錄取通知書那天,舍恩伯格以為是朋友開玩笑,於是按照上面的電話號碼打過去斥責,「這是愚蠢的玩笑!」而電話另一頭卻有聲音說,「不,這里是哈佛。有什麼能幫你嗎?」
這不是舍恩伯格唯一一次「厚積薄發」。其實,在學生時代的大部分時期,舍恩伯格雖然出色,但不是最出色的那個。但到了最後一個學年,他就像突然間開了竅,過去學過的東西頓時「融會貫通」了。於是,出乎所有人包括他自己的意料,他在畢業前的最後一次考試中獲得了學生生涯唯一一次的全A。
而在美國最古老的法學院哈佛法學院,舍恩伯格開始覺得自己學的法律不再像本科時那麼了無生趣。盡管如此,他依然不想學成後接手父親的公司。
有記者采訪舍恩伯格時曾問,「你後來為什麼當上了大學教授?」他說,「我一直想成為發明家,直到我那個一直『逼』我接手家業的父親有天問我,如果不想做稅務律師,你想做什麼時,我才下定決心當大學教授。至少,對於我父母來說,這會是一個比發明家更容易接受、更受人尊敬的工作。」
從哈佛畢業後,舍恩伯格又拿到了薩爾茨堡大學的法學博士以及倫敦政經學院的理學碩士學位,並依照對父親的承諾,在倫敦一所大學謀得了教職。
當時,舍恩伯格的父親面對這樣的局面依然感到有些失落,最後竟然猝然辭世。父親去世的第二天,舍恩伯格選擇離開倫敦,放棄自己的事業和學術,回到自家的鎮子上,做起了以前無數次拒絕的稅務律師。
「我的人生,和大多數人一樣,既是連貫的,同時又屢受波折。我最初喜歡物理、數學,轉而對計算機產生興趣,進而關注數據安全和數據編碼,並喜歡上了研究隱私法、知識產權法以及網路法。依照這個路徑,數據逐漸成為我關注的重點。但我的生活又被一次次打亂。比如,父親的離世讓我放棄了原來的事業規劃,回到了老家;但一年後,我又賣掉父親的公司,艱難地重回學術圈;後來,偶然的機會讓我得以到哈佛大學肯尼迪學院任教。某種意義上說,這些波折給我製造了意想不到的困難,但也帶來了意想不到的機會。」舍恩伯格告訴時代周報記者。
大數據之父
自1998年始,舍恩伯格的學術研究步入正軌。他進入哈佛大學肯尼迪學院任教,並在那裡度過了10年。此後,他曾在新加坡國立大學李光耀公共政策學院做過3年副教授,借機觀察亞洲的信息政策,而今則在牛津大學互聯網研究院擔任治理與監管專業的教授。
這10餘年間,互聯網飛速發展,人們開始使用手機上網、聊天、購物,完成很多過去必須線下操作的事。而這些變化都被舍恩伯格陸續記錄在論著里。
2010年,在舍恩伯格組織的一次研討會上,幾乎所有參會者發言時都開始提及社會運轉模式正在發生某種改變,但誰也說不出這種變化的實質是什麼。當時,《經濟學人》的數據編輯肯尼思·庫克耶(Kenn Cukier)也在會場,他不久前剛做過一期《大數據的沖擊》的特刊報道。
那場研討會後,舍恩伯格與庫克耶進行了很多次深入交談,「然後,我們決定合寫一本書,探討大數據對於當下的意義以及大數據時代的本質」。
2012年12月,舍恩伯格與庫克耶合寫的《大數據時代》出版。這本大數據研究的先河之作不僅廣受媒體好評,還讓舍恩伯格知名度大漲。
在書里,舍恩伯格通過各種例子展現大數據帶來的改變。比如,一家叫Farecast的公司通過近十萬億條價格記錄來預測美國國內航班的票價。到2012年為止,票價預測的准確率達到75%,使用Farecast票價預測工具購買機票的旅客,平均每張機票可節省50美元。
「大數據的核心是預測。它通常被視為人工智慧的一部分,或者說是一種機器學習。但其實,這種定義具有誤導性。大數據不是要教機器像人一樣思考,相反,它是把數學演算法運用到海量數據上來預測事情發生的可能性。」舍恩伯格寫道。
在這本書里,舍恩伯格還提出了一個廣為引用的觀點—大數據關注的不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。
「具體來說,大數據的目的是全面的數據收集和分析;同時,我們要明白,在數據質量和數據數量之間要有一個平衡,所以,『不是精確性,而是混雜性』,而『不是因果關系,而是相關關系』,這是讓我們意識到,因果關系不再是解釋這個世界的唯一邏輯。」舍恩伯格告訴時代周報記者。
此外,舍恩伯格還是倡導大數據商業應用的第一人。在《大數據時代》中,他指出,如今的數據已經成為一種商業資本、一項重要的經濟投入,可以創造新的經濟利益。而這也是他屢屢被正在大力推動大數據產業發展的中國人當作座上賓的原因之一。
在關注數據的價值之餘,舍恩伯格感興趣的另一重要領域是如何避免數據被濫用。在早於《大數據時代》出版的《刪除:大數據取捨之道》一書中,舍恩伯格提出了數字時代最大的問題:互聯網記住了人們希望自己忘記的東西。當遺忘成為例外,記住變成常態,人類理性決策的能力就會受到威脅。所以,在大數據時代,所有人都應該享受「被遺忘的權利」。
事實上,舍恩伯格本人早早地為自己確立了一套關於刪除的生活准則。比如,那些超過兩年沒穿的衣服會被他送人或處理;那些拍得不好看的照片,他會當即刪除。因為,「如果不刪除,在數字時代,互聯網可能會比你自己更加了解你」。
舍恩伯格這些新穎的想法曾一度讓讀者直呼開了眼界。而目前,他告訴時代周報記者,自己的興趣點轉到了小型無人機上。其實,一直以來,舍恩伯格對飛機駕駛以及基於大數據分析的無人駕駛都頗感興趣。只是不知道,這位數據科學家未來又會在這個問題上帶來怎樣「讓人感覺腦洞大開」的思考。
對話舍恩伯格:
「只要他們不濫用權力,不必對數據寡頭反壟斷」
時代周報記者 韓瑋 發自上海
9月13日,在接受時代周報記者獨家專訪時,舍恩伯格講述了自己對大數據的一些理解,以及收獲這些理解的過程。
影響最深的人是高中物理老師
時代周報:今年暑假,以艾倫·圖靈為原型的傳記電影《模仿游戲》在中國上映,感動了很多人。你看過這部影片嗎?艾倫·圖靈是計算機科學之父,他對你從事數據科學研究是否有影響?
舍恩伯格:我看過這部電影。事實上,很多年前,我就讀過一些圖靈的論著。你可能記得,我以前做軟體公司時就需要編碼,所以,圖靈的書肯定要看。
不過,影響我最深的人不是圖靈,而是我的高中物理老師。他讓我開始接觸到熵的概念、相對論、量子理論等。對於我來說,他就像是為我打開了通往新世界的大門。
時代周報:大家都認為你是當今最重要的數據科學家之一。我特別好奇,大數據給你本人的日常生活帶來改變了嗎?
舍恩伯格:我是大數據服務的「大用戶」。平常,我會戴蘋果手錶,一直以來,它為我的身體健康提供了很多幫助;我也喜歡諸如亞馬遜一類的電子商務公司,同時,還經常使用谷歌地圖。此外,維基網路對我來說是個難得的好幫手,它讓我比過去更加容易獲得有用的信息,對我的幫助很大。
時代周報:我今年曾采訪過暢銷書《大停滯》(The Great Stagnation)的作者、美國經濟學家泰勒·考恩。在談到對大數據的看法時,他告訴我,「大數據被高估了,因為,大多數人都不知道他們手握的這些數據要用來干什麼,企業也一樣。大數據能幫助我們在某些邊緣地帶提高效率,比如針對性的廣告,但它無法改變全局。這其中,最困難的是問對問題,並且找到問題背後特定的模式,再用數據去加以匹配。這非常難以實現。」你認同他的觀點嗎?
舍恩伯格:我非常欣賞泰勒·考恩,《大停滯》是一本很棒的著作。我還曾引用過這本書里的一些觀點。但在大數據的問題上,我覺得他的觀點是錯誤的,或許,這是因為這方面不是他所研究的核心專業領域。
大數據可減少資源不公平的危害
時代周報:現在,大多數行業提起大數據就言必稱「這是一場行業革命,要顛覆過去」。你認為,大數據真的會顛覆那些傳統行業嗎?
舍恩伯格:會的,這種顛覆已經發生,並在快速進行。施樂帕羅奧爾托研究中心前主管約翰·西里·布朗(John Seely Brown)就發現,過去幾十年,超大型企業的壽命正在縮短。與此同時,我們看到,就在最近幾年,大數據驅動、估值達到數百億美元以上的互聯網企業不斷涌現。在人類歷史上,沒有哪個時期在比今天更多的領域,發生比今天更快的變化。
時代周報:目前,中國存在網路、阿里巴巴、騰訊三大互聯網巨頭,分別統治著搜索、電商、社交三個領域,他們不斷吸納著用戶的網上行為數據,幾乎肯定會成為中國的數據寡頭。你認為,在數據層面是否需要反壟斷?
舍恩伯格:我認為必要的一點是,互聯網要對新的創新主體保持開放的狀態。只要大企業不濫用自己的權力,將那些更小但更好的初創企業趕出市場,那麼,他們就不會製造太多的威脅。所以,我更關注的是這些企業的實際行為,而非他們的規模。
時代周報:除了數據,我知道,你還對教育問題有著深入研究。今年1月,你出版了一本名為《與大數據同行:學習和教育的未來》的新書,專門探討大數據研究在教育領域的應用,以求真正實現因材施教。而中國教育的主要問題是教育資源分配不公平,大數據能解決這個問題嗎?
舍恩伯格:大數據不能從根本上消除這種不公平,但是,通過大數據的手段,我們能以相對較低的成本提供高度個性化的教育,從而減少這種不公平帶來的危害。換言之,大數據能讓學生以很低的成本,獲得至少像「私人家教」那樣的訂制教育。所以,大數據可以成為改變整個游戲的因子。
以上是小編為大家分享的關於大數據之父舍恩伯格:互聯網比你更了解你的相關內容,更多信息可以關注環球青藤分享更多干貨
⑻ 關於互聯網思維的書籍哪個最好
市面上關於互聯網思維的書籍有不少,大體說的都不全,從基礎理論到戰略應用分了很多的類別。所以這里列舉在學習互聯網思維的不同階段所需的知識點典型書籍,主要有幾個階段:理論知識、移動互聯網、商業模式、媒介、大鏈接數據、產品經理、設計與創意、運營營銷。
一、理論知識:了解互聯網歷史、背景和發展趨勢。
1《認知盈餘》 克萊舍基 《認知盈餘》讀書筆記:已被驗證的時代潮流
3《未來是濕的 人人時代》克萊舍基 組織之困與情感依附時代——《未來是濕的》
4《從0到1》
5《長尾理論》
6《矽谷之光》
7《失控》
8《引爆點》
9《技術元素》
10《世界是平的》
11《技術壟斷:文化向技術投降》
12《第三次工業革命:新經濟模式如何改變世界》
13《變革中國》
14《網路素養:數字公民集體智慧和聯網力量》
15《數字烏托邦:從反主流文化到賽博文化》
16《信息簡史》
17《美麗新世界》
18《網路共和國》
19《奇點臨近》
21《數字化生存》
22《新數字秩序的革命》
24《黑客與畫家》
----------------------------------------------------------------------
二、移動互聯網:了解互聯網的應用范圍。
1《決勝移動終端》
2《決戰第三屏:移動互聯網時代的商業與營銷新規則》
3《移動風暴》
4《移動的帝國》
5《移動浪潮:移動智能如何改變世界》
----------------------------------------------------------------------
三、商業模式:了解互聯網在商業上的應用。
1《免費:商業的未來》
2《商業模式新生代》
3《社交紅利》
4《我們如何來到現在:商業、技術與金融趣史》
5《平台戰略:正在席捲全球的商業模式革命》
6《需求:締造偉大商業傳奇的根本力量》
----------------------------------------------------------------------
四、媒介:了解互聯網媒介的應用。
1《理解媒介:論人的延伸》
2《你不是個玩意兒:被互聯網奴役的人》
3《沖擊力》
4《淺薄:互聯網如何毒化了我們的大腦》在讀
5《消失的地域:電子媒介對社會行為的影響》
6《娛樂至死·童年消逝》 互聯網時代:更娛樂的,更致死的
7《群體性孤獨》
----------------------------------------------------------------------
五、大連接數據:了解數據在互聯網中的應用。
1《大連接》
2《第三次浪潮》
3《爆發:大數據時代遇見未來的新思維》
4《決戰大數據》
5《駕馭大數據》
6《大數據時代》
7《數據化決策》
----------------------------------------------------------------------
六、產品經理:了解互聯網產品開發。
1《結網2》
2《人人都是產品經理》
3《啟示錄:打造用戶喜愛的產品》
4《創業時,我們在知乎聊什麼?》
5《產品經理手冊》
6《淘寶十年產品事》
7《黏住顧客:Foursquare如何打造忠實客戶群》
8《玩法變了:淘寶賣家運贏弱品牌時代》
9《跨越鴻溝: 顛覆性產品營銷聖經》
10《贏在用戶》
----------------------------------------------------------------------
七、設計與創意:了解互聯網產品設計與廣告創意。
1《只有偏執狂才能生存》
2《廣告狂人》
3《商業秀》
4《喬納森傳》
5《一線之間》
6《打開創意的腦》
7《瘋狂的簡潔》
8《賴聲川的創意學》
9《設計心理學》
10《至關重要的設計》
11《交互設計入門》
12《門後的秘密:卓越管理的故事》
13《病毒循環》《情感化設計》
14《專業主義》
15《高效能人士的七個習慣》
16《金字塔原理》 《金字塔原理》讀書書摘
17《影響力》
18《思考的快與慢》
19《喬布斯傳》
20《參與感》
21《顛覆式創新》
----------------------------------------------------------------------
八、運營營銷:了解互聯網渠道運營知識。
1《水平營銷》
2《跨越鴻溝》
3《消費者行為》
4《輕公司,互聯網變革中國製造》
以上是互聯網思維各個階段的學習書籍,可以選擇性閱讀學習。
⑼ 大數據相關的書籍有哪些,麻煩推薦一下
初級階段:《大數據時代》
讀完這本書,要求你形成大數據的概念專,對大數據有個全面的認屬識和了解。
中級階段:《失控》
用統計的方法,而不是因果的方法,預測未來,用統計的方法來對某些東西進行預測.
高級階段:《復雜性》
指明了一個無窮疊代,即 「關系的關系的……關系」,而智能將在這里涌現,解決復雜性問題預測的關鍵很可能就在這里,這句話打開了一個非常廣闊的前景,將象宇宙一樣沒有窮盡。
高級階段(2):《量子物理史話》
停止爭論吧,上帝真的擲骰子!隨機性是世界的基石,當電子出現在這里時,它是一個隨機的過程,並不需要有誰給它加上難以忍受的條條框框。……而統計規律則把微觀上的無法無天抹平成為宏觀上的井井有條。——摘自《量子物理史話》