『壹』 大數據時代是什麼時代
小調查:請你收集幾個有關大數的信息,並把它們寫下來。構成一個人體需要500萬億個細胞,一天有24小時即1440分鍾86400秒,一年有365天有8760小時525600分鍾31536000秒,中國的土地面積960萬平方公里(9600000),中國是世界上人口最多的國家,人口有1,300,000,000(十三億)。大數據:大數據(big data),IT行業術語,是指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》[1]中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。[2]
中文名
大數據
外文名
big data,mega data
提出者
維克托·邁爾-舍恩伯格及肯尼斯·庫克耶
提出時間
2008年8月中旬
應用學科
計算機,信息科學,統計學
快速
導航
特徵結構應用意義趨勢IT分析工具促進發展
定義
對於「大數據」(Big data)研究機構Gartner給出了這樣的定義。「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
『貳』 誰最早提出大數據的概念
「大數據」概念最早由維克托·邁爾·舍恩伯格和肯尼斯·庫克耶在編寫《大數據時代》中提出,指對所有數據進行整體分析處理,而不是採用隨機分析法,即抽樣調查進行分析。 大數據有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。 大數據 (Big Data)又稱為巨量資料,具體指要更新新處理模式才能保證擁有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。 「大數據」概念最早由維克托·邁爾·舍恩伯格和肯尼斯·庫克耶在編寫《大數據時代》中提出,指對所有數據進行整體分析處理,而不是採用隨機分析法,即抽樣調查進行分析。
大數據有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
『叄』 《大數據時代生活、工作與思維的大變革》epub下載在線閱讀全文,求百度網盤雲資源
《大數據時代》([英] 維克托•邁爾•舍恩伯格(Viktor Mayer-Schönberger))電子書網盤下載免費在線閱讀
鏈接: https://pan..com/s/14EqWS8hUg7X4suhVQi7g8A 提取碼: jh5h
書名:大數據時代
作者:[英] 維克托•邁爾•舍恩伯格(Viktor Mayer-Schönberger)
譯者:周濤
豆瓣評分:7.5
出版社:浙江人民出版社
出版年份:2012-12
頁數:261
內容簡介:
《大數據時代》是國外大數據研究的先河之作,本書作者維克托•邁爾•舍恩伯格被譽為「大數據商業應用第一人」,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究。
作者簡介:
他是十餘年潛心研究數據科學的技術權威,他是最早洞見大數據時代發展趨勢的數據科學家之一,也是最受人尊敬的權威發言人之一。他曾先後任教於世界最著名的幾大互聯網研究學府。現任牛津大學網路學院互聯網治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人,哈佛國家電子商務研究中網路監管項目負責人;曾任新加坡國立大學李光耀學院信息與創新策略研究中心主任。並擔任耶魯大學、芝加哥大學、弗吉尼亞大學、聖地亞哥大學、維也納大學的客座教授。
『肆』 「大數據之父」 數據是創新的驅動力
「大數據之父」:數據是創新的驅動力
「有時候不一定是理念驅動世界的變化,可能是實實在在的數據,在數據的基礎上產生理念,新的理念是創造性破壞的核心,而數據則是創新的驅動力。」「大數據之父」維克托·邁爾-舍恩伯格26日下午廣州中山大學[微博]黃埔論壇上作《大數據時代的變革與創新》主題演講時說。
作為牛津大學網路學院互聯網治理與監管專業教授,舍恩伯格是開大數據系統研究先河的學者,《經濟學人》曾評論說,在大數據領域,他是最受人尊敬的權威發言人。他有多達一百多篇論文發表在《科學》《自然》等著名學術期刊上,是《大數據時代》和《刪除:大數據取捨之道》等暢銷書的作者。
在當天的演講中,舍恩伯格指出,我們盡其所能去觀察這個世界,而這個觀察的過程實際上就是一個搜集數據的過程。通過搜集數據,我們進一步理解數據,通過理解數據我們理解了世界。
搜集數據、分析數據需要花費大量的時間、精力、財力,舍恩伯格進一步說道:「我們是否可以搜集最有必要的數據,然後對這些數據進行擠壓,從大量的數據中擠出最精華的東西來,然後在此基礎之上進行意義的構建?也就是說,我們從大數據中可以提取小數據,數據對我們來說成為了一種可以應用的、有價值的資產。」
今天的世界變得如此廣闊,其中所包含的信息海量的,過去20年中,我們數據的量翻了100倍,而且現在還在不斷地增長,在短短的4年內世界已經從一個模擬化的世界變成了數字化的世界。
舍恩伯格表示,這一變化意味著我們要理解我們的生活方式,就必須從過去小數據的世界走入真正的大數據時代。我們要思考數據搜集的方法和機制,要從最需要的數據中來。對所搜集到的數據進行轉化,成為了我們做出決策的一種最好方式。
他認為,數據的價值在於它可以循環使用、多次使用。「過去,人們對數據的使用只是冰山一角,只是有了問題才去搜集數據,然後分析數據,回答問題,然後把數據扔掉。」他指出,事實上,冰山下的那一塊才是數據更大的價值所在,也是我們能夠推動更多創新的地方。
他以特斯拉[微博]汽車、打車軟體Uber以及谷歌[微博]曾經斥巨資收購的NEST等為例指出,這些產品取得巨大成功,不僅僅是因為他們產品本身,更在於他們都是一個數據收集平台,「這意味著你只要能夠充分的使用信息,你就可以用數據來進行創新,進行突破,而且創造出一個新的環境。」
大數據給人們帶來了一個全新的社會,大家都在使用大數據提高決策能力,然而,舍恩伯格也提醒人們,在分析數據、解釋數據的時候,必須了解它的局限性,要非常小心,避免濫用數據。「問題不在數據本身,問題在我們對數據的使用上。
以上是小編為大家分享的關於「大數據之父」 數據是創新的驅動力的相關內容,更多信息可以關注環球青藤分享更多干貨
『伍』 大數據時代:生活、工作與思維的大變革的作者簡介
作者:(英國)維克托·邁爾-舍恩伯格(Viktor Mayer-Schönberger) (英國)肯尼斯·庫克耶(Kenneth Cukier) 譯者:盛楊燕 周濤維克托·邁爾-舍恩伯格(Viktor Mayer-Schönberger),被譽為「大數據時代的預言家」,也是最受人尊敬的權威發言人之一。現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人,新加坡國立大學信息政策研究中心主任。一百多篇論文公開發表在《科學》《自然》等著名學術期刊上。備受眾多世界知名企業、機構和國家政府高層信賴的信息權威與智囊。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業;他是歐盟互聯網官方政策背後真正的制定者與參與者,也是世界經濟論壇、馬歇爾計劃基金會等重要機構的咨詢顧問;還先後擔任新加坡商務部高層、汶萊國防部高層、科威特商務部高層、迪拜及中東政府高層的咨詢顧問。他所著的《刪除》一書,獲得美國政治科學協會頒發的「唐·K·普賴斯獎」,以及媒介環境學會頒發的「馬歇爾·麥克盧漢獎」。肯尼斯·庫克耶(Kenneth Cukier),《經濟學人》數據編輯,曾任職於《華爾街日報》(亞洲版)和《國際先驅論壇報》。他是美國外交關系協會成員,CNN、BBC和NPR的定期商業和技術評論員之一。周濤,電子科技大學互聯網科學中心主任、教授、博士生導師。發表SCI論文150餘篇、領域一流期刊90餘篇,SCI引用超過2600次,H指數26,Google引用超過6000次。第五屆中國青少年科技創新獎和第十二屆中國青年科技獎得主。
『陸』 大數據概念是在哪一年由誰首次提出的
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》 中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。
於「大數據」(Big data)研究機構Gartner給出了這樣的定義。「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統資料庫軟體工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特徵。
大數據技術的戰略意義不在於掌握龐大的數據信息,而在於對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
從技術上看,大數據與雲計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單台的計算機進行處理,必須採用分布式架構。它的特色在於對海量數據進行分布式數據挖掘。但它必須依託雲計算的分布式處理、分布式資料庫和雲存儲、虛擬化技術。
隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些數據在下載到關系型資料庫用於分析時會花費過多時間和金錢。
大數據需要特殊的技術,以有效地處理大量的容忍經過時間內的數據。適用於大數據的技術,包括大規模並行處理(MPP)資料庫、數據挖掘、分布式文件系統、分布式資料庫、雲計算平台、互聯網和可擴展的存儲系統。
資料參考網路大數據
『柒』 得數據者得天下——淺談大數據思維
「三分技術,七分數據」,今後得數據者得天下。
維克托·邁爾-舍恩伯格在《大數據時代》一書中舉了百般例證,都是為了說明一個道理:在大數據時代已經到來的時候要用大數據思維去發掘大數據的潛在價值。
書中,作者提及最多的是Google如何利用人們的搜索記錄挖掘數據二次利用價值,比如預測某地流感爆發的趨勢;Amazon如何利用用戶的購買和瀏覽歷史數據進行有針對性的書籍購買推薦,以此有效提升銷售量;Farecast如何利用過去十年所有的航線機票價格打折數據,來預測用戶購買機票的時機是否合適。
什麼是大數據思維?維克托·邁爾-舍恩伯格認為:
需要全部數據樣本而不是抽樣;
關注效率而不是精確度;
關注相關性而不是因果關系。
阿里巴巴的王堅對於大數據也有一些獨特的見解,比如:
「今天的數據不是大,真正有意思的是數據變得在線了,這個恰恰是互聯網的特點。」
「非互聯網時期的產品,功能一定是它的價值,今天互聯網的產品,數據一定是它的價值。」
「你千萬不要想著拿數據去改進一個業務,這不是大數據。你一定是去做了一件以前做不了的事情。」
特別是最後一點,我是非常認同的,大數據的真正價值在於創造,在於填補無數個還未實現過的空白。
有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」。價值含量、挖掘成本比數量更為重要。
大數據在投資者眼裡是金光閃閃的兩個字:資產。比如,Facebook上市時,評估機構評定的有效資產中大部分都是其社交網站上的數據。
如果把大數據比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對數據的「加工能力」,通過「加工」實現數據的「增值」。
『捌』 維克托邁爾舍恩伯格《大數據時代》讀後感
當仔細品讀一部作品後,大家一定都收獲不少,是時候寫一篇讀後感好好記錄一下了。千萬不能認為讀後感隨便應付就可以,以下是我幫大家整理的維克托邁爾舍恩伯格《大數據時代》讀後感範文,僅供參考,希望能夠幫助到大家。
對於暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鍾情於務虛的觀點。新奇的產品於我無緣,習慣使用成熟的科技產品。既不清高,也非冷漠,就是要與現實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由於工作的原因,耳濡目染,「大數據」這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網購《大數據時代》,手不釋卷,三天讀完,頗有收獲,此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對於個人隱私保護、公共安全提出的挑戰。其次,文中的事例貼近現實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業術語,沒有假裝一副專業的面孔。縱觀全書,遣詞造句,均通俗易懂。
作者認為大數據時代具有三個顯著特點。
一、人們研究與分析某個現象時,將使用全部數據而非抽樣數據。
二、在大數據時代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。
三、了解數據之間的相關性,勝於對因果關系的探索。「是什麼」比「為什麼」重要。
作者指出,隨著技術的發展,數據的存儲與處理成本顯著降低,人們現在有能力從支離破碎的、看似毫不相乾的數據礦渣中抽煉出真知爍見。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯網公司(阿里巴巴、淘寶網)。二是擁有數據分析與處理技術的專業公司,如亞馬遜、谷歌。三是擁有創新思維的公司,他們可能既不掌握大數據,也沒有專業技術,但卻擅長使用大數據,從大數據中找到自己的理想天地。
面對即將來臨的大數據時代,個人將如何應對自如?這是個嚴肅的問題。
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。
他的咨詢客戶包括微軟、惠普和IBM等全球企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家「的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對於第一個觀點,我不敢苟同。
一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?
我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的.方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
讀完《大數據時代》這本書後,我意識到:我們即將或正在迎接由書面到電子的跳躍之後的又一重大變革。
這本書介紹了大數據時代來臨後,接踵而至的三項變革——商業變革、管理變革和思維變革。
其實,這場變革已經打響。商業領域由於大數據時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢。現在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
大家應該都知道2009年出現的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數據統計,而病人一般都是難以忍受病痛的折磨才會去醫院就診,因此也導致了信息的滯後。然而,對於飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發的地點,這便是基於龐大的數據資源,可見大數據時代對公共衛生也產生了重大的影響!
在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是台風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。於是,商家作了大膽的推測,出現這樣的結果源於兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬於世界頭號零售商的大數據頭腦!
大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪裡是自己的家,哪裡是工作單位。我們的隱私就這樣被不為人知地收集著。
大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好准備,迎接新時代的到來!
『玖』 大數據時代讀後感1000字
大數據時代讀後感1000字(精選7篇)
當品味完一本著作後,大家心中一定有很多感想,現在就讓我們寫一篇走心的讀後感吧。怎樣寫讀後感才能避免寫成「流水賬」呢?下面是我精心整理的大數據時代讀後感1000字,僅供參考,大家一起來看看吧。
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家「的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出」不是因果關系,而是相關關系。「這一論斷時,他在書中還說道:」在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道『是什麼』時,我們就會繼續向更深層次研究的因果關系,找出背後的『為什麼』。「[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可」量化「,大數據的定量分析有力地回答」是什麼「這一問題,但仍然無法完全回答」為什麼「。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節」掌控「中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:」大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。「謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。這個命題是我讀這本書最大的感觸。個人認為也是這本書最核心的思想。從頭說起吧,首先,書提出一個顛覆我以前認知的命題--」並非原子而是信息才是一切的本源「,將世界看做信息,看做可以理解的數據的海洋,為我們提供了一個從未有過的審視下是的視角。它是一種可以滲透到所有生活領域的世界觀。這個命題是在書的最後一部分中的某一段中描寫的。我之所以把它放在最前面來講,因為我覺得,這是談數據化世界的前提,自然也是談論大數據的前提啦。書的中間部分有一節講到數據化和數字化的區別。經過我自己腦子的整理,把數據化世界這個命題列為大數據思維的第二步。寫到這里,我不由得反省下,我是不是有領悟到書的精髓所在(我認為的精髓),就是第一句話。因為回顧我整個思路,還是按照舊模式的因果關系思考模式思考問題。書中另一個吸引我的地方就是,有很多觀點的論述,會從哲學的高度論述。雖然,自己肚子沒多少墨水,但是讀這些描述的時候,就會發現自己會更好的理解作者提出的命題。比如書中有一段文字
當我們說人類是通過因果關系了解世界時,我們指的是我們再理解和解釋世界各種現象時使用的兩種基本方法:一種是通過快速、虛幻的因果關系,還有一種就是通過緩慢、有條不紊的因果關系。大數據會改變這兩種基本方法在我們認識世界時所扮演的角色。
在附上一些事例的時候,用作者提供的」本質「去看待時,很容易理解,確實是這么回事。好了,那麼大數據到底改變了我們什麼呢,作者給出3點,
大數據的精髓在於我們分析信息時的三個轉變,這些轉變講改變我們理解和組建社會的方法。
第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(樣本=總體)
第二個轉變就是,研究數據如此之多,以至於我們不再熱衷於追求精確度
第三個轉變因前兩個轉變而促成,即我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。大數據告訴我們」是什麼「而不是」為什麼「。在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。,出處:短美文,否則追究其責任,謝謝你的支持,我們會給做得更好!
正如大家所知道的那樣,人類的大腦具備這樣的功能,它會把新輸入的刺激或信息與」過去的經驗或積累的部分知識「相對照,然後進行調整並接受下來。如果眼前新的現實與大腦中儲存的固有信息無法協調,便會在無意識中拒絕接受新的現實(當作沒有看見);或者通過自己一知半解的知識任意推測,使自己認識到的情況偏離實際(產生錯覺)。這是人的一種本能,目的在於使自己保持冷靜。
所以作者稱之為revolution。
講了這么多,那麼大數據到底給我們帶來什麼。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當然,書中提了很多,最多的就是,XXX公司或者個人利用大數據創造了多大的財富了,拋開這些表面的不說,最讓我動心亦或者是害怕的是,預測。這是大數據帶來最核心的東西,動心的理由無須贅述,計算機會告訴你什麼時候買什麼雙色球可以中頭獎,想想心裡是不是有一點小激動咧。當然這只是我打的一個比較誇張的比喻。至於害怕呢,書中有段話我很喜歡
公平正義的基礎是人只有做了某事才需要對它負責,畢竟,想做而未做不是犯罪,社會關系於個人責任的基本信條是,人為其選擇的行為承擔責任。如果大數據分析完全准確,那麼我們的未來會被精準的預測,因此在未來,我們不僅會失去選擇的權利,而且會按照預測去行動。如果精準的預測成為現實的話,我們也就失去了自由意志,失去了自由選擇的權利。既然我們別無選擇,那麼我們也就不需要承擔責任。這不是很諷刺嗎。
扯到這里,順便扯一下,書中另一段關於自由意志的描述
在哲學界,關於因果關系是否存在的爭論已經持續了幾個世紀。畢竟,如果凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果。而這個結果又是由其他原因導致的。以此循環往復,那麼就不存在人的自由意志這一說了。——所有的生命軌跡都只是受因果關系的控制了。因此,對於因果關系在世間所扮演的角色,哲學家們爭論不休,有時他們認為,這是與自由意志相對立。
書中舉了個例子,舉了部電影《少數派報告》,當我看到這里的時候,」哎喲,我居然看過這部電影,想想心裡還是有點小激動「,有興趣的可以去看下,大概就是講警察通過預測來提前抓捕犯人,不過不是通過大數據,是通過超人類的方式。當你什麼舉動都可以被預測,相當於你完全暴露在太陽光下,換成你,你害怕不。
最後,附上兩段結語,一段是書中的一段話,另一段是我自己瞎編的。
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。
大數據終將會影響到我們,也像其他技術一樣會是一把雙刃劍,用得好,動心,濫用,害怕。如同核技術一樣,用的話,造福地球,濫用,給個金剛石地球你,照樣爆。我相信,未來的大數據的發展會如作者所說的,是一場生活、工作與思維的革命。
「大數據」一詞不知何時在我們的生活悄然出現,為了一探究竟,我便選擇了《大數據時代》一書。
作者先從全局簡單地描述大數據對我們的生活、工作與思維的影響,再從三方面具體地用上百個學術和商業的實例展開寫作。樣本=總體、追求精確性和相關關系等大數據時代具體特點一一現出。在同時,作者也從個人、企業等多角度分析大數據中的隱憂。
書中內容繁多,在此不能各方面概括。此書中雖有許多專有名詞,但作者以其通俗的語言以及許多實例讓我嗅到大數據時代中一抹清新之氣。
為什麼是清新的呢?因為書中的內容彷彿向我打開了一個既有點熟悉又有點陌生的世界。我們現在已處於網路時代 ,在我們日常簡單的操作中大量數據產生,然而起初我們僅用眾多技術在解決手頭上的問題,那些大數據像沙子中的金子,價值不被發現。到目前,每當我們網上購書時總會看到「猜你喜歡」的欄目、出現谷歌搜索與流感預測、Farecast與飛機票價預測系統等,這些事情的達成全來自於那些曾被忽略的大數據同時也在證明「預測,大數據的核心」這句話,為我們的生活創造了前所未有的可量化的維度。看到書中這部分內容時,我不禁感受到自己的生活已在享大數據帶來的福利,就像「猜你喜歡」欄目讓我觸到更多合我口味的書,讓我看到了以前無法發現的細節。擁有大量數據的公司巨頭如谷歌、亞馬遜大力開發有關大數據的新型產業和研究相關項目。借網路時代的便利大數據成為了如今最有商業價值的事物,使一切可量化的趨勢也開始出現。「本質上世界是由信息構成的」,面對這句話時,大數據時代彷彿就在眼前。
在感受驚嘆著大數據能為我們做到以往無法想像的事和它巨大的價值時,我認同大數據能極大優化我們的生活,但又不禁為這時代感到擔憂。一旦大數據時代來臨,不僅我們的隱私可能不再是隱私,就如書中所言「我們時刻暴露在『第三隻眼』下:亞馬遜監視著我們的購物習慣,谷歌監視著我們的購物習慣,而微博似乎什麼都知道」,而且利用大數據我們可以預測許多事情並且十分高效,一旦人們依賴大數據極少運用人類自身的創新等能力被數據束縛住,世界只會淪落為一個極少活力的機械環境。而我認為最大的憂患,是大數據時代對人類自身思維、思想、信仰等精神領域的沖擊。如今我們都生活在數據中,大數據時代說不定在幾年後就會逐步來臨,這使我不禁發問:我們一直堅信著信仰著的究竟是什麼?我覺得世界說變就變實在令我想不通這個問題。事情都有好壞,我也不知道自己是否杞人憂天。
於是我繼續去探索作者對這問題的思考。「更大的數據在於人本身」,作者還說「我們是在創造更好的未來」,也說「在一個預測的時代里,人類的.自由意志不可侵犯,這一點不可輕視。我們在使用大數據時,應當懷有謙恭之心,銘記人性之本」。人類學家克利福德吉爾茲曾說:「努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來。」這些話語彷彿是陽光,驅散我心中對大數據時代的擔憂以及內心對其的恐懼。我認為,在堅守我們內心和自由意志下,大數據才會造福我們人類世界,發揮出它背後對人溫暖的光芒。
面對時代的變革,我會為堅守內心深處的自由意志而努力並「擁抱大數據」。
世界的本質就是數據,當你掌握了數據,你便掌控了世界—你可以輕而易舉地通過數據中的相關關系預測事物的發展,將一切不利因素扼殺於搖籃之中—這遠勝於"防患於未然"。
《大數據時代》一書,讓我們在觀念上有了三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。全書介紹了 "大數據"時代三種大的變革:思維變革,商業變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現代社會的運作方式必將有重大的改變,若不順應這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗爭一樣,不可避免被掠奪,被落於世界進程之後,所以我們必須轉變我們的思想。
"我們不再熱衷於尋找因果關系,而應該尋找事物間的相關關系",我想這句話是本書的核心思想。大數據時代,信息與數據已成為了一切的本源,我們生活在各種數據構成的海洋之中,如果從另一種視角看,就好像無數條"看不見的線"將我們與這些數據聯繫到一起,這是我們以前從未有過、從未想過的。大數據改變了我們以前的通過因果關系了解世界的方法,而提供了幾種新的途徑,因為,在大數據時代,我們可以分析更多數據,有時甚至可以處理和某個特別現象相關的所有數據,也就是:樣本=總體;而且,當研究數據如此之多時,我們已不熱衷於"精確",而是"混亂",若不接受"混亂",那麼有95%的非結構化數據無法利用,這將無法使我們構建完整的數據世界,在分析更多、更全面的數據之後,我們就可以從這些數據之中發掘它們的相關關系,即以"是什麼"而不是"為什麼"的角度看待數據,不用管其從何而來,只要分析其如何影響其他事物既可,即"讓數據自己發聲",這些,徹底推翻了人類以前探索數據的方法,展現了一個全新的世界。
這種觀念以驚人的力量給現知識狀況帶來了巨大的沖擊,通過對海量數據的分析,獲得巨大價值的產品和服務,或深刻的洞見。比如谷歌公司,2009年h1n1流行之時,通過檢測檢索詞條,處理34。5億個不同的數據模型,通過預測並與2007、2008年的美國疾控中心記錄的實際流感病例進行對比後,確定了45條檢索詞條組合,並將其用於一個特定的數學模型後,預測結果與官方數據相關系數高達97%,這種大數據技術,以前所未有的方式,通過海量數據分析得出流感所傳播的范圍,為預測流感提供了一種更快速、高效的工具。
同時,雖然大數據可為人類造福、對抗病症,但這僅限於掌握這門技術而言,若不重視這種技術,當我們的對手早於我們一步構建這種數據網路之時,便是我們的災難,想想,大數據雖核心的在於預測,當敵人通過這種手段預測我方下一步的行動,將是可怕的—比如你的導彈將從何處發射,將飛往哪,你的軍隊動向、目標,總之所有一切"未來"將掌控於敵手,敵方甚至可以藉此發現那些將來有"大作為"的人,從而進行滲透或扼殺,這對我們的發展無疑是致命的,所以,盡快加速大數據系統的構建進程是必須的。
對於我們國防生,也必須順應這種發展趨勢,未來的時代必將是數據極易獲取,數據網路共享化的時代,通過這些數據,建立數據模型,可以准確分析並給出適合每一個人的計劃,如運動量、訓練強度,可以"先知、先覺",及時發現一個人的負面情緒前及時疏導,這些必將成為現實,我們必須跟進時代,做好准備,去應對大數據時代的一切!
「除了上帝,任何人都必須用數據來說話。」——這是《大數據》中出現的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數字信息時代,數據和空氣一樣遍布生活,對於有些人來說,數據無意義,而對於有些人來說,數據,即真相。
美國是《大數據》的主角,全書通過講述美國半個多世紀信息開放、技術創新的歷史,公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,Web3·0與下一代互聯網的未來圖景等等,為讀者一一細解數據創新給公民、政府、社會帶來的種種挑戰和變革。
透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動著政府信息的透明與公開。
讀完此書,對生活中的數據及數據處理突然有了很大的興趣。如果有一天,處處以數據說話,那麼,政治、制度、生活將更加清明,事故、將降到最低點。
作為信息技術教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術特有的文化以及能用於教學的鮮活案例。
每天能用來閱讀的時間很少,總是要等到夜深疲倦時才有空打開書本,總是在眼睛極不舒服的情況下堅持閱讀,《大數據》就這樣在堅持中溶入我的思想……
讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。
我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。在教學過程中,學生的行為表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不了解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注「是什麼」比「為什麼」要有實際意義得多。而我們的教育恰好需要把注意力從「為什麼」轉移到「是什麼」上面來,只有如此,才能把教育從為什麼發展成「可能成為什麼」上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到數據化上面,這才是它的出路。
如何將數據融入教學,教育者首先通過標准化全科教學處方,實現了教師授課模板和教學內容的標准化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。
與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大數據時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何復雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。
舍恩伯格的《大數據時代》,讓我重新審視了"大數據"這個在信息時代異軍突起的熱點詞彙,作為信息安全專業的我,對大數據這個詞本身有著更多的熱忱。
在網路上搜索到的解釋是:"大數據",或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。特點:數量、速度、品種、真實性。
而舍恩伯格認為,大數據並不能定義一個確切的概念。他提到"大數據是人們獲得新的認知,創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
本書中,主要從三個方面論述,即思維變革、商業變革和管理變革。而舍恩伯格更是著重闡明三大觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對於觀點一,我不敢苟同,畢竟大數據的實現需要一定的技術支持,而顯然,現在這種技術還不夠成熟,同時一些簡單的事情運用大數據反倒是問題更加復雜化,因此這種大叔據的繁雜處理方式更適用於一些特定的情況,比如商業預測,人類dna的研究等。
而對第二種觀點,我是十分贊同舍恩伯格所說的"大數據的簡單演算法比小數據的簡單演算法有效"。在計算機行業迅速發展中,一種新的簡單可行的演算法的出現,遠沒有計算機在運算速度和存儲容量的發展快,而大數據演算法似乎更能迎合這種大趨勢。
觀點三中提到的相關關系在大數據中可是重量級的,它能較快找到事物規律和對應的解決措施,當然,也不能完全忽視因果關系,畢竟人們在思維上更能夠接受因果關系分析出的結果,而大數據預測的需要人們慢慢的適應才能接受。當我們完成相關關系的分析而又不滿足於只知道"是什麼"的時候,我們就可以轉而研究"為什麼"了,畢竟問題的根本在於因果。而舍恩伯格的全體數據和相關關系是大數據時代下的一種捷徑。
但是在信息時代,信息安全問題的日趨凸顯,數據獨裁與隱私保護之間的矛盾更是立於風口浪尖,成為眾矢之的,舍恩伯格在本書的最後章節曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數據並不是一個充斥著演算法的和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數據時代同樣的重要,數據是為人類服務的,也就該人類驅使下完成相應的目的。
在這樣的大環境下,常引起我更多的思考和擔憂。
大數據時代對於我們同是機遇與挑戰,一些國家已開始步入大數據時代的行列,並在各個領域開始研究和使用。而對於我國龐大的人口,以及較大的領土面積,都可以在大數據時代為我們提供數據的保障,而能否面臨挑戰,在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術等方面的問題,更應在政策上逐步開放各領域的數據,保證數據來源、許可權等問題得到解決,不斷學習先進的計算機技術,縮小與其他國家的差距。
工業化、信息化,我們都向世界交出了一份讓世界不能小覷的答案;
大數據時代的數據化我們又將怎樣在新的風暴中所向披靡,如果大數據時代是一種必然趨勢,那這就是我們這一代人的責任,是我們新的戰場!
;『拾』 誰最早提出大數據的概念
最早提出大數據的是美國數據學家維克多•邁爾-舍恩伯格。推薦他的兩本書《刪除》,《大數據時代》。