Ⅰ 大數據時代,以及其特點、影響
第一次:1980年前後,個人計算的普及,解決的信息處理的問題。
第二次:1995年前後,互聯網,解決了信息傳輸。
第三次:2010年前後,物聯網、雲計算、大數據,解決了信息爆炸時代的數據處理方式。
1.存儲設備容量不斷增加
2.CPU處理能力不斷提升
3.網路帶寬不斷散清明增加
大數據的特點可以概括為「4V」:
列舉大數據在常見領域的作用:
1.製造業:
利用工業大數據提升製造業水平,包括產品故障診、預測、分析工藝流程、改進生產工藝、優化生產過程能耗、工業供應鏈分析與優化、生產計劃與排程。
2.金融行業:
大數據在高頻交易、社交情緒沖告分析、信貸風險分析三大金融創新領域發揮重要作用。
3.汽車行業:
利用大數據正滾和物聯網技術的無人駕駛汽車。
4.互聯網行業:
藉助於大數據技術,分析客戶行為,進行商品推薦和有針對性的廣告投放。
5.餐飲行業:
利用大數據實現餐飲O2O模式,顛覆傳統餐飲經營方式。
6.物流行業:
利用大數據優化物流網路,提高物流效率,降低物流成本。
7.體育和娛樂:
幫助訓練球隊,決定投拍那種題材的影視作品,以及預測比賽結果。
8.個人生活:
利用每個人相關聯的「個人大數據」,分析個人生活行為和習慣,為其提供更加周到的個性化服務。
Ⅱ 大數據時代讀後感
《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為“大數據商業應用第一人”,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究。以下是這本書的讀後感範文,歡迎閱讀!
大數據時代讀後感(一)
我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。這個命題是我讀這本書最大的感觸。個人認為也是這本書最核心的思想。從頭說起吧,首先,書提出一個顛覆我以前認知的命題--”並非原子而是信息才是一切的本源“,將世界看做信息,看做可以理解的數據的海洋,為我們提供了一個從未有過的審視下是的視角。它是一種可以滲透到所有生活領域的世界觀。這個命題是在書的最後一部分中的某一段中描寫的。我之所以把它放在最前面來講,因為我覺得,這是談數據化世界的前提,自然也是談論大數據的前提啦。書的中間部分有一節講到數據化和數字化的區別。經過我自己腦子的整理,把數據化世界這個命題列為大數據思維的第二步。寫到這里,我不由得反省下,我是不是有領悟到書的精髓所在(我認為的精髓),就是第一句話。因為回顧我整個思路,還是按照舊模式的因果關系思考模式思考問題。書中另一個吸引我的地方就是,有很多觀點的論述,會從哲學的高度論述。雖然,自己肚子沒多少墨水,但是讀這些描述的時候,就會發現自己會更好的理解作者提出的命題。比如書中有一段文字
當我們說人類是通過因果關系了解世界時,我們指的是我們再理解和解釋世界各種現象時使用的兩種基本方法:一種是通過快速、虛幻的因果關系,還有一種就是通過緩慢、有條不紊的因果關系。大數據會改變這兩種基本方法在我們認識世界時所扮演的角色。
在附上一些事例的時候,用作者提供的”本質“去看待時,很容易理解,確實是這么回事。好了,那麼大數據到底改變了我們什麼呢,作者給出3點,
大數據的精髓在於我們分析信息時的三個轉變,這些轉變講改變我們理解和組建社會的方法。
第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(樣本=總體)
第二個轉變就是,研究數據如此之多,以至於我們不再熱衷於追求精確度
第三個轉變因前兩個轉變而促成,即我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。大數據告訴我們”是什麼“而不是”為什麼“。在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。
正如大家所知道的那樣,人類的大腦具備這樣的功能,它會把新輸入的刺激或信息與”過去的經驗或積累的部分知識“相對照,然後進行調整並接受下來。如果眼前新的現實與大腦中儲存的固有信息無法協調,便會在無意識中拒絕接受新的現實(當作沒有看見);或者通過自己一知半解的知識任意推測,使自己認識到的情況偏離實際(產生錯覺)。這是人的一種本能,目的在於使自己保持冷靜。
所以作者稱之為revolution。
講了這么多,那麼大數據到底給我們帶來什麼。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當然,書中提了很多,最多的就是,XXX公司或者個人利用大數據創造了多大的財富了,拋開這些表面的不說,最讓我動心亦或者是害怕的是---預測。這是大數據帶來最核心的東西,動心的理由無須贅述,計算機會告訴你什麼時候買什麼雙色球可以中頭獎,想想心裡是不是有一點小激動咧。當然這只是我打的一個比較誇張的比喻。至於害怕呢,書中有段話我很喜歡
公平正義的基礎是人只有做了某事才需要對它負責,畢竟,想做而未做不是犯罪,社會關系於個人責任的基本信條是,人為其選擇的行為承擔責任。如果大數據分析完全准確,那麼我們的未來會被精準的預測,因此在未來,我們不僅會失去選擇的權利,而且會按照預測去行動。如果精準的預測成為現實的話,我們也就失去了自由意志,失去了自由選擇的權利。既然我們別無選擇,那麼我們也就不需要承擔責任。這不是很諷刺嗎。
扯到這里,順便扯一下,書中另一段關於自由意志的描述
在哲學界,關於因果關系是否存在的爭論已經持續了幾個世紀。畢竟,如果凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果。而這個結果又是由其他原因導致的。以此循環往復,那麼就不存在人的自由意志這一說了。——所有的生命軌跡都只是受因果關系的控制了。因此,對於因果關系在世間所扮演的角色,哲學家們爭論不休,有時他們認為,這是與自由意志相對立。
書中舉了個例子,舉了部電影《少數派報告》,當我看到這里的時候,”哎喲,我居然看過這部電影,想想心裡還是有點小激動“,有興趣的可以去看下,大概就是講警察通過預測來提前抓捕犯人,不過不是通過大數據,是通過超人類的方式。當你什麼舉動都可以被預測,相當於你完全暴露在太陽光下,換成你,你害怕不。
最後,附上兩段結語,一段是書中的一段話,另一段是我自己瞎編的。
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。
大數據終將會影響到我們,也像其他技術一樣會是一把雙刃劍,用得好,動心,濫用,害怕。如同核技術一樣,用的話,造福地球,濫用,給個金剛石地球你,照樣爆。我相信,未來的大數據的發展會如作者所說的,是一場生活、工作與思維的革命。
大數據時代讀後感(二)
去年的“雲計算”炒得熱火朝天的,今年的“大數據”又突襲而來。彷彿一夜間,各廠商都紛紛改旗換幟,推起“大數據”來了。於是乎,各企業的CIO也將熱度紛紛轉向關注“大數據”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現實中小企業雲計算,大數據的現狀。
不過話又還得說回來,《大數據時代》是本好書。
當然,很多IT知名人士也大力推薦,寫了好多讀後感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現在也比較火熱的BI,覺得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘。看過此書後,感覺到之前的想法,只能算是中了一小半吧---巨量的數據,而另一前:著眼於數據關聯性,而非數據精確性,或許才是大數據與現時BI最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數據的關聯性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現在的數據分析方法來論,更多的傾向於數據的精確性。看完此書,我心中的一些問題:
1.什麼是大數據?
查了查網路,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的'的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity--這個好像是IBM的定義吧。
以個人的觀點來看:數據海量,存儲海量都是大數據的基本原型吧。
2.大數據適合什麼樣的企業?
誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關聯性,才可以讓通過
專業化的處理,讓其為企業產生價值。針對電信運營,互聯網應用這樣海量用戶的數據的大企業,也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業呢?銷售訂單數據?若非百年老店,估計數據也是少得可憐,5,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行為分析為最多。同樣,在公共事業類的政府機構,大數據的作用也許也能很好的發揮。反而感覺在大多數中小型企業應用大數據,似乎有點大題小作。書中說:大數據是企業競爭力。誠然,數據是一個企業的核心無形資源(利用得好的話),但是否所有的數據,或都換則方式說:所有的企業都以大數據為競爭力,是否真的合適么?是否在中小企業中,會顯示得小題大做呢?
3.大數據帶來的影響
當一波又一波的IT技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好准備,你都要開始迎接它所給你帶來的影響了。經過物聯網,雲計算的推波助瀾下,大數據開始登場了。但它到底給我們帶來了什麼呢?
1)預測未來書中以Google成功預測了未來可能發生流感的案例來開篇,表明通過大數據的應用,可以為我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。
2)變革商業大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業機遇與商業模式,數據的潛在價值會源源不斷地發揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業鏈產生。影響最大的,當然是IT公司
3)變革思維書中所說:因為有海量的數據作基礎,未來,我們可能更關注數據的相關,而非精細度。對這條,本人還是持保留意見的。
大數據時代讀後感(三)
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家“的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分”大數據時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。”大數據的簡單演算法比小數據的復雜演算法更有效。“更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。”不是因果關系,而是相關關系。“不需要知道”為什麼“,只需要知道”是什麼“。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出”不是因果關系,而是相關關系。“這一論斷時,他在書中還說道:”在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道‘是什麼’時,我們就會繼續向更深層次研究的因果關系,找出背後的‘為什麼’。“[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可”量化“,大數據的定量分析有力地回答”是什麼“這一問題,但仍然無法完全回答”為什麼“。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節”掌控“中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:”大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。“謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
Ⅲ 讀《大數據時代》心得體會
讀《大數據時代》心得體會(一)
讀了《大數據時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎麼明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。
“在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們人類的數據收集和處理能力達到拍位元組甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先後變化關系規則。兩者似乎是做同一件事。可大數據要的“不是因果關系,而是相關關系”,“知道是什麼就夠了,沒必要知道為什麼”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那麼大數據會不會通過正視混雜性,放棄因果關系最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
還好我知道自己對什麼統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。
讀《大數據時代》心得體會(二)
信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什麼信息時代轉變為了大數據時代?大數據時代帶給了我們什麼?
信息和數據的定義。維基網路解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字元和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什麼”,而不需要知道“為什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而並非相離互斥。
數據未來的故事。數據的發展,給我們帶來什麼預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。
讀《大數據時代》心得體會(三)
這本書里主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20XX年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對准確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對准確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯系Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對准確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其准確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之後,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群傢伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
讀《大數據時代》心得體會(四)
利用周末,一口氣讀完了塗子沛的大作《大數據》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數據技術,更多是與大數據相關的美國政治、經濟、社會和文化的演進。作為一名信息化從業者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個方面的體會,但窺一斑基本能見全貌。
一是政府業務資料庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進,各級政府都在通過政府門戶網站建設積極推進網上政務信息公開,但我們的信息公開,現階段還主要是政府的政策、法律法規、標准、公文通告、工作職責、辦事指南、工作動態、人事任免等行政事務性信息的公開。當然,實時的政府業務資料庫公開也已經取得很大進步。在中國政府門戶網,可以查詢一些公益資料庫,如國家統計局的經濟統計數據、環保部數據中心提供的全國空氣、水文等數據,氣象總局提供的全國氣象數據,民航總局提供的全國航班信息等;訪問各個部委的網站,也能查到很多業務數據,如發改委的項目立項庫、工商局的企業信用庫、國土資源部的土地證庫、國家安監總局的煤礦安全預警信息庫、各類工程招標信息庫等等。這是一個非常大的進步,也是這么多年電子政務建設所取得的成效和價值!但是,政務業務資料庫中的很多數據目前還沒有實現公開,很多數據因為部門利益和“保密”等因素,還僅限於部門內部人員使用,沒有公開給公眾;已經公開的數據也僅限於一部分基本信息和統計信息,更多數據還沒有被公開。從《大數據》一書中記錄的美國數據公開的實踐來看,美國在數據公開的廣度和深度都比較大。美國人認為“用納稅人的錢收集的數據應該免費提供給納稅人使用”,盡管美國政府事實上對數據的公開也有抵觸,但民願不可違,美國政府的業務數據越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件後,開放力度更加大。DATA.GOV是美國聯盟政府新建設的統一的數據開放門戶網站,網站按照原始數據、地理數據和數據應用工具來組織開放的各類數據,累積開放378529個原始和地理數據集。在中國尚沒有這樣的數據開放的網站。另外,由於制度的不同,美國業務信息公開的深度也很大,例如,網上公布的美國總統“白宮訪客記錄”公布的甚至是造訪白宮的各類人員的相關信息;美國的FedSpending網站,能夠逐條跟蹤、記錄、分析聯邦政府每一筆財政支出。這在中國,目前應該還沒有實現。
二是對政府對業務數據的分析。目前,中國各級政府網站所提供的業務數據基本上還是數據表,部分網站能提供一些統計圖,但很少能實現數據的跨部門聯機分析、數據關聯分析。這主要是由於以往中國政務信息化的建設還處於部門建設階段。美國在這方面的步伐要快一些,美國的DATA.GOV網站,不僅提供原始數據和地理數據,還提供很多數據工具,這些工具很多都是公眾、公益組織和一些商業機構提供的,這些應用為數據處理、聯機分析、基於社交網路的關聯分析等方面提供手段。如DATA.GOV上提供的白宮訪客搜索工具,可以搜尋到訪客信息,並將白宮訪客與其他微博、社交網站等進行關聯,提高訪客的透明度。
三是關於個人數據的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個人身份證,也不能建立基於個人身份證號碼的個人信息的關聯,建立“中央數據銀行”的提案也一再被否決。這一點,在中國不是問題,每個公民有唯一的身份信息,通過身份證信息,可以獲取公民的基本信息。今後,隨著國家人口基礎資料庫等基礎資源庫的建設,公民的社保、醫療等其他相關信息也能方便獲取,當然信息還是限於政府部門使用,但很難完全保證整合起來的這些個人信息不被泄露或者利用。
數據是信息化建設的基礎,兩個大國在大數據領域的互相學習和借鑒,取長補短,將推進世界進入信息時代。我欣喜地看到,美國政府20XX年啟動了“大數據研發計劃”,投資2億美元,推動大數據提取、存儲、分析、共享、可視化等領域的研究,並將其與超級計算和互聯網投資相提並論。同年,中國政府20XX年也批復了“十二五國家政務信息化建設工程規劃”,總投資額估計在幾百億,專門有人口、法人、空間、宏觀經濟和文化等五大資源庫的五大建設工程。開放、共享和智能的大數據的時代已經來臨!
我精心推薦
Ⅳ 大數據時代讀後感1000字
大數據時代讀後感1000字(精選7篇)
當品味完一本著作後,大家心中一定有很多感想,現在就讓我們寫一篇走心的讀後感吧。怎樣寫讀後感才能避免寫成「流水賬」呢?下面是我精心整理的大數據時代讀後感1000字,僅供參考,大家一起來看看吧。
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家「的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出」不是因果關系,而是相關關系。「這一論斷時,他在書中還說道:」在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道『是什麼』時,我們就會繼續向更深層次研究的因果關系,找出背後的『為什麼』。「[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可」量化「,大數據的定量分析有力地回答」是什麼「這一問題,但仍然無法完全回答」為什麼「。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節」掌控「中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:」大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。「謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。這個命題是我讀這本書最大的感觸。個人認為也是這本書最核心的思想。從頭說起吧,首先,書提出一個顛覆我以前認知的命題--」並非原子而是信息才是一切的本源「,將世界看做信息,看做可以理解的數據的海洋,為我們提供了一個從未有過的審視下是的視角。它是一種可以滲透到所有生活領域的世界觀。這個命題是在書的最後一部分中的某一段中描寫的。我之所以把它放在最前面來講,因為我覺得,這是談數據化世界的前提,自然也是談論大數據的前提啦。書的中間部分有一節講到數據化和數字化的區別。經過我自己腦子的整理,把數據化世界這個命題列為大數據思維的第二步。寫到這里,我不由得反省下,我是不是有領悟到書的精髓所在(我認為的精髓),就是第一句話。因為回顧我整個思路,還是按照舊模式的因果關系思考模式思考問題。書中另一個吸引我的地方就是,有很多觀點的論述,會從哲學的高度論述。雖然,自己肚子沒多少墨水,但是讀這些描述的時候,就會發現自己會更好的理解作者提出的命題。比如書中有一段文字
當我們說人類是通過因果關系了解世界時,我們指的是我們再理解和解釋世界各種現象時使用的兩種基本方法:一種是通過快速、虛幻的因果關系,還有一種就是通過緩慢、有條不紊的因果關系。大數據會改變這兩種基本方法在我們認識世界時所扮演的角色。
在附上一些事例的時候,用作者提供的」本質「去看待時,很容易理解,確實是這么回事。好了,那麼大數據到底改變了我們什麼呢,作者給出3點,
大數據的精髓在於我們分析信息時的三個轉變,這些轉變講改變我們理解和組建社會的方法。
第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(樣本=總體)
第二個轉變就是,研究數據如此之多,以至於我們不再熱衷於追求精確度
第三個轉變因前兩個轉變而促成,即我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。大數據告訴我們」是什麼「而不是」為什麼「。在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。,出處:短美文,否則追究其責任,謝謝你的支持,我們會給做得更好!
正如大家所知道的那樣,人類的大腦具備這樣的功能,它會把新輸入的刺激或信息與」過去的經驗或積累的部分知識「相對照,然後進行調整並接受下來。如果眼前新的現實與大腦中儲存的固有信息無法協調,便會在無意識中拒絕接受新的現實(當作沒有看見);或者通過自己一知半解的知識任意推測,使自己認識到的情況偏離實際(產生錯覺)。這是人的一種本能,目的在於使自己保持冷靜。
所以作者稱之為revolution。
講了這么多,那麼大數據到底給我們帶來什麼。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當然,書中提了很多,最多的就是,XXX公司或者個人利用大數據創造了多大的財富了,拋開這些表面的不說,最讓我動心亦或者是害怕的是,預測。這是大數據帶來最核心的東西,動心的理由無須贅述,計算機會告訴你什麼時候買什麼雙色球可以中頭獎,想想心裡是不是有一點小激動咧。當然這只是我打的一個比較誇張的比喻。至於害怕呢,書中有段話我很喜歡
公平正義的基礎是人只有做了某事才需要對它負責,畢竟,想做而未做不是犯罪,社會關系於個人責任的基本信條是,人為其選擇的行為承擔責任。如果大數據分析完全准確,那麼我們的未來會被精準的預測,因此在未來,我們不僅會失去選擇的權利,而且會按照預測去行動。如果精準的預測成為現實的話,我們也就失去了自由意志,失去了自由選擇的權利。既然我們別無選擇,那麼我們也就不需要承擔責任。這不是很諷刺嗎。
扯到這里,順便扯一下,書中另一段關於自由意志的描述
在哲學界,關於因果關系是否存在的爭論已經持續了幾個世紀。畢竟,如果凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果。而這個結果又是由其他原因導致的。以此循環往復,那麼就不存在人的自由意志這一說了。——所有的生命軌跡都只是受因果關系的控制了。因此,對於因果關系在世間所扮演的角色,哲學家們爭論不休,有時他們認為,這是與自由意志相對立。
書中舉了個例子,舉了部電影《少數派報告》,當我看到這里的時候,」哎喲,我居然看過這部電影,想想心裡還是有點小激動「,有興趣的可以去看下,大概就是講警察通過預測來提前抓捕犯人,不過不是通過大數據,是通過超人類的方式。當你什麼舉動都可以被預測,相當於你完全暴露在太陽光下,換成你,你害怕不。
最後,附上兩段結語,一段是書中的一段話,另一段是我自己瞎編的。
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。
大數據終將會影響到我們,也像其他技術一樣會是一把雙刃劍,用得好,動心,濫用,害怕。如同核技術一樣,用的話,造福地球,濫用,給個金剛石地球你,照樣爆。我相信,未來的大數據的發展會如作者所說的,是一場生活、工作與思維的革命。
「大數據」一詞不知何時在我們的生活悄然出現,為了一探究竟,我便選擇了《大數據時代》一書。
作者先從全局簡單地描述大數據對我們的生活、工作與思維的影響,再從三方面具體地用上百個學術和商業的實例展開寫作。樣本=總體、追求精確性和相關關系等大數據時代具體特點一一現出。在同時,作者也從個人、企業等多角度分析大數據中的隱憂。
書中內容繁多,在此不能各方面概括。此書中雖有許多專有名詞,但作者以其通俗的語言以及許多實例讓我嗅到大數據時代中一抹清新之氣。
為什麼是清新的呢?因為書中的內容彷彿向我打開了一個既有點熟悉又有點陌生的世界。我們現在已處於網路時代 ,在我們日常簡單的操作中大量數據產生,然而起初我們僅用眾多技術在解決手頭上的問題,那些大數據像沙子中的金子,價值不被發現。到目前,每當我們網上購書時總會看到「猜你喜歡」的欄目、出現谷歌搜索與流感預測、Farecast與飛機票價預測系統等,這些事情的達成全來自於那些曾被忽略的大數據同時也在證明「預測,大數據的核心」這句話,為我們的生活創造了前所未有的可量化的維度。看到書中這部分內容時,我不禁感受到自己的生活已在享大數據帶來的福利,就像「猜你喜歡」欄目讓我觸到更多合我口味的書,讓我看到了以前無法發現的細節。擁有大量數據的公司巨頭如谷歌、亞馬遜大力開發有關大數據的新型產業和研究相關項目。借網路時代的便利大數據成為了如今最有商業價值的事物,使一切可量化的趨勢也開始出現。「本質上世界是由信息構成的」,面對這句話時,大數據時代彷彿就在眼前。
在感受驚嘆著大數據能為我們做到以往無法想像的事和它巨大的價值時,我認同大數據能極大優化我們的生活,但又不禁為這時代感到擔憂。一旦大數據時代來臨,不僅我們的隱私可能不再是隱私,就如書中所言「我們時刻暴露在『第三隻眼』下:亞馬遜監視著我們的購物習慣,谷歌監視著我們的購物習慣,而微博似乎什麼都知道」,而且利用大數據我們可以預測許多事情並且十分高效,一旦人們依賴大數據極少運用人類自身的創新等能力被數據束縛住,世界只會淪落為一個極少活力的機械環境。而我認為最大的憂患,是大數據時代對人類自身思維、思想、信仰等精神領域的沖擊。如今我們都生活在數據中,大數據時代說不定在幾年後就會逐步來臨,這使我不禁發問:我們一直堅信著信仰著的究竟是什麼?我覺得世界說變就變實在令我想不通這個問題。事情都有好壞,我也不知道自己是否杞人憂天。
於是我繼續去探索作者對這問題的思考。「更大的數據在於人本身」,作者還說「我們是在創造更好的未來」,也說「在一個預測的時代里,人類的.自由意志不可侵犯,這一點不可輕視。我們在使用大數據時,應當懷有謙恭之心,銘記人性之本」。人類學家克利福德吉爾茲曾說:「努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來。」這些話語彷彿是陽光,驅散我心中對大數據時代的擔憂以及內心對其的恐懼。我認為,在堅守我們內心和自由意志下,大數據才會造福我們人類世界,發揮出它背後對人溫暖的光芒。
面對時代的變革,我會為堅守內心深處的自由意志而努力並「擁抱大數據」。
世界的本質就是數據,當你掌握了數據,你便掌控了世界—你可以輕而易舉地通過數據中的相關關系預測事物的發展,將一切不利因素扼殺於搖籃之中—這遠勝於"防患於未然"。
《大數據時代》一書,讓我們在觀念上有了三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。全書介紹了 "大數據"時代三種大的變革:思維變革,商業變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現代社會的運作方式必將有重大的改變,若不順應這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗爭一樣,不可避免被掠奪,被落於世界進程之後,所以我們必須轉變我們的思想。
"我們不再熱衷於尋找因果關系,而應該尋找事物間的相關關系",我想這句話是本書的核心思想。大數據時代,信息與數據已成為了一切的本源,我們生活在各種數據構成的海洋之中,如果從另一種視角看,就好像無數條"看不見的線"將我們與這些數據聯繫到一起,這是我們以前從未有過、從未想過的。大數據改變了我們以前的通過因果關系了解世界的方法,而提供了幾種新的途徑,因為,在大數據時代,我們可以分析更多數據,有時甚至可以處理和某個特別現象相關的所有數據,也就是:樣本=總體;而且,當研究數據如此之多時,我們已不熱衷於"精確",而是"混亂",若不接受"混亂",那麼有95%的非結構化數據無法利用,這將無法使我們構建完整的數據世界,在分析更多、更全面的數據之後,我們就可以從這些數據之中發掘它們的相關關系,即以"是什麼"而不是"為什麼"的角度看待數據,不用管其從何而來,只要分析其如何影響其他事物既可,即"讓數據自己發聲",這些,徹底推翻了人類以前探索數據的方法,展現了一個全新的世界。
這種觀念以驚人的力量給現知識狀況帶來了巨大的沖擊,通過對海量數據的分析,獲得巨大價值的產品和服務,或深刻的洞見。比如谷歌公司,2009年h1n1流行之時,通過檢測檢索詞條,處理34。5億個不同的數據模型,通過預測並與2007、2008年的美國疾控中心記錄的實際流感病例進行對比後,確定了45條檢索詞條組合,並將其用於一個特定的數學模型後,預測結果與官方數據相關系數高達97%,這種大數據技術,以前所未有的方式,通過海量數據分析得出流感所傳播的范圍,為預測流感提供了一種更快速、高效的工具。
同時,雖然大數據可為人類造福、對抗病症,但這僅限於掌握這門技術而言,若不重視這種技術,當我們的對手早於我們一步構建這種數據網路之時,便是我們的災難,想想,大數據雖核心的在於預測,當敵人通過這種手段預測我方下一步的行動,將是可怕的—比如你的導彈將從何處發射,將飛往哪,你的軍隊動向、目標,總之所有一切"未來"將掌控於敵手,敵方甚至可以藉此發現那些將來有"大作為"的人,從而進行滲透或扼殺,這對我們的發展無疑是致命的,所以,盡快加速大數據系統的構建進程是必須的。
對於我們國防生,也必須順應這種發展趨勢,未來的時代必將是數據極易獲取,數據網路共享化的時代,通過這些數據,建立數據模型,可以准確分析並給出適合每一個人的計劃,如運動量、訓練強度,可以"先知、先覺",及時發現一個人的負面情緒前及時疏導,這些必將成為現實,我們必須跟進時代,做好准備,去應對大數據時代的一切!
「除了上帝,任何人都必須用數據來說話。」——這是《大數據》中出現的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數字信息時代,數據和空氣一樣遍布生活,對於有些人來說,數據無意義,而對於有些人來說,數據,即真相。
美國是《大數據》的主角,全書通過講述美國半個多世紀信息開放、技術創新的歷史,公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,Web3·0與下一代互聯網的未來圖景等等,為讀者一一細解數據創新給公民、政府、社會帶來的種種挑戰和變革。
透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動著政府信息的透明與公開。
讀完此書,對生活中的數據及數據處理突然有了很大的興趣。如果有一天,處處以數據說話,那麼,政治、制度、生活將更加清明,事故、將降到最低點。
作為信息技術教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術特有的文化以及能用於教學的鮮活案例。
每天能用來閱讀的時間很少,總是要等到夜深疲倦時才有空打開書本,總是在眼睛極不舒服的情況下堅持閱讀,《大數據》就這樣在堅持中溶入我的思想……
讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。
我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。在教學過程中,學生的行為表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不了解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注「是什麼」比「為什麼」要有實際意義得多。而我們的教育恰好需要把注意力從「為什麼」轉移到「是什麼」上面來,只有如此,才能把教育從為什麼發展成「可能成為什麼」上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到數據化上面,這才是它的出路。
如何將數據融入教學,教育者首先通過標准化全科教學處方,實現了教師授課模板和教學內容的標准化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。
與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大數據時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何復雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。
舍恩伯格的《大數據時代》,讓我重新審視了"大數據"這個在信息時代異軍突起的熱點詞彙,作為信息安全專業的我,對大數據這個詞本身有著更多的熱忱。
在網路上搜索到的解釋是:"大數據",或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。特點:數量、速度、品種、真實性。
而舍恩伯格認為,大數據並不能定義一個確切的概念。他提到"大數據是人們獲得新的認知,創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
本書中,主要從三個方面論述,即思維變革、商業變革和管理變革。而舍恩伯格更是著重闡明三大觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對於觀點一,我不敢苟同,畢竟大數據的實現需要一定的技術支持,而顯然,現在這種技術還不夠成熟,同時一些簡單的事情運用大數據反倒是問題更加復雜化,因此這種大叔據的繁雜處理方式更適用於一些特定的情況,比如商業預測,人類dna的研究等。
而對第二種觀點,我是十分贊同舍恩伯格所說的"大數據的簡單演算法比小數據的簡單演算法有效"。在計算機行業迅速發展中,一種新的簡單可行的演算法的出現,遠沒有計算機在運算速度和存儲容量的發展快,而大數據演算法似乎更能迎合這種大趨勢。
觀點三中提到的相關關系在大數據中可是重量級的,它能較快找到事物規律和對應的解決措施,當然,也不能完全忽視因果關系,畢竟人們在思維上更能夠接受因果關系分析出的結果,而大數據預測的需要人們慢慢的適應才能接受。當我們完成相關關系的分析而又不滿足於只知道"是什麼"的時候,我們就可以轉而研究"為什麼"了,畢竟問題的根本在於因果。而舍恩伯格的全體數據和相關關系是大數據時代下的一種捷徑。
但是在信息時代,信息安全問題的日趨凸顯,數據獨裁與隱私保護之間的矛盾更是立於風口浪尖,成為眾矢之的,舍恩伯格在本書的最後章節曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數據並不是一個充斥著演算法的和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數據時代同樣的重要,數據是為人類服務的,也就該人類驅使下完成相應的目的。
在這樣的大環境下,常引起我更多的思考和擔憂。
大數據時代對於我們同是機遇與挑戰,一些國家已開始步入大數據時代的行列,並在各個領域開始研究和使用。而對於我國龐大的人口,以及較大的領土面積,都可以在大數據時代為我們提供數據的保障,而能否面臨挑戰,在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術等方面的問題,更應在政策上逐步開放各領域的數據,保證數據來源、許可權等問題得到解決,不斷學習先進的計算機技術,縮小與其他國家的差距。
工業化、信息化,我們都向世界交出了一份讓世界不能小覷的答案;
大數據時代的數據化我們又將怎樣在新的風暴中所向披靡,如果大數據時代是一種必然趨勢,那這就是我們這一代人的責任,是我們新的戰場!
;Ⅳ 3000字概括《大數據時代》
有言在先
近期有些起伏,這種情況最適合回歸書本,尋找一些你內心認同的東西。這幾天花了點時間重溫《大數據時代》,整理、總結出了精華的東西,分享給大家。
大數據引起了變革
當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數據進行分析,獲得巨大價值的產品和服務,或深刻的洞見。
? 震人心魄的數據
2003年,人類第一次破譯人體基因密碼的時候,辛苦工作10年才完成了三十億對鹼基對的排序;大約10年後,世界范圍內的基因儀每15分鍾就可以完成同樣的工作。在金融領域,美國股市每天的成交量高達70億股,而其中三分之二的交易都是郵件里在數學模型和演算法之上的計算機程序自動完成的。
在2007年,所有數據中只有7%是存儲在報紙、書籍、圖片等媒介上的模擬數據,其餘全部是數字數據;在2000年時,數字存儲信息仍只佔全球數據量的四分之一;當時,另外四分之三的信息都存儲在報紙、膠片、黑膠唱片和盒式磁帶這類媒介上。
? 大數據的精髓
大數據帶給我們的三個顛覆性觀念轉變:是全部數據,而不是隨機采樣;是大體方向,而不是精確制導;是相關關系,而不是因果關系。
A.不是隨機樣本,而是全體數據:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(隨機采樣,以前我們通常把這看成是理所應當的限制,但高性能的數字技術讓我們意識到,這其實是一種人為限制);
B.不是精確性,而是混雜性:研究數據如此之多,以至於我們不再熱衷於追求精確度;之前需要分析的數據很少,所以我們必須盡可能精確地量化我們的記錄,隨著規模的擴大,對精確度的痴迷將減弱;擁有了大數據,我們不再需要對一個現象刨根問底,只要掌握了大體的發展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力;
C.不是因果關系,而是相關關系:我們不再熱衷於找因果關系,尋找因果關系是人類長久以來的習慣,在大數據時代,我們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系;相關關系也許不能准確地告訴我們某件事情為何會發生,但是它會提醒我們這件事情正在發生。
? 大數據的核心是預測
大數據的核心就是預測,它通常被視為人工智慧的一部分,或者更確切地說,被視為一種機器學習。大數據不是要教機器人像人一樣思考,而是把數學演算法運用到海量的數據上來預測事情發生的可能性。
●●●
不是隨機樣本,而是全體數據
歷史上,因為記錄、儲存、分析數據的工具都不夠好,為了讓分析變得簡單,我們選擇了把數據量減少,
統計學的一個目的就是用盡可能少的數據來證實盡可能重大的發現。
? 傳統抽樣的精確性
采樣分析的精確性隨著采樣隨機性的增加而大幅提高,但與樣本數量的增加關系不大,大致原因是當樣本數量達到某個值後,我們從新個體身上得到的信息會越來越少,這與經濟學中的邊際效應類似。
? 隨機采樣的問題
隨機采樣有一個很大的問題:人們只能從隨機采樣中得出事先設計好的問題的結果,調查得出的數據不可以重新分析以實現計劃之外的目的,而且一旦采樣過程中存在任何偏見,分析結果就會相去甚遠。
? 樣本=總體
采樣的目的就是用最少的數據得到最多的信息,當我們可以獲得海量數據的時候,它就沒有什麼意義了;生活中真正有趣的事情經常藏匿在細節之中,而采樣分析卻無法捕捉到這些細節(因為采樣不能得到計劃之外的東西);大數據建立在掌握所有數據,至少是盡可能多的數據的基礎上,所以我們就可以正確地考察細節並進行新的分析。
●●●
不是精確性,而是混雜性
執迷於精確性是信息缺乏時代和模擬時代的產物,只有5%的數據是結構化且能適用於傳統資料庫的,如果不能接受混亂,剩下的95%的非結構化數據都無法被利用。
? 小數據時代的精確性
在「小數據時代」,人們收集、處理數據的能力有限,對「小數據」而言,最基本、最重要的要求就是減少錯誤,保證質量(收集信息的有限意味著細微錯誤會被放大,甚至有可能影響整個結果的准確性)。人們創造了很多精確的系統,這些系統試圖讓我們接受一個世界睏乏而規整的慘象——假裝世間萬物都是整齊地排列的;事實上現實是紛繁復雜的,天地間存在的事物也遠遠多於系統所設想的。
? 我們要的是概率
我們總是為了一個「答案」而活著,精確性似乎一直是我們生活的支撐,但認為每個問題只有一個答案的想法是站不住腳的。「一個唯一的真理「的存在是不可能的,而且追求這個唯一的真理是對注意力的分散。大數據也許是拯救我們的關鍵方法:大數據通常用概率說話,而不是板著「准確無疑」的面孔。
●●●
不是因果關系,而是相關關系
在大數據時代,我們不必知道現象背後的原因,而是要讓數據自己「發聲」。我們不再一味追求人們為什麼這么做,知道人們為什麼這么做可能是有用的,但這個問題目前並不是很重要,重要的是我們能通過大數據分析出人們的相關行為。
? 相關關系
相關關系的核心是量化兩個數據值之間的數理關系:相關關系強是指當一個數據值增加時,另一個數據值很有可能也會隨之增加;相關關系弱就意味著當一個數據值增加時,另一個數據值幾乎不會發生變化。相關關系通過識別有用的關聯物來幫助我們分析一個現象,而不是通過揭示其內部的運作機制。相關關系沒有絕對,只有可能性。
? 人們的直接目的就是尋找因果關系
人們的直接願望就是了解因果關系,我們已經習慣了信息的匱乏,故此亦習慣了在少量數據的基礎上進行推理思考。以前我們用實驗來證明因果關系,它是通過是否有誘因來分別觀察所產生的結果是不是和真實情況相符。但是,凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果,而這個結果又是由其他原因導致的,以此循環往復,那麼就不存在人的自由意志這一說了——所有的生命軌跡都只是受到因果關系的控制了——這顯然是不正確的。
? 相關關系和因果關系並不矛盾
相關關系分析本身意義重大,同時它也為研究因果關系奠定了基礎,通過找出可能相關的事物,我們可以在此基礎上進行進一步的因果關系分析,如果存在因果關系的話,我們再進一步找出原因。在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道「是什麼」時,我們就會繼續向更深層次研究因果關系,找出背後的「為什麼」。在小數據時代,我們會假象世界是怎麼運作的,然後通過收集和分析數據來驗證這種假象;在大數據時代,我們會在數據的指導下探索世界,不再受限於各種假想;我們的研究始於數據,也因為數據我們發現了以前不曾發現的聯系。
A.大量的數據意味著「理論的終結」:用一系列的因果關系來驗證各種猜測的傳統研究範式已經不實用了,如今它已經被無需理論指導的相關關系研究所取代;
B.現在已經是一個有海量數據的時代,應用數學已經取代了其他的所有學科工具,而且只要數據足夠,就能說明問題,如果你有一拍位元組的數據,只要掌握了這些數據之間的相關關系,一切就迎刃而解了;
C.「理論的終結」:所有的普遍規則都不重要了,重要的是數據分析,它可以揭示一切問題;但大數據並不意味著理論已死,因為大數據就是在理論的基礎上形成的。
●●●
大數據時代的商業變革
在一個可能性和相關性佔主導地位的世界裡,專業性變得不那麼重要了;行業並不會消失,但是他們必須與數據表達的信息進行博弈。
? 數據化:一切皆可量化
大數據的核心發展動力來源於人類測量、記錄和分析世界的渴望。為了得到可量化的信息,我們要知道如何計量;為了數據化量化了的信息,我們要知道怎麼記錄計量的結果。如今我們經常把「數字化」和「數據化」這兩個概念搞混,但是對這兩個概念的區分實際上非常重要:
A.數據化:一種把現象轉變為可製表分析的量化形式的過程;
B.數字化:把模擬數據轉換成0和1表示的二進制碼;
數字化帶來了數據化,但是數字化無法取代數據化;數字化是把模擬數據變成計算機課讀的數據,和數據化有著本質的不同。
? 當方位變成了數據
1978年見證了一個偉大的轉變,當時構成全球定位系統(GPS)的24顆衛星第一次發射成功,通過與技術手段的融合,全球定位系統能夠快速、相對低價地進行地理定位,而且不需要任何專業知識。地理位置信息匯集起來,可能會揭示事情的發展趨勢;位置信息一旦被數據化,新的用途就猶如雨後春筍般涌現出來,而新價值也會隨之不斷催生。
? 當溝通變成數據
社交網路平台不僅給我們提供了尋找和維持朋友、同事關系的場所,也將我們日常生活的無形元素提取出來,再轉化為可作新用途的數據。數據化不僅能將態度和情緒轉變為一種可分析的形式,也可能轉化人類的行為,這些行為難以跟蹤,特別是在廣大的社區和其中的子人群環境中。
A.Facebook將關系數據化——社交關系在過去一直被視作信息而存在,但從未被正式界定為數據,直到Facebook「社交圖譜」的出現;
B.Twitter通過創新,讓人們能輕易記錄以及分享他們零散的想法,從而使情緒數據化得以實現。
? 「取之不盡,用之不竭「的數據創新
盡管數據長期以來一直是有價值的,但通常只是被視作附屬企業經營核心業務的一部分,或者被歸入知識產權或個人信息中相對狹窄的類別,但在大數據時代,所有數據都是有價值的。我們的時代,數據收集不再存在固有的局限性,由於存儲成本的大幅下降,保存數據比丟棄數據更加容易,這使得以較低成本獲得更多數據的可能性比以往任何時候都大。不同於物質性的東西,數據的價值不會隨著它的使用而減少,而是可以不斷地被處理,信息不會像其他物質產品一樣隨著使用而有所損耗。數據的價值並不僅限於特定的用途,它可以為了同一目的而被多次使用,也可用於其他目的。 作者 _Glen_ 本文轉自簡書,轉載需授權
Ⅵ 讀《大數據時代》有感作文
不知從什麼時候開始,"大數據"這個詞悄然成為了我們的常用詞彙;我們也不知從什麼時候開始,邁進了"大數據時代"那麼,大數據時代究竟是一個怎樣的時代?英國"大數據時代的預言家"維克托邁爾·舍恩伯格和肯尼思庫克耶的《大數據時代》對此有著詳細而深刻的洞見。
一、什麼是大數據?
根據《大數據時代》中所說,"大數據是人們在大規模數據的基礎上可以做到的事情,而這些事情在小規模數據的基礎上是無法完成的。大數據是人們獲得新的認知、創造新的價值的泉,大數據還為改變市場、組織機構以及政府與公民關系服務。"、"大數據即一種新型的能力:以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見。"大數據有兩層含義,第一層含義,大數據是一個總結性的概念,是對海量數據的總稱;第二層含義即書本中所指出的,是一種新型的能力與方式。區別於小規模數據時代的抽樣分析,大數據時代,分析的樣本不再需要經過抽樣,直接將全體數據進行更快更准確地分析。
二、大數據的核心是什麼?
大數據的核心應當是減少冗餘,提高資配置效率。根據收集到的數據分析、挖掘出龐大資料庫獨有的價值,以便進行干預或提供相應的資與服務。自古以,人類社會的發展便是資配置不斷優化的過程,大數據作為一種新型的生產工具,它能讓我們通過分析海量的數據,得知該如何更有效地分配稀缺的資。
如醫院通過對某個病人病史、生活習慣、衣食住行、工作娛樂情況等進行全方位分析,便可以准確了解病人的生活情況與生活環境,精確地指出症結引起原因所在,只要建議病人針對引起病的因素做出調整或進行醫學干預,便可以了,避免了對病人過多的用葯與過大范圍的盲目干預。
同樣的道理,如果銀行通過分析某一申請人的家庭情況、消費歷史、生活習慣、財務習慣、網頁瀏覽記錄等各方面的數據,便可以清晰了解此申請人各方面的情況,甚至可推測其內心的真實想法與將要採取的做法,從而判斷申請人的貸款申請資格,決定該不該授信,授信多少等內容,所有的信息在大數據時代,能在系統中搜索一下,幾分鍾便能全部收集完成。相比以前,(fsir)申請人申請後,銀行得派出兩名客戶經理上門進行訪問、調查、收集電信、徵信等多方面的'信息,再進行人工分析、鑒別等過程,耗費的時間多不說,風險也相對更高。
可見,大數據的運用不但提高了工作效率,節省了機構與申請人的時間,更能基於精確的信息,確保風險可控,且保證了授信給該申請人的正確性,將有限的資金用在刀刃上,提高資配置質量。
三、什麼是大數據思維?
書中指出,大數據思維是一種意識,認為公開的數據一旦處理得當就能為千百萬人急需解決的問題提供答案。大數據與三個重大的思維轉變有關:首先,要分析與某事物相關的所有數據,而不再依靠分析少量的樣本;其次,樂於接受數據的紛繁復雜,而不再追求精確度;最後,我們的思維不再探求難以捉摸的因果關系,轉而關注事物的相關關系。
大數據思維應當是一種意識,認識到大數據的無窮威力,並積極擁抱這個繁榮的時代;世界上的一切都是信息,都是可以量化分析的信息。如果將相關的信息進行交互分析,便能獲得"上帝的視覺"——窺視知道分析對象的一切,包括所思所想;獲得的信息可以通過類比,准確推測分析對象的想法以及未行為;根據推測出的內容進行干預或服務,從而獲得商業機會;在一切均有記憶、一切均能收集、能更加准確預測未的時代,我們或許受困於過去的行為;在這個時代,對隱私權、公平與正義的探討上升至一個新的語境。
四、新的時代,我們該怎麼辦?
老子說,無為而治。因此,我們還是該吃飯就吃飯,該逛街就逛街,想吃甜點便吃甜點,過自己的生活,努力自己的工作。大數據是一種意識,更是一種工具,所有的工具最終都是為了讓我們生活得更加方便、更加如意,而作為最高智慧生物的我們,要做的,便是習學如何通過這新的工具,改造世界,創造生活。
當然,西方也有諺語:預測未最好的辦法是創造未。面對新的時代,我們,努力將生活過成自己想要的樣子,便是最好的信條。
Ⅶ 《大數據時代》讀後感怎麼寫
寫作思路:首先解釋大數據時代的意思,然後討論如何利用大數據時代,最後總結大數據時代的利弊。《大數據時代》讀後感正文如下:
首先,想談一談何為大數據,何為大數據時代。大數據是一種資源,也是一種工具。它提供一種新的思維方式去理解當今這個信息化世界。為何說是一種新的思維方式:在信息缺乏的時代或模擬時代,我們更傾向於精確性的思維方式,就像是「釘是釘,鉚是鉚」,而在這種傳統的思維方式下,我們得到問題的答案只有一個。
而在大數據時代下,我們打破了這種思維方式,換句話說,我們接受結果的不確定性。簡言概括之,我認為大數據是一種預測模型。在大數據時代下,我們關注的不是因果,即為什麼是這樣,而更關心「是什麼」這種相關關系。換句話說,在這種新思維的思考方式下,我們探究問題背後的原因也是不可行的。我們所做的是利用大數據這種工具,讓數據自己說話!
其次,我想談下如何利用大數據提升我軍戰鬥力。當然,大數據分析並不是精準的預測,精準的預測也是不存在的。大數據只能有利於我們理解現在和預測未來的可能性。
作為軍人,我所關注的是如何利用好大數據的工具提升我軍戰鬥力,打贏這場信息化戰爭。毫無疑問,現在我們打的不是刀對刀,槍對槍的戰爭,更不是模擬時代,當代乃是數字時代,打的是信息化戰爭!
四次戰爭的大勝,美軍的戰爭形態從機械化轉向信息化,而且相應的在戰場取勝的時間也越來越短,這正是大數據時代下的必然結果。而我軍正在轉向信息化的過程中。在此戰爭形態的過程中,我們需要更多的計算分析師,大數據分析師,數學家等高等技術型人才來打贏這場信息化戰爭。這正是大數據時代下我們不得不有的基礎。我軍戰鬥力的提升迫在眉睫!
當然大數據是一把雙刃劍,利用好了取勝也是得心應手,相反,利用不好會導致不可估量的損失。
畢竟,這只是一種預測模型,得不到精準的預測結果。我們更要讓數據為我們所用,不要被龐大的資料庫框住我們的思維。為適應時代的發展,在這個適者生存,弱肉強食的世界,大數據時代下的殘酷競爭已經給我們敲響警鍾,一場悄無聲息的信息化戰爭已經打響!