㈠ 大數據時代讀後感1000字(2)
大數據時代讀後感1000字(精選7篇)
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出」不是因果關系,而是相關關系。「這一論斷時,他在書中還說道:」在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道『是什麼』時,我們就會繼續向更深層次研究的因果關系,找出背後的『為什麼』。「[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可」量化「,大數據的定量分析有力地回答」是什麼「這一問題,但仍然無法完全回答」為什麼「。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節」掌控「中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:」大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。「謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。這個命題是我讀這本書最大的感觸。個人認為也是這本書最核心的思想。從頭說起吧,首先,書提出一個顛覆我以前認知的命題--」並非原子而是信息才是一切的本源「,將世界看做信息,看做可以理解的數據的海洋,為我們提供了一個從未有過的審視下是的視角。它是一種可以滲透到所有生活領域的世界觀。這個命題是在書的最後一部分中的某一段中描寫的。我之所以把它放在最前面來講,因為我覺得,這是談數據化世界的前提,自然也是談論大數據的前提啦。書的中間部分有一節講到數據化和數字化的區別。經過我自己腦子的整理,把數據化世界這個命題列為大數據思維的第二步。寫到這里,我不由得反省下,我是不是有領悟到書的精髓所在(我認為的精髓),就是第一句話。因為回顧我整個思路,還是按照舊模式的因果關系思考模式思考問題。書中另一個吸引我的地方就是,有很多觀點的論述,會從哲學的高度論述。雖然,自己肚子沒多少墨水,但是讀這些描述的時候,就會發現自己會更好的理解作者提出的命題。比如書中有一段文字
當我們說人類是通過因果關系了解世界時,我們指的是我們再理解和解釋世界各種現象時使用的兩種基本方法:一種是通過快速、虛幻的因果關系,還有一種就是通過緩慢、有條不紊的因果關系。大數據會改變這兩種基本方法在我們認識世界時所扮演的角色。
在附上一些事例的時候,用作者提供的」本質「去看待時,很容易理解,確實是這么回事。好了,那麼大數據到底改變了我們什麼呢,作者給出3點,
大數據的精髓在於我們分析信息時的三個轉變,這些轉變講改變我們理解和組建社會的方法。
第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(樣本=總體)
第二個轉變就是,研究數據如此之多,以至於我們不再熱衷於追求精確度
第三個轉變因前兩個轉變而促成,即我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。大數據告訴我們」是什麼「而不是」為什麼「。在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。,出處:短美文,否則追究其責任,謝謝你的支持,我們會給做得更好!
正如大家所知道的那樣,人類的大腦具備這樣的功能,它會把新輸入的刺激或信息與」過去的經驗或積累的部分知識「相對照,然後進行調整並接受下來。如果眼前新的現實與大腦中儲存的固有信息無法協調,便會在無意識中拒絕接受新的現實(當作沒有看見);或者通過自己一知半解的知識任意推測,使自己認識到的情況偏離實際(產生錯覺)。這是人的一種本能,目的在於使自己保持冷靜。
所以作者稱之為revolution。
講了這么多,那麼大數據到底給我們帶來什麼。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當然,書中提了很多,最多的就是,XXX公司或者個人利用大數據創造了多大的財富了,拋開這些表面的不說,最讓我動心亦或者是害怕的是,預測。這是大數據帶來最核心的東西,動心的理由無須贅述,計算機會告訴你什麼時候買什麼雙色球可以中頭獎,想想心裡是不是有一點小激動咧。當然這只是我打的一個比較誇張的比喻。至於害怕呢,書中有段話我很喜歡
公平正義的基礎是人只有做了某事才需要對它負責,畢竟,想做而未做不是犯罪,社會關系於個人責任的基本信條是,人為其選擇的行為承擔責任。如果大數據分析完全准確,那麼我們的未來會被精準的預測,因此在未來,我們不僅會失去選擇的權利,而且會按照預測去行動。如果精準的預測成為現實的話,我們也就失去了自由意志,失去了自由選擇的權利。既然我們別無選擇,那麼我們也就不需要承擔責任。這不是很諷刺嗎。
扯到這里,順便扯一下,書中另一段關於自由意志的描述
在哲學界,關於因果關系是否存在的爭論已經持續了幾個世紀。畢竟,如果凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果。而這個結果又是由其他原因導致的。以此循環往復,那麼就不存在人的自由意志這一說了。——所有的生命軌跡都只是受因果關系的控制了。因此,對於因果關系在世間所扮演的角色,哲學家們爭論不休,有時他們認為,這是與自由意志相對立。
書中舉了個例子,舉了部電影《少數派報告》,當我看到這里的時候,」哎喲,我居然看過這部電影,想想心裡還是有點小激動「,有興趣的可以去看下,大概就是講警察通過預測來提前抓捕犯人,不過不是通過大數據,是通過超人類的方式。當你什麼舉動都可以被預測,相當於你完全暴露在太陽光下,換成你,你害怕不。
最後,附上兩段結語,一段是書中的一段話,另一段是我自己瞎編的。
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。
大數據終將會影響到我們,也像其他技術一樣會是一把雙刃劍,用得好,動心,濫用,害怕。如同核技術一樣,用的話,造福地球,濫用,給個金剛石地球你,照樣爆。我相信,未來的大數據的發展會如作者所說的,是一場生活、工作與思維的革命。
「大數據」一詞不知何時在我們的生活悄然出現,為了一探究竟,我便選擇了《大數據時代》一書。
作者先從全局簡單地描述大數據對我們的生活、工作與思維的影響,再從三方面具體地用上百個學術和商業的實例展開寫作。樣本=總體、追求精確性和相關關系等大數據時代具體特點一一現出。在同時,作者也從個人、企業等多角度分析大數據中的隱憂。
書中內容繁多,在此不能各方面概括。此書中雖有許多專有名詞,但作者以其通俗的語言以及許多實例讓我嗅到大數據時代中一抹清新之氣。
為什麼是清新的呢?因為書中的內容彷彿向我打開了一個既有點熟悉又有點陌生的世界。我們現在已處於網路時代 ,在我們日常簡單的操作中大量數據產生,然而起初我們僅用眾多技術在解決手頭上的問題,那些大數據像沙子中的金子,價值不被發現。到目前,每當我們網上購書時總會看到「猜你喜歡」的欄目、出現谷歌搜索與流感預測、Farecast與飛機票價預測系統等,這些事情的達成全來自於那些曾被忽略的大數據同時也在證明「預測,大數據的核心」這句話,為我們的生活創造了前所未有的可量化的維度。看到書中這部分內容時,我不禁感受到自己的生活已在享大數據帶來的福利,就像「猜你喜歡」欄目讓我觸到更多合我口味的書,讓我看到了以前無法發現的細節。擁有大量數據的公司巨頭如谷歌、亞馬遜大力開發有關大數據的新型產業和研究相關項目。借網路時代的便利大數據成為了如今最有商業價值的事物,使一切可量化的趨勢也開始出現。「本質上世界是由信息構成的」,面對這句話時,大數據時代彷彿就在眼前。
在感受驚嘆著大數據能為我們做到以往無法想像的事和它巨大的價值時,我認同大數據能極大優化我們的生活,但又不禁為這時代感到擔憂。一旦大數據時代來臨,不僅我們的隱私可能不再是隱私,就如書中所言「我們時刻暴露在『第三隻眼』下:亞馬遜監視著我們的購物習慣,谷歌監視著我們的購物習慣,而微博似乎什麼都知道」,而且利用大數據我們可以預測許多事情並且十分高效,一旦人們依賴大數據極少運用人類自身的創新等能力被數據束縛住,世界只會淪落為一個極少活力的機械環境。而我認為最大的憂患,是大數據時代對人類自身思維、思想、信仰等精神領域的沖擊。如今我們都生活在數據中,大數據時代說不定在幾年後就會逐步來臨,這使我不禁發問:我們一直堅信著信仰著的究竟是什麼?我覺得世界說變就變實在令我想不通這個問題。事情都有好壞,我也不知道自己是否杞人憂天。
於是我繼續去探索作者對這問題的思考。「更大的數據在於人本身」,作者還說「我們是在創造更好的未來」,也說「在一個預測的時代里,人類的自由意志不可侵犯,這一點不可輕視。我們在使用大數據時,應當懷有謙恭之心,銘記人性之本」。人類學家克利福德吉爾茲曾說:「努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來。」這些話語彷彿是陽光,驅散我心中對大數據時代的擔憂以及內心對其的恐懼。我認為,在堅守我們內心和自由意志下,大數據才會造福我們人類世界,發揮出它背後對人溫暖的光芒。
面對時代的變革,我會為堅守內心深處的自由意志而努力並「擁抱大數據」。
世界的本質就是數據,當你掌握了數據,你便掌控了世界—你可以輕而易舉地通過數據中的相關關系預測事物的發展,將一切不利因素扼殺於搖籃之中—這遠勝於"防患於未然"。
《大數據時代》一書,讓我們在觀念上有了三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。全書介紹了 "大數據"時代三種大的變革:思維變革,商業變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現代社會的運作方式必將有重大的改變,若不順應這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗爭一樣,不可避免被掠奪,被落於世界進程之後,所以我們必須轉變我們的思想。
"我們不再熱衷於尋找因果關系,而應該尋找事物間的相關關系",我想這句話是本書的核心思想。大數據時代,信息與數據已成為了一切的本源,我們生活在各種數據構成的海洋之中,如果從另一種視角看,就好像無數條"看不見的線"將我們與這些數據聯繫到一起,這是我們以前從未有過、從未想過的。大數據改變了我們以前的通過因果關系了解世界的方法,而提供了幾種新的途徑,因為,在大數據時代,我們可以分析更多數據,有時甚至可以處理和某個特別現象相關的所有數據,也就是:樣本=總體;而且,當研究數據如此之多時,我們已不熱衷於"精確",而是"混亂",若不接受"混亂",那麼有95%的非結構化數據無法利用,這將無法使我們構建完整的數據世界,在分析更多、更全面的數據之後,我們就可以從這些數據之中發掘它們的相關關系,即以"是什麼"而不是"為什麼"的角度看待數據,不用管其從何而來,只要分析其如何影響其他事物既可,即"讓數據自己發聲",這些,徹底推翻了人類以前探索數據的方法,展現了一個全新的世界。
這種觀念以驚人的力量給現知識狀況帶來了巨大的沖擊,通過對海量數據的分析,獲得巨大價值的產品和服務,或深刻的洞見。比如谷歌公司,2009年h1n1流行之時,通過檢測檢索詞條,處理34。5億個不同的數據模型,通過預測並與2007、2008年的美國疾控中心記錄的實際流感病例進行對比後,確定了45條檢索詞條組合,並將其用於一個特定的數學模型後,預測結果與官方數據相關系數高達97%,這種大數據技術,以前所未有的方式,通過海量數據分析得出流感所傳播的范圍,為預測流感提供了一種更快速、高效的工具。
同時,雖然大數據可為人類造福、對抗病症,但這僅限於掌握這門技術而言,若不重視這種技術,當我們的對手早於我們一步構建這種數據網路之時,便是我們的災難,想想,大數據雖核心的在於預測,當敵人通過這種手段預測我方下一步的行動,將是可怕的—比如你的.導彈將從何處發射,將飛往哪,你的軍隊動向、目標,總之所有一切"未來"將掌控於敵手,敵方甚至可以藉此發現那些將來有"大作為"的人,從而進行滲透或扼殺,這對我們的發展無疑是致命的,所以,盡快加速大數據系統的構建進程是必須的。
對於我們國防生,也必須順應這種發展趨勢,未來的時代必將是數據極易獲取,數據網路共享化的時代,通過這些數據,建立數據模型,可以准確分析並給出適合每一個人的計劃,如運動量、訓練強度,可以"先知、先覺",及時發現一個人的負面情緒前及時疏導,這些必將成為現實,我們必須跟進時代,做好准備,去應對大數據時代的一切!
「除了上帝,任何人都必須用數據來說話。」——這是《大數據》中出現的讓人印象深刻的一句話,也是全書力圖傳遞的信息。在數字信息時代,數據和空氣一樣遍布生活,對於有些人來說,數據無意義,而對於有些人來說,數據,即真相。
美國是《大數據》的主角,全書通過講述美國半個多世紀信息開放、技術創新的歷史,公共財政透明的曲折、《數據質量法》背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智能的前世今生、數據開放運動的全球興起,Web3·0與下一代互聯網的未來圖景等等,為讀者一一細解數據創新給公民、政府、社會帶來的種種挑戰和變革。
透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動著政府信息的透明與公開。
讀完此書,對生活中的數據及數據處理突然有了很大的興趣。如果有一天,處處以數據說話,那麼,政治、制度、生活將更加清明,事故、將降到最低點。
作為信息技術教師,是有必要閱讀此書的!有慧根的教師將能從書中挖掘出信息技術特有的文化以及能用於教學的鮮活案例。
每天能用來閱讀的時間很少,總是要等到夜深疲倦時才有空打開書本,總是在眼睛極不舒服的情況下堅持閱讀,《大數據》就這樣在堅持中溶入我的思想……
讀完《大數據》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國數據開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。
我在想,大數據概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。在教學過程中,學生的行為表現都可以被數據化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的數據化來得實在,來的有意義。長期以來,我們並不了解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大數據概念至少提出了關注「是什麼」比「為什麼」要有實際意義得多。而我們的教育恰好需要把注意力從「為什麼」轉移到「是什麼」上面來,只有如此,才能把教育從為什麼發展成「可能成為什麼」上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到數據化上面,這才是它的出路。
如何將數據融入教學,教育者首先通過標准化全科教學處方,實現了教師授課模板和教學內容的標准化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的數據,處理好數據,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。
與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大數據時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,數據如何復雜,我們都不能不去改變自己的教學去迎合將來的這個大數據時代。
舍恩伯格的《大數據時代》,讓我重新審視了"大數據"這個在信息時代異軍突起的熱點詞彙,作為信息安全專業的我,對大數據這個詞本身有著更多的熱忱。
在網路上搜索到的解釋是:"大數據",或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。特點:數量、速度、品種、真實性。
而舍恩伯格認為,大數據並不能定義一個確切的概念。他提到"大數據是人們獲得新的認知,創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
本書中,主要從三個方面論述,即思維變革、商業變革和管理變革。而舍恩伯格更是著重闡明三大觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對於觀點一,我不敢苟同,畢竟大數據的實現需要一定的技術支持,而顯然,現在這種技術還不夠成熟,同時一些簡單的事情運用大數據反倒是問題更加復雜化,因此這種大叔據的繁雜處理方式更適用於一些特定的情況,比如商業預測,人類dna的研究等。
而對第二種觀點,我是十分贊同舍恩伯格所說的"大數據的簡單演算法比小數據的簡單演算法有效"。在計算機行業迅速發展中,一種新的簡單可行的演算法的出現,遠沒有計算機在運算速度和存儲容量的發展快,而大數據演算法似乎更能迎合這種大趨勢。
觀點三中提到的相關關系在大數據中可是重量級的,它能較快找到事物規律和對應的解決措施,當然,也不能完全忽視因果關系,畢竟人們在思維上更能夠接受因果關系分析出的結果,而大數據預測的需要人們慢慢的適應才能接受。當我們完成相關關系的分析而又不滿足於只知道"是什麼"的時候,我們就可以轉而研究"為什麼"了,畢竟問題的根本在於因果。而舍恩伯格的全體數據和相關關系是大數據時代下的一種捷徑。
但是在信息時代,信息安全問題的日趨凸顯,數據獨裁與隱私保護之間的矛盾更是立於風口浪尖,成為眾矢之的,舍恩伯格在本書的最後章節曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數據並不是一個充斥著演算法的和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數據時代同樣的重要,數據是為人類服務的,也就該人類驅使下完成相應的目的。
在這樣的大環境下,常引起我更多的思考和擔憂。
大數據時代對於我們同是機遇與挑戰,一些國家已開始步入大數據時代的行列,並在各個領域開始研究和使用。而對於我國龐大的人口,以及較大的領土面積,都可以在大數據時代為我們提供數據的保障,而能否面臨挑戰,在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術等方面的問題,更應在政策上逐步開放各領域的數據,保證數據來源、許可權等問題得到解決,不斷學習先進的計算機技術,縮小與其他國家的差距。
工業化、信息化,我們都向世界交出了一份讓世界不能小覷的答案;
大數據時代的數據化我們又將怎樣在新的風暴中所向披靡,如果大數據時代是一種必然趨勢,那這就是我們這一代人的責任,是我們新的戰場!
;㈡ 大數據面試題及答案誰能分享一下
大數據時代才剛剛開始。隨著越來越多的公司傾向於大數據運營,人才需求達到歷史最高水平。這對你意味著什麼?如果您想在任何大數據崗位上工作,它只能轉化為更好的機會。您可以選擇成為數據分析師,數據科學家,資料庫管理員,大數據工程師,Hadoop大數據工程師等。在本文中,慧都網將介紹與大數據相關的前10大數據面試問題。
以下是最重要的大數據面試問題以及具體問題的詳細解答。對於更廣泛的問題,答案取決於您的經驗,我們將分享一些如何回答它們的提示。
無論何時進行大數據采訪,采訪者都可能會詢問一些基本問題。無論您是大數據領域的新手還是經驗豐富,都需要基礎知識。因此,讓我們來介紹一些常見的基本大數據面試問題以及破解大數據面試的答案。
1.您對「大數據」一詞有何了解?
答:大數據是與復雜和大型數據集相關的術語。關系資料庫無法處理大數據,這就是使用特殊工具和方法對大量數據執行操作的原因。大數據使公司能夠更好地了解其業務,並幫助他們從定期收集的非結構化和原始數據中獲取有意義的信息。大數據還允許公司採取數據支持的更好的業務決策。
2.大數據的五個V是什麼?
答:大數據的五個V如下:
Volume -Volume表示體積大,即以高速率增長的數據量,即以PB為單位的數據量
Velocity -Velocity是數據增長的速度。社交媒體在數據增長速度方面發揮著重要作用。
Variety -Variety是指不同的數據類型,即各種數據格式,如文本,音頻,視頻等。
Veracity -Veracity是指可用數據的不確定性。由於大量數據帶來不完整性和不一致性,因此產生了准確性。
Value -價值是指將數據轉化為價值。通過將訪問的大數據轉換為價值,企業可以創造收入。
YARN的兩個主要組成部分:
ResourceManager-該組件接收處理請求,並根據處理需要相應地分配給各個NodeManager。
NodeManager-它在每個單個數據節點上執行任務
7.為什麼Hadoop可用於大數據分析?
答:由於數據分析已成為業務的關鍵參數之一,因此,企業正在處理大量結構化,非結構化和半結構化數據。在Hadoop主要支持其功能的情況下,分析非結構化數據非常困難
存儲
處理
數據採集
此外,Hadoop是開源的,可在商用硬體上運行。因此,它是企業的成本效益解決方案。
8.什麼是fsck?
答:fsck代表文件系統檢查。它是HDFS使用的命令。此命令用於檢查不一致性以及文件中是否存在任何問題。例如,如果文件有任何丟失的塊,則通過此命令通知HDFS。
9. NAS(網路附加存儲)和HDFS之間的主要區別是什麼?
答:NAS(網路附加存儲)和HDFS之間的主要區別 -
HDFS在一組計算機上運行,而NAS在單個計算機上運行。因此,數據冗餘是HDFS中的常見問題。相反,復制協議在NAS的情況下是不同的。因此,數據冗餘的可能性要小得多。
在HDFS的情況下,數據作為數據塊存儲在本地驅動器中。在NAS的情況下,它存儲在專用硬體中。
10.格式化NameNode的命令是什麼?
答:$ hdfs namenode -format。
歡迎咨詢慧都在線客服,我們將幫您轉接大數據專家團隊,並發送相關資料給您!
以上就是大數據面試題及答案,希望我的回答對您有幫助!
㈢ 根據塗子沛先生所講,以下說法正確的有哪些
根據塗子沛先生所講,以下說法正確的有哪些?
A.大數據就等於非結構化數據
B.大數據等於大容量加上大價值
C.大數據等於非結構化數據加上結構化數據
D.大數據等於小數據加上大信息
答案: ABCD
㈣ 《大數據時代》:別把參考答案當做最終答案
因為周邊總是充斥著「大數據」、「雲計算」的字眼,望著說著術語的人們眼裡野心勃勃的光芒,我不禁有些急躁的想弄明白什麼是大數據,到底我們可以從大數據里挖掘到什麼樣的財富。不得不說,我選了一本好書,全篇脈絡分明,邏輯縝密,穿插著數量繁復的案例,讓人在興致盎然之際就能通俗理解。
第一部分 大數據時代的思維變革
大數據時代的來臨,最先要顛覆的是我們的思維模式:1、不是隨機樣本,而是全體數據;2、不是精確性,而是混雜性;3、不是因果關系,而是相關關系。
坦率的說,這個部分給我的感悟很深,相信很多工作涉及到做數據報告的人,都會從中獲益不少。淺顯的說,大數據時代是讓我們把思維聚焦引向發散的變革。傳統意義上,甚至人們日常生活的慣性里,都本能的需求一種因果關系。例如發生了一件事情,人們會立刻尋找一個簡單的原因去說服自己。也就是「因為……所以……」這種邏輯思維是根深蒂固的。
在大數據時代,在擁有幾乎完整的數據時,我們不再刻意追求數據中彼此之間的目的性,從相關性出發,我們無法說清楚為什麼,但我們總知道就是這樣。相關性的概念將會引申更多的創意思維,相信未來的工種也會因此更加細分,甚至會出現更多的新興行業。
第二部分 大數據時代的商業變革
這是每個人都深有體會的:1、一切皆可量化;2、取之不盡,用之不竭的數據創新;3、數據、技術與思維的三足鼎立。
全書最核心或者說我本人最想了解的答案就在這里了。搜索引擎,導航工具,微博,微信記錄著我們一切的行為記錄,我們的情緒起伏都能被量化。這對商界是筆巨大的財富,他們可以根據這些數據定製獨一無二的消費計劃,也可以從中的相關關系中避免許多不必要的損失。
於是數據時代的價值鏈誕生:
1、基於數據本身的公司。 這類公司擁有大量的數據或者可以收集到大量數據。他們以出售數據盈利。當然大數據時代的後期,他們也開始逐漸轉型,收購分析團隊,將數據更大限度的價值化,以獲取更高的盈利。
2、基於技能的公司。 咨詢公司就是此類公司的典型代表,天睿,尼爾森這些都是數據分析的佼佼者,甚至四大現在也在積極開拓咨詢業務。
3、基於思維的公司。 創新思維應該屬於大數據時代最寶貴的財富。FlightCaster、Facebook、滴滴等等這些都是創新思維的典範。
我們要想從大數據時代挖掘金礦也可以順著這條價值鏈下手。本人更傾向於第三種思維的風暴。有趣的是,這類公司的發起人甚至這些被我們趨之若鶩的應用都是創始人無聊逗樂的作品。顯然,熱愛生活,為生活提供更多便利和快樂,彷彿都是創新思維創造需求所必須的。
第三部分 大數據時代的管理變革
風險: 除開我們平常喜歡網購,消費習慣被搜索引擎記錄在外,導航系統記錄著我們的行動軌跡,甚至是我們的心情,通過微信朋友圈和微博,也都一一被監控中。我們彷彿生活在一雙看不見的眼睛裡,想想都覺得不寒而慄。
更可怕的是,當人們過於依賴大數據去做決策的時候,我們的社會終將有一天會演變為預測行為更替事實行為的悲劇。最簡單的例子:警察可能從大數據監控的一系列行為中分析得到結論某人會謀殺他的妻子,而這個人也許什麼都沒做,而警察卻名正言順的將此人逮捕。因為大數據預測分析他一定會做,而警察的行為只是阻止了的悲劇的發生。完全磨滅了他可能真的不會犯罪的可能性。
掌控: 讓數據的使用者承擔責任,是相對保護個人隱私的有效方式。避免了個人信息數據被過度曝光,又給與了數據分析者極大的開發使用空間。另外大數據時代更要避免數據獨裁時代。谷歌曾要求員工測試41種藍色的陰影效果中,哪種被人們使用最頻繁,從而決定網頁工具欄的顏色。這種數據獨裁曾在谷歌一度到達頂峰,同時也激起了強烈反抗。
數據的盲目崇拜總讓人會遺忘數據總有固有的局限性,數據導向的答案是參考答案不是最終答案。不為數據而數據,才是大數據時代最好的態度,才能將大數據的功能最大化。
㈤ 大數據時代聊聊小數據閱讀答案什麼是小數據
小的數據其實是一些抄更襲基礎的東西,比如了解你的客戶最終傾向,會購買什麼樣的產品,或者在你的銷售中是否存在更高效、高能的模式。
一些現存的小數據可以利用,比如網站的網路統計信息---它會告訴你,你的網站在什麼時間段流覽的人數最多,又有哪個頁面被瀏覽的次數最多,因為哪幾個關鍵詞,而被搜索到。這些數據很容易讓一家公司推測出哪些因素影響著網站的推廣,然後根據這些數據制訂更有針對性的傳播內容。(摘自:中國客戶關系網)
㈥ 《大數據時代》的讀後感
當認真看完一本名著後,大家心中一定有很多感想,為此需要認真地寫一寫讀後感了。你想知道讀後感怎麼寫嗎?下面是我收集整理的《大數據時代》的讀後感範文(通用5篇),僅供參考,大家一起來看看吧。
對於暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鍾情於務虛的觀點。新奇的產品於我無緣,習慣使用成熟的科技產品。既不清高,也非冷漠,就是要與現實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由於工作的原因,耳濡目染,「大數據」這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網購《大數據時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對於個人隱私保護、公共安全提出的挑戰。其次,文中的事例貼近現實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業術語,沒有假裝一副專業的面孔。縱觀全書,遣詞造句,均通俗易懂。
作者認為大數據時代具有三個顯著特點。
一、人們研究與分析某個現象時,將使用全部數據而非抽樣數據。
二、在大數據時代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。
三、了解數據之間的相關性,勝於對因果關系的探索。「是什麼」比「為什麼」重要。
作者指出,隨著技術的發展,數據的存儲與處理成本顯著降低,人們現在有能力從支離破碎的、看似毫不相乾的數據礦渣中抽煉出真知爍見。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯網公司(阿里巴巴、淘寶網)。二是擁有數據分析與處理技術的專業公司,如亞馬遜、谷歌。三是擁有創新思維的公司,他們可能既不掌握大數據,也沒有專業技術,但卻擅長使用大數據,從大數據中找到自己的理想天地。
面對即將來臨的大數據時代,個人將如何應對自如?這是個嚴肅的問題。
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的.預言家「的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。
在第一部分」大數據時代的思維變革「中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。
一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?
我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。」大數據的簡單演算法比小數據的復雜演算法更有效。「更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。」不是因果關系,而是相關關系。「不需要知道」為什麼「,只需要知道」是什麼「。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出」不是因果關系,而是相關關系。「這一論斷時,他在書中還說道:」在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道『是什麼』時,我們就會繼續向更深層次研究的因果關系,找出背後的『為什麼』。「由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可」量化「,大數據的定量分析有力地回答」是什麼「這一問題,但仍然無法完全回答」為什麼「。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。
在風險社會中信息安全問題日趨凸顯。如何擺脫大數據的困境?舍恩伯格在最後一節」掌控「中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:」大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考的答案,幫助是暫時的,而更好的方法和答案還在不久的未來。「謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考的.答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
讀完《大數據時代》這本書後,我意識到:我們即將或正在迎接由書面到電子的跳躍之後的又一重大變革。
這本書介紹了大數據時代來臨後,接踵而至的三項變革——商業變革、管理變革和思維變革。
其實,這場變革已經打響。商業領域由於大數據時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢。現在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
大家應該都知道2009年出現的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數據統計,而病人一般都是難以忍受病痛的折磨才會去醫院就診,因此也導致了信息的滯後。然而,對於飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發的地點,這便是基於龐大的數據資源,可見大數據時代對公共衛生也產生了重大的影響!
在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是台風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。於是,商家作了大膽的推測,出現這樣的結果源於兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬於世界頭號零售商的大數據頭腦!
大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪裡是自己的家,哪裡是工作單位。我們的隱私就這樣被不為人知地收集著。
大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好准備,迎接新時代的到來!
首先,想談一談何為大數據,何為大數據時代。大數據是一種資源,也是一種工具。它提供一種新的思維方式去理解當今這個信息化世界。為何說是一種新的思維方式:在信息缺乏的時代或模擬時代,我們更傾向於精確性的思維方式,就像是」釘是釘,鉚是鉚」,而在這種傳統的思維方式下,我們得到問題的答案只有一個。
而在大數據時代下,我們打破了這種思維方式,換句話說,我們接受結果的不確定性。簡言概括之,我認為大數據是一種預測模型。在大數據時代下,我們關注的不是因果,即為什麼是這樣,而更關心」是什麼」這種相關關系。換句話說,在這種新思維的思考方式下,我們探究問題背後的原因也是不可行的。我們所做的是利用大數據這種工具,讓數據自己說話!
其次,我想談下如何利用大數據提升我軍戰鬥力。當然,大數據分析並不是精準的預測,精準的預測也是不存在的。大數據只能有利於我們理解現在和預測未來的可能性。
作為軍人,我所關注的是如何利用好大數據的工具提升我軍戰鬥力,打贏這場信息化戰爭。毫無疑問,現在我們打的不是刀對刀,槍對槍的戰爭,更不是模擬時代,當代乃是數字時代,打的是信息化戰爭!
四次戰爭的大勝,美軍的戰爭形態從機械化轉向信息化,而且相應的在戰場取勝的時間也越來越短,這正是大數據時代下的必然結果。而我軍正在轉向信息化的過程中。在此戰爭形態的過程中,我們需要更多的計算分析師,大數據分析師,數學家等高等技術性人才來打贏這場信息化戰爭。這正是大數據時代下我們不得不有的基礎。我軍戰鬥力的提升迫在眉睫!
當然大數據是一把雙刃劍,利用好了取勝也是得心應手,相反,利用不好會導致不可估量的損失。
畢竟,這只是一種預測模型,得不到精準的預測結果。我們更要讓數據為我們所用,不要被龐大的資料庫框住我們的思維。為適應時代的發展,在這個適者生存,弱肉強食的世界,大數據時代下的殘酷競爭已經給我們敲響警鍾,一場悄無聲息的信息化戰爭已經打響!
去年的「雲計算」炒得熱火朝天的,今年的「大數據」又突襲而來。彷彿一夜間,各廠商都紛紛改旗換幟,推起「大數據」來了。於是乎,各企業的CIO也將熱度紛紛轉向關注「大數據」來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現實中小企業雲計算,大數據的現狀。
不過話又還得說回來,《大數據時代》是本好書。
當然,很多IT知名人士也大力推薦,寫了好多讀後感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現在也比較火熱的BI,覺得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘。看過此書後,感覺到之前的想法,只能算是中了一小半吧---巨量的數據,而另一前:著眼於數據關聯性,而非數據精確性,或許才是大數據與現時BI的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數據的關聯性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現在的數據分析方法來論,更多的傾向於數據的精確性。
看完此書,我心中的一些問題:
1、什麼是大數據?
查了查網路,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity這個好像是IBM的定義吧。
以個人的觀點來看:數據海量,存儲海量都是大數據的基本原型吧。
2、大數據適合什麼樣的企業?
誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關聯性,才可以讓通過專業化的處理,讓其為企業產生價值。針對電信運營,互聯網應用這樣海量用戶的數據的大企業,也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業呢?銷售訂單數據?若非百年老店,估計數據也是少得可憐,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行為分析為最多。
同樣,在公共事業類的政府機構,大數據的作用也許也能很好的發揮。反而感覺在大多數中小型企業應用大數據,似乎有點大題小作。書中說:大數據是企業競爭力。誠然,數據是一個企業的核心無形資源(利用得好的話),但是否所有的數據,或都換則方式說:所有的企業都以大數據為競爭力,是否真的合適么?是否在中小企業中,會顯示得小題大做呢?
3、大數據帶來的影響
當一波又一波的IT技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好准備,你都要開始迎接它所給你帶來的影響了。經過物聯網,雲計算的推波助瀾下,大數據開始登場了。但它到底給我們帶來了什麼呢?
1)預測未來書中以Google成功預測了未來可能發生流感的案例來開篇,表明通過大數據的應用,可以為我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。
2)變革商業大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業機遇與商業模式,數據的潛在價值會源源不斷地發揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業鏈產生。影響的,當然是IT公司
3)變革思維書中所說:因為有海量的數據作基礎,未來,我們可能更關注數據的相關,而非精細度。對這條,本人還是持保留意見的。
㈦ 大數據時代讀後感
《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為“大數據商業應用第一人”,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究。以下是這本書的讀後感範文,歡迎閱讀!
大數據時代讀後感(一)
我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。這個命題是我讀這本書最大的感觸。個人認為也是這本書最核心的思想。從頭說起吧,首先,書提出一個顛覆我以前認知的命題--”並非原子而是信息才是一切的本源“,將世界看做信息,看做可以理解的數據的海洋,為我們提供了一個從未有過的審視下是的視角。它是一種可以滲透到所有生活領域的世界觀。這個命題是在書的最後一部分中的某一段中描寫的。我之所以把它放在最前面來講,因為我覺得,這是談數據化世界的前提,自然也是談論大數據的前提啦。書的中間部分有一節講到數據化和數字化的區別。經過我自己腦子的整理,把數據化世界這個命題列為大數據思維的第二步。寫到這里,我不由得反省下,我是不是有領悟到書的精髓所在(我認為的精髓),就是第一句話。因為回顧我整個思路,還是按照舊模式的因果關系思考模式思考問題。書中另一個吸引我的地方就是,有很多觀點的論述,會從哲學的高度論述。雖然,自己肚子沒多少墨水,但是讀這些描述的時候,就會發現自己會更好的理解作者提出的命題。比如書中有一段文字
當我們說人類是通過因果關系了解世界時,我們指的是我們再理解和解釋世界各種現象時使用的兩種基本方法:一種是通過快速、虛幻的因果關系,還有一種就是通過緩慢、有條不紊的因果關系。大數據會改變這兩種基本方法在我們認識世界時所扮演的角色。
在附上一些事例的時候,用作者提供的”本質“去看待時,很容易理解,確實是這么回事。好了,那麼大數據到底改變了我們什麼呢,作者給出3點,
大數據的精髓在於我們分析信息時的三個轉變,這些轉變講改變我們理解和組建社會的方法。
第一個轉變就是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機采樣(樣本=總體)
第二個轉變就是,研究數據如此之多,以至於我們不再熱衷於追求精確度
第三個轉變因前兩個轉變而促成,即我們不再熱衷於尋找因果關系,而應該尋找事物之間的相關關系。大數據告訴我們”是什麼“而不是”為什麼“。在大數據時代,我們不必知道現象背後的原因,我們只要讓數據自己發聲。
正如大家所知道的那樣,人類的大腦具備這樣的功能,它會把新輸入的刺激或信息與”過去的經驗或積累的部分知識“相對照,然後進行調整並接受下來。如果眼前新的現實與大腦中儲存的固有信息無法協調,便會在無意識中拒絕接受新的現實(當作沒有看見);或者通過自己一知半解的知識任意推測,使自己認識到的情況偏離實際(產生錯覺)。這是人的一種本能,目的在於使自己保持冷靜。
所以作者稱之為revolution。
講了這么多,那麼大數據到底給我們帶來什麼。在這里,我只想談我感觸最深的,其他的有興趣的可以自己去了解。當然,書中提了很多,最多的就是,XXX公司或者個人利用大數據創造了多大的財富了,拋開這些表面的不說,最讓我動心亦或者是害怕的是---預測。這是大數據帶來最核心的東西,動心的理由無須贅述,計算機會告訴你什麼時候買什麼雙色球可以中頭獎,想想心裡是不是有一點小激動咧。當然這只是我打的一個比較誇張的比喻。至於害怕呢,書中有段話我很喜歡
公平正義的基礎是人只有做了某事才需要對它負責,畢竟,想做而未做不是犯罪,社會關系於個人責任的基本信條是,人為其選擇的行為承擔責任。如果大數據分析完全准確,那麼我們的未來會被精準的預測,因此在未來,我們不僅會失去選擇的權利,而且會按照預測去行動。如果精準的預測成為現實的話,我們也就失去了自由意志,失去了自由選擇的權利。既然我們別無選擇,那麼我們也就不需要承擔責任。這不是很諷刺嗎。
扯到這里,順便扯一下,書中另一段關於自由意志的描述
在哲學界,關於因果關系是否存在的爭論已經持續了幾個世紀。畢竟,如果凡事皆有因果的話,那麼我們就沒有決定任何事的自由了。如果說我們做的每一個決定或者每一個想法都是其他事情的結果。而這個結果又是由其他原因導致的。以此循環往復,那麼就不存在人的自由意志這一說了。——所有的生命軌跡都只是受因果關系的控制了。因此,對於因果關系在世間所扮演的角色,哲學家們爭論不休,有時他們認為,這是與自由意志相對立。
書中舉了個例子,舉了部電影《少數派報告》,當我看到這里的時候,”哎喲,我居然看過這部電影,想想心裡還是有點小激動“,有興趣的可以去看下,大概就是講警察通過預測來提前抓捕犯人,不過不是通過大數據,是通過超人類的方式。當你什麼舉動都可以被預測,相當於你完全暴露在太陽光下,換成你,你害怕不。
最後,附上兩段結語,一段是書中的一段話,另一段是我自己瞎編的。
大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。
大數據終將會影響到我們,也像其他技術一樣會是一把雙刃劍,用得好,動心,濫用,害怕。如同核技術一樣,用的話,造福地球,濫用,給個金剛石地球你,照樣爆。我相信,未來的大數據的發展會如作者所說的,是一場生活、工作與思維的革命。
大數據時代讀後感(二)
去年的“雲計算”炒得熱火朝天的,今年的“大數據”又突襲而來。彷彿一夜間,各廠商都紛紛改旗換幟,推起“大數據”來了。於是乎,各企業的CIO也將熱度紛紛轉向關注“大數據”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現實中小企業雲計算,大數據的現狀。
不過話又還得說回來,《大數據時代》是本好書。
當然,很多IT知名人士也大力推薦,寫了好多讀後感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現在也比較火熱的BI,覺得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘。看過此書後,感覺到之前的想法,只能算是中了一小半吧---巨量的數據,而另一前:著眼於數據關聯性,而非數據精確性,或許才是大數據與現時BI最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數據的關聯性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現在的數據分析方法來論,更多的傾向於數據的精確性。看完此書,我心中的一些問題:
1.什麼是大數據?
查了查網路,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的'的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity--這個好像是IBM的定義吧。
以個人的觀點來看:數據海量,存儲海量都是大數據的基本原型吧。
2.大數據適合什麼樣的企業?
誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關聯性,才可以讓通過
專業化的處理,讓其為企業產生價值。針對電信運營,互聯網應用這樣海量用戶的數據的大企業,也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業呢?銷售訂單數據?若非百年老店,估計數據也是少得可憐,5,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行為分析為最多。同樣,在公共事業類的政府機構,大數據的作用也許也能很好的發揮。反而感覺在大多數中小型企業應用大數據,似乎有點大題小作。書中說:大數據是企業競爭力。誠然,數據是一個企業的核心無形資源(利用得好的話),但是否所有的數據,或都換則方式說:所有的企業都以大數據為競爭力,是否真的合適么?是否在中小企業中,會顯示得小題大做呢?
3.大數據帶來的影響
當一波又一波的IT技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好准備,你都要開始迎接它所給你帶來的影響了。經過物聯網,雲計算的推波助瀾下,大數據開始登場了。但它到底給我們帶來了什麼呢?
1)預測未來書中以Google成功預測了未來可能發生流感的案例來開篇,表明通過大數據的應用,可以為我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。
2)變革商業大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業機遇與商業模式,數據的潛在價值會源源不斷地發揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業鏈產生。影響最大的,當然是IT公司
3)變革思維書中所說:因為有海量的數據作基礎,未來,我們可能更關注數據的相關,而非精細度。對這條,本人還是持保留意見的。
大數據時代讀後感(三)
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人雲亦雲的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家“的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分”大數據時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。”大數據的簡單演算法比小數據的復雜演算法更有效。“更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。”不是因果關系,而是相關關系。“不需要知道”為什麼“,只需要知道”是什麼“。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
世間萬物的復雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出”不是因果關系,而是相關關系。“這一論斷時,他在書中還說道:”在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足於僅僅知道‘是什麼’時,我們就會繼續向更深層次研究的因果關系,找出背後的‘為什麼’。“[i]由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。
大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可”量化“,大數據的定量分析有力地回答”是什麼“這一問題,但仍然無法完全回答”為什麼“。因此,我認為並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節”掌控“中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:”大數據並不是一個充斥著演算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。“謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標准答案,只是參考答案。
此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。
㈧ 《大數據》閱讀答案
所謂‘大數據’,是指數據規模巨大,大到難以用我們傳統信息處理技術合理擷取、管理、處理、整理」「在‘大數據’時代,我們的知識生產若再固守印刷時代的知識生產理念,沿襲此前的知識生產方式,就會被遠遠地甩在時代後面。我在這里整理了《大數據》閱讀答案,希望能幫助到那您。
大數據
近年來,「大數據」這個概念突然火爆起來,成為業界人士舌尖上滾燙的話題。所謂「大數據」,是指數據規模巨大,大到難以用我們傳統信息處理技術合理擷取、管理、處理、整理。「大數據」概念是「信息」概念的3.0版,主要是對新媒體語境下信息爆炸情境的生動描述。
我們一直有這樣的成見:信息是個好東西。對於人類社會而言,信息應該多多益善。這種想法是信息稀缺時代的產物。由於我們曾吃盡信息貧困和蒙昧的苦頭,於是就拚命追逐信息、佔有信息。我們甚至還固執地認為,佔有的信息越多,就越好,越有力量。但是,在「大數據’時代,信息不再稀缺,這種成見就會受到沖擊。信息的失速繁衍造成信息的嚴重過剩。當超載的信息逼近人們所能承受的極限值時,就會成為一種負擔,我們會不堪重負。
信息的超速繁殖源自於信息技術的升級換代。以互聯網為代表的新媒體技術打開了信息所羅門的瓶子,數字化的信息失速狂奔,使人類主宰信息的能力遠遠落在後面。美國互聯網數據中心指出,互聯網上的數據每兩年翻一番,目前世界上的90%以上數據是近幾年才產生的。2000年,數字存儲信息佔全球數據量的四分之一,另外四分之三的信息都存儲在報紙、膠片、黑膠唱片和盒式磁帶這類媒介上。2007年,只有7%是存儲在報紙、書籍、圖片等媒介上的模擬數據,其餘都是數字數據。到2013年,世界上存儲的數據中,數字數據超過98%。面對數字數據的大量擴容,我們只能望洋興嘆。
「大數據」時代對人類社會的影響是全方位的。這種影響究竟有多大,我們現在還無法預料。哈佛大學定量社會學研究所主任蓋瑞·金則以「一場革命」來形容大數據技術給學術、商業和政府管理等帶來的變化,認為「大數據」時代會引爆一場「哥白尼式革命」:它改變的不僅僅是信息生產力,更是信息生產關系;不僅是知識生產和傳播的內容,更是其生產與傳播方式。
我們此前的知識生產是印刷時代的產物。它是15世紀古登堡時代的延續。印刷革命引爆了人類社會知識生產與傳播的「哥白尼式革命」,它使得知識的生產和傳播突破了精英、貴族的壟斷,開啟了知識傳播的大眾時代,同時,也確立了「機械復制時代」的知識生產與傳播方式。與印刷時代相比,互聯網新媒體開啟的「大數據」時代,則是一場更為深廣的革命。在「大數據」時代,信息的生產與傳播往往是呈幾何級數式增長、病毒式傳播。以互聯網為代表的媒介技術顛覆了印刷時代的知識生產與傳播方式。新媒體遍地開花,打破了傳統知識主體對知識生產與傳播的壟斷。新媒體技術改寫了靜態、單向、線性的知識生產格局,改變了自上而下的知識傳播模式,將知識的生產與傳播拋入空前的不確定之中。在「大數據」時代,我們的知識生產若再固守印刷時代的知識生產理念,沿襲此前的知識生產方式,就會被遠遠地甩在時代後面。
(節選自2013.2.22《文匯讀書周報》,有刪改)
《大數據》閱讀題目:
9.下列對「大數據時代」的特點解說正確的一項是
A.數據規模巨大,信息嚴重過剩,總量已超過了人們的承受極限值而成為社會的負擔。B.信息生產呈幾何級數式增長、病毒式傳播,信息傳播方式不再是自上而下,而是相反。
C.精英與貴族的知識壟斷被沖破,傳統知識主體不再是唯一的知識生產者和傳播者。 D.「機械復制時代」知識生產和傳播方式被顛覆,呈動態、多向和空前的不確定性。 10.下列理解,不符合原文意思的一項是
A.人們在信息稀缺時代形成的佔有信息越多越好、越有力量的認識,將隨著「大數據」時代的到來而改變。
B.人類主宰信息的能力遠遠落後於信息的產生,是因為信息技術的升級換代帶來的數字化信息的失速狂奔。
C.從2000年數字存儲信息佔全球數據量的四分之一,到2013年超過98%,說明了傳統媒體被新媒體取代。
D.印刷革命開啟了知識傳播的大眾時代, 與印刷時代相比,互聯網新媒體開啟的「大數據」時代,則是一場更為深廣的革命。
《大數據》參考答案:
9.D【試題分析:論述類文體閱讀的命題主要從概念、判斷、推理三個角度命題,概念注意「答非所問」「內涵、外延不準」「誤劃類別」「張冠李戴」;判斷類注意「范圍不當」「偷換概念」「曲解文意」;推理注意「強加因果」「強行推理」等錯誤。答題的關鍵是審清題干、找准區位、對讀原文、尋找細微的差別。選項A原文「信息的失速繁衍造成信息的嚴重過剩。當超載的信息逼近人們所能承受的極限值時,就會成為一種負擔,我們會不堪重負」現在是「大數據」時代,但還沒有到「當超載的信息逼近人們所能承受的極限值時」,時間范圍混淆;選項B 原文「新媒體技術改寫了靜態、單向、線性的知識生產格局,改變了自上而下的知識傳播模式,將知識的生產與傳播拋入空前的不確定之中」選項「信息傳播方式不再是自上而下,而是相反」,偷換了文中的概念「拋入空前的不確定之中」為「自下而上」;選項C對應的原文「印刷革命引爆了人類社會知識生產與傳播的‘哥白尼式革命’,它使得知識的生產和傳播突破了精英、貴族的壟斷」讓「知識的生產和傳播突破了精英、貴族的壟斷」是「印刷革命」,選項是「大數據時代」,犯了張冠李戴的錯誤。】
10.C【試題分析:選項「說明了傳統媒體正被新媒體取代」,文中沒有依據,屬於無中生有。】