❶ 大數據的挑戰和局限
大數據的挑戰和局限
每個人都知道互聯網改變了企業經營、政府運作以及人們生活的方式。但是一種新的、不那麼明顯的技術趨勢卻有著同樣巨大的變革能力,那就是「大數據」。大數據的趨勢發端於下面這個事實:如今到處傳播的信息比以往任何時候都多出了許多,而且這一趨勢正在應用於非同尋常的新用途。大數據與互聯網截然不同,雖然互聯網使數據的收集和共享方便了很多。大數據的意義並不僅僅是通信:其本質是我們可以從大量的信息中學習到從較少量的信息中無法獲取的東西。
將改變人類思考方式
早在公元前3世紀,亞歷山大圖書館被認為收藏了全部的人類知識。而如果把當今全世界的信息平分給每一個活著的人,那麼每個人擁有的信息量將足足超過當年亞歷山大圖書館全部藏書的320倍。如果把所有這些信息刻到光碟上並且分五摞疊起來的話,那麼這些光碟可以一直堆到月球。
這種數據爆炸是相對新鮮的現象。僅僅在2000年的時候,全世界全部的存儲信息中還只有四分之一是數字化的,其餘的都保存在紙張、膠片和其他模擬介質上。但是由於數字數據數量的增長十分迅速——幾乎每三年就翻一番,這種情形很快發生了逆轉。如今,在所有存儲信息中只有不到2%是非數字化的。
鑒於如此懸殊的比例,人們免不了在理解大數據的時候僅僅從數量上進行考慮。然而這將會產生誤導。大數據的另一個特徵是它能夠用數據來表現世界的眾多層面,而這些層面以往從來都沒有被量化過——這種特徵可以被稱為「數據化」。例如,位置信息的數據化最早是由於經緯度的發明,而最近又有了GPS。當計算機對幾個世紀內的書籍進行取樣時,文字便成了被處理的數據。甚至連友誼和愛好也被數據化了——例如通過Facebook。
藉助於廉價的電腦內存、高性能處理器、智能演算法、聰明軟體以及從基本統計學中借鑒來的數學知識,這樣的一類數據正在被應用於難以置信的新用途中。這種新方法並不是試圖「教會」計算機去從事駕駛或翻譯這樣的事情,而是要向計算機輸入足夠多的信息,從而使它們能夠推斷概率,例如交通指示綠燈亮、紅燈不亮的概率,或者是在特定語境下「light」一詞意為「光」而不是「輕」的概率。
以這種方式對大量數據加以利用,要求人們在三個方面徹底改變對數據的態度。第一是收集和使用大量數據,而不是像統計學家們在過去100多年裡所做的那樣,只滿足於少量的數據或樣本。第二是拋棄人們對有條理和純凈的數據的偏愛,轉而接受雜亂無章——在越來越多的情形下,少許的不精確是可以容忍的。第三,在許多場合,人們需要放棄對事情原委的追究,而代之以對相關性的接納。利用大數據,而不是試圖弄懂發動機拋錨或葯物副作用消失的確切原因,研究人員可以收集和分析大量有關此類事件的信息及一切相關素材,找出可能有助於預測未來事件發生的規律。大數據有助於回答是什麼、而不是為什麼的問題——通常有這樣的回答就足夠了。
互聯網重塑了人類交流的方式。大數據則不同:它標志著社會處理信息方式的變化。隨著時間的推移,大數據可能會改變人們思考世界的方式。隨著人們利用越來越多的數據來理解事情和作出決定,人們很可能會發現生活的許多層面是隨機的、而不是確定的。
從因果關繫到相關性
人們看待數據的方式的兩個變化——從局部變為全部以及從純凈變為凌亂——催生了第三個變化:從因果關繫到相關性。這代表著告別總是試圖了解世界運轉方式背後深層原因的態度,而走向僅僅需要弄清現象之間的聯系以及利用這些信息來解決問題。
加拿大的研究人員正在開發一種大數據手段,以便能在明顯症狀出現之前發現早產嬰兒體內的感染。通過把包括心率、血壓、呼吸和血氧水平等16種生命體征轉化成每秒1000多個數據點的信息流,他們已經能夠找到極其輕微的變化與較為嚴重的問題之間的相關性。最終,這項技術將使醫生能夠提前採取行動,從而拯救生命。
大數據所產生的影響將遠遠超出醫學和消費品的范疇:它將深遠地改變政府的運作方式和政治的性質。在推動經濟增長、提供公共服務或進行戰爭等方面,那些能夠有效利用大數據的人將擁有勝過別人的巨大優勢。迄今為止,最令人興奮的成果出現在市級,在這個級別上獲取數據和利用這些信息進行實驗要容易一些。紐約市長邁克爾·布隆伯格(他本人就是靠著數據行業發家的)率先進行了一項努力:該市正在利用大數據改善公共服務和降低成本。其中一個例子就是新的火災預防策略。
非法在屋內打隔斷的建築物著火的可能性比其他建築物高很多。紐約市每年接到2.5萬宗有關房屋住得過於擁擠的投訴,但市裡只有200名處理投訴的巡視員。市長辦公室一個分析專家小組覺得大數據可以幫助解決這一需求與資源的落差。該小組建立了一個市內全部90萬座建築物的資料庫,並在其中加入市裡19個部門所收集到的數據:欠稅扣押記錄、水電使用異常、繳費拖欠、服務切斷、救護車使用、當地犯罪率、鼠患投訴,諸如此類。接下來,他們將這一資料庫與過去5年中按嚴重程度排列的建築物著火記錄進行比較,希望找出相關性。果然,建築物類型和建造年份是與火災相關的因素。不過,一個沒怎麼預料到的結果是,獲得外磚牆施工許可的建築物與較低的嚴重火災發生率之間存在相關性。
利用所有這些數據,該小組建立了一個可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統。他們所記錄的建築物的各種特徵數據都不是導致火災的原因,但這些數據與火災隱患的增加或降低存在相關性。這種知識被證明是極具價值的:過去房屋巡視員出現場時簽發房屋騰空令的比例只有13%,在採用新辦法之後,這個比例上升到了70%——效率大大提高了。
大數據的挑戰和局限
大數據也正在幫助提高民主政府的透明度。一個建立在「開放數據」概念上的運動已經形成,其訴求超出了目前在發達民主國家已經十分常見的信息自由法。這一運動的支持者呼籲政府把手上浩如煙海的普通數據向公眾開放。
與此同時,在政府推動使用大數據的同時,它們還需要保護公眾免受不正當市場壟斷的侵害。管理大數據的法規甚至可能成為國家間的角斗場。出於對反托拉斯和保護隱私的關切,歐洲各國政府已經在嚴查谷歌公司。臉譜網可能會成為世界各地類似行動的打擊目標,因為它持有太多的個人數據。外交官們應該准備好圍繞是否像對待自由貿易那樣對待信息流動展開交鋒。
大數據勢必將改變人們生活、工作和思考的方式。建立在強調因果關系基礎上的世界觀正在受到推崇相關性的挑戰。知識的佔有曾經意味著對歷史的了解,而現在卻意味著預言未來的能力。解決大數據所帶來的挑戰將不是易事。
在決策越來越多地受到數據支配的世界裡,人、直覺或是不顧事實的蠻干還有什麼用武之地呢?如果每個人都求助於數據,都利用大數據工具的話,那麼不可預測性——例如人類的本能、冒險、意外甚至失誤——也許將會成為差異的關鍵。如果真是這樣的話,那麼需要專門為人為因素辟出一席之地——即為直覺、常識、運氣留出空間,以確保它們不會被數據和機器生成的答案擠走。
這將對社會進步的觀念產生重要影響。大數據使我們可以更快地進行實驗,對更多的線索展開探索。這些優勢應該會導致更多創新的產生。但在有些時候,發明的火花迸發是數據所無法表現的。倘若亨利·福特當初求助於大數據演算法系統來研究顧客希望得到的東西,演算法系統得到的答案會是「更快的馬匹」,也就不會有福特著名的汽車生產線了。在大數據的世界裡,需要培養的恰恰是與人類關系最密切的特性——創造力、直覺和上進心,因為人的聰明才智才是進步的源泉。
大數據是一種資源和一種工具。它的目的是告知,而不是解釋;它意在促進理解,但仍然會導致誤解——關鍵在於人們對它的掌握程度。人們必須以一種不僅欣賞其力量,而且承認其局限的態度來接納這種技術。
❷ 簡述大數據的局限性 大數據的局限性體現在哪些方面
【導讀】近年來,由於我國一直貫徹落實科教興國戰略,截止目前為止,已經取得了不小的成績,比如人工智慧的普及,大數據的落地應用,不過現在還是觀測階段,大數據技術還沒有具體的成熟,今天我們就來簡述大數據的局限性以及大數據的局限性體現在哪些方面,一起來看看吧!
1、大數據的局限性——大數據不理解背景
人類的決策不是離散的事件,而是根植於時間序列和環境中。經過數百萬年的進化,人類的大腦已經適應了這個現實。人們擅長講故事,有很多原因,也有很多場景。數據分析不知道如何講故事,也不知道思維是如何浮現的。即使在一本普通的小說中,這種想法也無法用數據分析來解釋。
2、大數據的局限性——大數據將創造更大的乾草垛
這個想法是由著名商業思想家Nassim
Taleb提出的,他是《黑天鵝:如何應對不可知的未來》一書的作者。我們擁有的數據越多,我們就能發現更顯著的統計相關性。很多這樣的關系都是毫無意義的,在解決問題時還會讓人誤入歧途。隨著越來越多的數據可用,作弊行為呈指數級增長。在大海撈針的過程中,我們要找的針埋得越來越深。大數據時代的一個特徵是,「重大」發現的數量被數據擴張的噪音淹沒了。
3、大數據的局限性——大數據不能解決大問題
如果你只是想分析哪些郵件產生了最多的競選捐款,你可以做一個隨機對照試驗。但如果目標是在衰退期間刺激經濟,你不會找到一個平行世界社會作為對照組。最好的刺激方案是什麼?關於這個問題有很多爭論,盡管數據泛濫,但據我所知,這場辯論中沒有一個主要的辯手根據統計分析改變了立場。
4、大數據的局限性——大數據往往是一種趨勢,而不是傑作
當大量的個人迅速對一種文化產品產生興趣時,數據分析可以對這種趨勢敏感。但是一些重要的(有利可圖的)產品一開始就從數據中被丟棄了,僅僅是因為它們的怪癖不為人所知。
5、大數據的局限性——大數據掩蓋了價值
「原始數據」的意義在於,它永遠不可能是「原始的」;它總是根據一個人的傾向和價值觀來構建的。數據分析的結果看似客觀公正,但實際上,價值選擇貫穿於從構建到解讀的全過程。
這篇文章並不是要批評大數據不是一個偉大的工具。但是,像任何工具一樣,大數據也有它的長處和弱點。正如耶魯大學(Yale
University)的愛德華•塔夫特(Edward Tufte)所說:「世界比任何其他學科都更有趣。」
以上就是小編今天給大家整理的關於「簡述大數據的局限性
大數據的局限性體現在哪些方面」的相關內容,希望對大家有所幫助。總的來說,大數據的價值不可估量,未來發展前景也是非常可觀的,因此有興趣的小夥伴,盡早著手學習哦!
❸ 大數據給人們帶來很多好處,還存在哪些弊端
如今大數據是一個很火的話題,常常我們通過大數據擁有了很多便利。大數據在我們生活中扮演著很重要的作用,不過我們也要警惕大數據存在的弊端。接下來就一起來看一下大數據都有哪些弊端吧。 任何事情都有兩面性,我們也不能因為大數據的弊端而否定了它帶給我們生活的便利。也希望數據能夠被妥善保管,不要隨意泄露用戶隱私。商家不要利用大數據最大化賺錢,否則也會失去用戶的支持。
各位讀者,你們又有怎樣的看法呢?歡迎在評論區里留言討論一下。
❹ 互聯網的消極影響
第一、互聯網將信息碎片化,讓人無法進行深度閱讀
個人電腦普及之後,信息以碎片化的形式充斥在我們生活的各個角落,手機、電視、電腦、公共交通上的車載電視都成為獲取信息的渠道,我們獲得信息的方式如此之多,方法如此簡單,以至於我們對信息的關注僅僅停留在表面,浮光掠影式的閱讀除了增加一些談資以外,真正沉澱下來的價值信息少得可憐。
人們再也沒有耐心讀完一篇長篇小說,也無法通過深度的新聞報道對某個事件形成客觀理性的認知。由此導致人們往往在尚未搞清楚事情的原委時就不假思索地發表個人意見,不負責任的言論在微博等社交媒體上比比皆是。這也是造成很多人在不知情的情況下進行造謠傳謠的原因。
第二、互聯網降低人們信息分辨能力,選擇性忽略大量價值信息
互聯網媒體過分追逐點擊率,不加選擇地向用戶推薦聳人聽聞的所謂爆炸性新聞,以誇張的標題和獵奇性的內容吸引用戶點擊,忽略了新聞本身具備的社會價值。從而導致人們對新聞的敏感度和辨別力降低,以為只有足夠「爆炸」的消息才具備價值,才能夠堂而皇之地登上頭條。
那些真正具備價值的新聞則被媒體和受眾選擇性忽略。由此導致人們只對世界上發生的大事略知皮毛,而對「頭條」之外的信息所知甚少。盡管在茶餘飯後,大家談論起時事來頭頭是道,實則知識的匱乏已經難以掩飾。
第三、互聯網讓人懶於思考,盲目遵從或照搬他人總結式的發言
以前讀書時遇到不認識的字,我們會選擇查字典,現在我們不僅可以通過網路查字典,還可以查到這個字的用法和例句。以前我們在現實生活中遇到問題,比如煮雞蛋應該煮多長時間,會選擇向身邊的長輩求助,而現在只需要「網路一下」,網路幾乎無所不知,這導致我們對其產生依賴,遇到其他任何事,首先想到的都是通過網路尋求幫助。
我們不再嘗試著通過自己的思考解決問題,而是在網上照搬他人總結好的方法和經驗。盡管他人的經驗並不一定適合自己,偶爾也會有不湊效的情況出現,但網路依然成為人們解決問題的首選,並被視為權威。久而久之,我們都變成了一個不會思考的動物。
第四、互聯網產品形態和調性導致受眾只對某類信息有興趣,對其他事則漠不關心
不同的互聯網產品有其不同的調性,這導致不同平台的用戶有著不同的行為習慣。拿微博來說,很多微博用戶對強拆等重大社會性事件較為關心,並就此發表自己看法,曾經有網友調侃,每天上微博有一種皇上批閱奏章的感覺,這種認知經過長時間地不斷強化,就會反作用於用戶思維和行為,導致微博成為一個公共輿論場和意見聚集地。
再看微信,用戶好友多半來自身邊,大家更為關注細微的生活點滴。朋友圈中大多數人都是在曬自己的生活動態,比如今天吃了什麼美食,去了什麼好玩的地方。而對自身之外的公共事件則很少關心。這種現象也不是一天兩天形成的,而是由產品的形態和與生俱來的調性決定的。所以,發生沒有人談論魯甸地震的情況也就不足為奇了。
第五、互聯網占據人們零散時間,無暇享受生活和真實社交帶來的樂趣,疏遠親友關系
互聯網幾乎擠佔了人們所有的零散時間,上下班的路上,上廁所的時間,親友聚會等待上餐的時間,這些已經嚴重影響到現實中的人際關系,情況嚴重的,幾乎互聯網已經成為業餘生活的全部,而現實生活則被置於無關緊要的位置。
互聯網帶給人們的新鮮感和刺激程度逐漸讓人們對現實生活失去了原有的興趣,也讓人失去了對美好事物的欣賞能力,讓人既沒有時間,也沒有能力去享受生活的美好和真實社交帶來的樂趣。繼而使得現實中的親友關系走向疏遠。
第六、互聯網過分誇大行業價值,導致過多人投身互聯網業,而非實業
的確,如今各個行業都已經離不開互聯網的身影,但是並非所有行業都要效仿互聯網行業的做法。「互聯網思維」被炒得最火的時候,就連賣涼皮的都聲稱自己在用互聯網思維創業。互聯網的真正價值遠沒有這個行業的鼓吹者所言的那般巨大。
稍有理性的人都應該把互聯網當做解決問題的工具,而不是把互聯網本身當做發家致富的掘金池,互聯網的真正價值應該體現在對農業、製造業等實際產業的科技化、現代化上,而不是體現在互聯網行業本身上。