⑴ 大數據的理想與現實之間
大數據的理想與現實之間
我與數據打了25年的交道,經歷了從電信、網通到聯通的多次重組,親身參與了數據專業線從弱勢群體逐漸發展壯大的全過程。一直想找個機會,談談我的體會,但是沒有下這個決心動筆。最近,受范總原創《「一篇文看懂Hadoop」讀後感》的鼓舞,想從數據工作實務的角度分享一下我的想法,就當拋磚引玉吧。
1. 關於數據中心的定位我們就按照論文里通常的套路開始吧。首先「什麼是數據?」通俗的理解就是:如果把企業比作一個「生產線」,數據就是在這個「生產線」上各項活動所產生的,以各種形式存放在各個系統中或者其他載體上的信息,把這些信息按照一定的屬性和規則進行分類加工就形成了數據,它反映著企業經營發展的狀況,記錄著企業用戶的使用情況,還有產業鏈上各個參與者的狀況。 受現代企業的部門設置、專業線管理架構的影響,企業完整的「生產線」被各部門分割,數據散落在由各部門管理的系統中,這就是大型企業通常的業務和數據管理的現狀~~「職責分割、數據分散」。那麼,如何反映企業整體的發展現狀呢?通常是公司月度經營分析會上,財務部門的分析報告中,匯報公司的總體情況,而市場、集團客戶等部門的報告分別匯報本專業條線的經營情況。曾經出現的情況就是財務部門匯報公司總體利潤下降,而各業務部門紛紛完成任務形勢一片大好的反差。老闆心裡納悶~~「你們都完成了任務,敢情就我沒完成任務?」聯通重組以來,頂著來自省里還有其他專業的壓力,一直在推行數據的集中。信息化部把各省、各系統中的數以億計的用戶明細數據在集團層面進行了集中存儲,並經過統一的規則加工數據,再加上後來的分析應用,不僅使每個月統計的用戶發展數據更加真實了,還發現地市層面違規經營、業績造假的行為。集團董事長召開全國地市級工作會議,點名批評、撤換了幾個地市老總。當時,地市老總還在雲里霧里~~「我都沒有這么詳細的數據,董事長怎麼知道的?」這就是數據在打破部門和省分之間的壁壘,使領導層能縱觀企業真實情況,「知其然,知其所以然」方面發揮的至關重要的作用。近兩年來,聯通通過與外部公司的合作,使用脫敏的用戶標簽數據為企業創造了真金白銀的實際價值,「數據」的應用價值日益突出,真正成為企業的又一寶貴資源。而之前,企業內部並沒有這么一個專門的部門是站在全局的角度,承擔起「數據資源」管理者的角色的,這就是成立「數據中心」的初衷,也是其定位和義不容辭的責任。聯通數據中心的成立,是「數據線」這個弱勢專業有史以來擺脫依附關系成為獨立二級部門的第一次,也是對於聯通信息化部門實踐數據集中整合、應用,支撐公司管理方面取得成果的高度肯定。說起這個,數據線工作的人都會有深深的共鳴,這裡面有多少苦衷啊。2. 主動還是被動?都是「支撐」惹的禍「數據中心」脫身於信息化部門,而信息化部門的基本定位就是「支撐」,就是要「有求必應」。我們熟悉的場景是每個月的那麼幾天,業務部門的人員為了寫分析報告,需要些報表以外的數據進行分析,給數據部門打電話,然後心急火燎地等待他們提供的數據結果。另一場景,數據部門的人員被各部門各種的數據需求折騰得團團轉,為了提供數據,加班到天亮。曾經有負責數據服務的處室,在總結年度工作時用到的數據是「提供報表上萬張」。經分系統在用戶的堅持下,開發了大量內容相近、格式不同的報表。一方面是用戶層出不窮的需求無法滿足,另一面卻是系統里大量的報表沒有人訪問。因為用戶無法自己獲取數據,日常數據服務工作顯得相當被動。其實從內容上看,一個企業的數據是唯一的,只是各部門因為關注的角度不同,提出了不同的展現要求,實際上在數據層面有較高的重疊性。如果想要在減少需求量的同時,提高用戶滿意度,就需要數據管理部門的人員具備高度的綜合能力,這個人不僅要熟悉公司的業務、流程、部門的職責分工,還要有很好的溝通能力,能夠正確理解、綜合、引導用戶的需求,然後在總體框架下將整合後的、被驗證過的需求在系統中固化。如果能力強,從個人層面,還是可以主動地做一些事情的。但是,要想改變數據工作的被動局面,就需要數據管理部門不再局限於「支撐」的角色,而是應該站在」數據資源管理者」的角度,主動地從數據、應用、管控、系統四個方面,形成一個體系化的數據管理架構,並指導日常工作和系統建設。 上圖是2009年聯通開展的數據管理體系研究工作的成果,是對數據工作的一次很好的總結和提升。它是數據管理體系L0架構,揭示了數據管理工作的組成部分以及各個部分之間的關系。與其他專業線不同,數據專業的管理核心是」數據」,數據質量、生命周期和安全管理都是核心的管控內容,而組織(人員、制度)和系統是數據產生價值的基本保障。數據、應用、管控、系統四個方面的內容缺一不可,同時又存在相互關聯、不斷優化的過程(流程),絕對不是建幾個系統那麼簡單,這也是數據專業管理的難度所在。 上面這張圖就是對數據工作的流程很好的詮釋,數據部門要想扭轉被動的局面,首先必須有自己完整的架構(數據、應用、系統、流程、管理制度)。而這一架構的形成,是需要通過以下4個步驟:正確評估自身能力現狀;找到公司業務戰略、目標對數據專業的期望和差距;有選擇性地確定數據工作的戰略目標和階段性計劃後組織實施的;在完成階段性計劃之後,還需要評估能力提升的結果,以便對現狀形成新的評價,循序漸進,有效積累。信息化的同事對於數據、應用、系統這三項內容都容易理解,但是,對於制度和流程就不太容易理解了。制度就是游戲規則,規定了該誰做,做什麼,怎麼做,做到什麼程度。流程則是為了明確一件工作的步驟和涉及的部門之間的關系。目前流程的缺失帶來太多的問題,常見的場景就是一項業務已經下線了,我們的系統中還在展示;新的業務已經為公司創造價值了,其收入還沒有在財務報表中單獨體現,不能及時反映這項業務的發展狀況;系統中數據和報表功能已經具備了,業務部門還在要求數據部門人工提供數據,用戶的需求無法及時傳遞到建設環節。
解決這些問題的根本就是必須形成閉環的數據工作流程,在數據生產、服務、建設、維護內部各個環節的有效溝通的同時,加入到公司運營、網路、管理的前端環節,第一時間參與產品策劃、基建計劃、科目調整等前期工作,才能確保數據工作的有效積累和正常運轉。
3、誰在用數據?他的核心需求是什麼?在清楚了定位和工作內容之後,首先要明確的就是工作目標,而目標的確定就需要了解數據的使用者是誰,他們的核心需求是什麼。那麼,誰是數據的需求方呢?站在企業經營的角度看,通常把數據需求分為:內部需求和外部需求。具體包括:(1)內部需求是數據服務於企業管理的職責所在。從管理層級上看,包括集團及分子公司、省級分公司;從管理職責上分就是公司管理層、職能部門、基層操作人員。管理層的訴求就是通過數據掌握公司運營的整體情況,知道「發生了什麼?什麼是主要原因?我應該去找誰?」你給我10個指標都多,因為這10個指標也許是反方向變化的,我要自己判斷哪個是核心指標。管理層需要的是「簡潔但不簡單」,這個要求也是最高的。「如何讓領導的桌面變得簡潔?」如果這樣的問題你沒有想過,領導層對你的工作就很難滿意。滿足領導層需求的最好辦法就是提供綜合指數,就像是溫度計,或者上證指數,一個指標就能縱覽全局。而這一個指數背後是高度綜合的評價體系,需要專門的研究與大量的實踐檢驗。 (上圖為DW1.0設計的領導首頁UI規范,這是一個工作台,包括:問題發現、任務指派和問題反饋三個功能。中間是對目前公司當月總體情況的評價結果,雷達圖中顯示綜合評價指標池中業務發展、財務狀況、企業運營、創新能力四類指標值與目標值的差距,並支持預警提示和問題的下鑽探索。頁面下方,是熱點信息和信息反饋的連接,支持領導任務指派和問題反饋。)職能部門是我們打交道最多的,他們的訴求就是獲取本專業的數據支持日常管理。應用最多的就是每月的經營分析,有的部門使用的是自己的報表體系,有的部門基本靠數據部門支撐,有的部門基本沒有什麼可用的數據,有的部門乾脆重新建立了自己的系統進行模型沉澱。從數據的應用層次看,我們能夠提供給職能部門使用的還停留在數據的粗加工層面。「哪個是我們最賺錢的產品?哪些是我們含金量最高的用戶?我們應該採用什麼樣的策略?我們採取的措施收效如何?」太多的問題需要用數據來回答。現在是離開數據部門的後台提數,職能部門的人自己基本拿不到數據,做不了事情。什麼時候他們能自己取數自己分析,什麼時候職能部門的用戶滿意度就能提升了。基層操作人員是與用戶最接近的環節,他們能夠用到的數據確實非常少。近年來的激發基層單元活力的工作,對數據服務於基層提出了更多的要求。但是,一個基於產品線的用戶級粒度的收入數據,與一個基於管理主體的成本數據,怎麼能夠支撐一線人員的資源配置和績效管理?數據層面為基層人員做的還非常少。最後為我們的用戶說幾句吧,如果我是一個世界500強的用戶,第一次走進聯通的營業廳辦業務,聯通能不能第一時間給我提供大客戶級的服務而不要等我給聯通創造了多少收入之後才發現我的價值?如果我使用了聯通10年以上的寬頻業務,聯通能不能辨識出我的價值,給我提供VIP級的一體化服務?聯通能不能通過我喜歡的方式、在我方便的時間、通過更加便捷的手段,推薦給我貼心的服務,而不是關注於挖掘我的隱私?以上用戶的訴求,背後都是大量的數據作為支撐的。公司經營策略中說了多少年的「以客戶為中心」,但是從數據指標體繫上看,仍然是「以產品為中心」。數據層面確實應該為我們的用戶做點什麼了。 上面這張圖,幫助我們換個角度去思考我們的工作目標,我們應該站在數據的使用者的角度,考慮應該做什麼,能做什麼,做了些什麼,形成我們的工作目標。不能再固守傳統的工作模式,數據工作需要總結和創新。(2)外部需求是數據服務於社會,為企業創造價值的體現。近年來,由於聯通數據集中的優勢,與招商、螞蟻金服多家企業進行合作,開拓了手機終端、用戶信用指數等多項應用,為企業創造了新的收入來源。(我不了解的工作,沒有發言權)「去年9月國務院印發《促進大數據發展行動綱要》稱,國家政府數據統一開放平台將在2018年底前建成,率先在氣象、環境、信用、交通、醫療、衛生等20餘項重要領域,實現公共數據資源合理適度向社會開放。」「在政府和市場的雙重催動下,那些原本封存在伺服器里的陳年數據,成為一座座蘊藏豐富的「金礦」,興奮的企業和研究人員一邊著手搜尋數據,一邊將有價值數據按需篩選出來重構。然而,能真正做深度挖掘的企業並不多,這一領域正在等待著「殺手級」應用的出現,助推金融、醫療健康、零售業、製造業等各行業產生根本性的變革。」~《大數據的痛點》聯通正經歷著和社會上其他領域一樣的探索過程,首先是完成了自身數據的集中整合,接下來就是考慮外部數據整合和應用的事情。對於聯通而言,外部用戶包括:政府主管部門、資本市場監管和審計機構,有意向的合作夥伴。對外服務合作,特別是收費服務,產品化的要求也就更高。另外,作為一個國企有它必須承擔的社會責任,聯通的大數據應用也許能夠在治理交通擁堵、解決看病難等社會問題、提升居民幸福指數方面發揮點兒自己的作用。各行業的大數據都有同樣的感覺,目前缺少「殺手級」的應用。個人認為,「殺手級」應用首先應該是基於大數據的分析預測能力與個性化需求相結合的結果,比如:高德導航提供每條路的擁堵峰值的預測,用戶輸入出行計劃時,就可以預測到一天甚至一周分時段的擁堵情況,選擇出行時間,而不是已經在路上了,再糾結於選擇哪條路。再比如,最近微信發布的電子發票功能,在為用戶解決實際問題,提高效率的同時,撬動企業級的應用,從個人應用深入到企業內部,讓銀行進一步感覺無力。另外,最近很高興地收到了高德地圖推出的早高峰的預警信息。我想無論怎樣的應用,都要站在親身體驗的角度,問問自己需要的是什麼,再用負責任和踏實的態度,沉下心來把問題解決到最好,就不會被評價成「簡單粗暴」了。4、什麼東西需要系統來實現?~~復制、流程、積累,歸根到底還是積累最近接連幾次有其他部門的朋友跟我抱怨,現在提一張報表的需求需要很長的時間,跟新的同事溝通多次根本不知道我們想要什麼,真是無語。這樣的事情已經是人員變動之後的常態了。小的事情看,無論是市場部的分析人員、信息化部的需求管理人員、廠商的開發人員,換了人,就會出現一段時間「歸零」的狀況。大的事情看,人換了,之前的工作沒有積累,後來的人根本不明白之前工作做到什麼程度了,這項工作似乎也「歸零」了。另一個場景,每個月市場部分析人員獲取數據編寫分析報告,經營分析會開過之後,就「塵埃落定」了。數據部門加班為市場部人員提供的數據及材料,每年都花費了大量的費用。而這些支出到底創造了什麼價值?是不是就是為了領導聽起匯報來賞心悅目?我們真的需要坐下來好好想想了。曾經見過一個市場部的同事,使用Excel做了一個很復雜的模板,就為了把每月的數據匯總成逐月的數據,然後計算同比、環比、構成、繪制趨勢圖,而這些東西,用技術手段很容易實現的。為什麼他們不把這個模板變成系統能力,讓系統幫他?之前曾經有技術弟跟我說,現在懂業務的人才是最有價值的,沒有技術實現不了的事兒,主要是要知道用技術做什麼。再好的技術也要想好了要做什麼,能做什麼。個人認為,系統要做的事情就是復制、流程和積累,人都沒有解決的問題,系統也不可能替你解決。如果你已經擁有成熟的模板,系統就可以把它復制用於各月、全國,在提高效率的同時,避免了人為操作的錯誤。如果你制定了完善的閉環流程,系統就能幫助你嚴格地執行。但是,最最有價值的還是積累,不僅數據應用、流程的積累,還有固化在系統中的「知識」的積累。它幫助後來的人熟悉數據,也不會因為人員的變動讓工作歸零。「積累」,是需要時時刻刻想到的事兒。 上面這張圖,從大數據應用價值、系統能力層次的角度顯示了能力積累的層級,也幫助我們很快地定位到我們目前能夠達到的層級,清楚自己努力的目標。我們是在滿足於提供數據粗加工的原材料,還是已經嵌入到企業的生產環節中,形成了商業合作模式?5、數據專業發展的關鍵是什麼?~~人,還是人。從2008年聯通公司重組到2012年數據中心成立,經過了4年的時間,期間多少艱辛不用多說。(此處略去301個字。)做什麼事兒也離不開人,特別是數據專業,需要一批懂數據、用數據、踏實肯干、耐得住寂寞的人,團隊才是最寶貴的資源。而人才隊伍的建設必須具備的條件包括:(1)支持優勝劣汰的幹部任免制度;(2)支持留住最優質的員工薪酬體系;(3)幫助員工快速成長的有效的培訓交流、知識積累機制;(4)支持我們擁有競爭力的自主開發團隊的薪酬體系;(5)支持我們選擇最優質的合作夥伴的招標流程;(6)合作夥伴意識到自身的不足,專心積累,認真做事,和我們一起成長。6、總結最後,按照「自己的事兒、別人的事兒、老天爺的事兒」的分類方法,說說我們能做點兒什麼「自己的事兒」吧:(1)首先要有穩定的數據管理架構,包括了數據、應用、系統、制度。這樣的架構與公司戰略目標相結合,形成演進路線和年度工作目標,通過年度目標的達成,循序漸進地逐步實現。數據管理架構需要在數據中心內部(集團、省級分公司),以及公司管理層、信息化部內部、其他業務部門之間達成共識,並堅定地、不打折扣地一起去推進實施。(2)明確崗位職責和分工界面(集團、省級分公司),並保持相對穩定,避免「臨時的因事兒設崗」。定期組織員工培訓、溝通,做好知識傳遞、信息共享,年度工作目標在員工層面達成共識,使新來的員工盡快進入新角色。通過專題研究組的形式邀請省公司參與數據的能力建設,調動省公司層面的積極性,養成數據中心人人「看數據、用數據」、「發現問題、解決問題」的良好習慣,做好自我完善、形成有效積累,形成「成長型」數據專業團隊。(3)建立定期的用戶(數據服務對象)溝通制度,主動介紹我們的數據架構和系統能力的提升情況,職責分工及年度工作目標,在用戶層面達成共識。引導用戶更多地使用系統能力並從中獲益,讓用戶真實地感受到效率的提升,並願意和我們一起來積累。(4)多方位整合身邊資源,在完善自身能力、提高方法論、產品化水平等方面與合作夥伴達成共識,共同進步。引進咨詢機構及高校專業人士參與開展綜合指數、客戶指標體系等多項專題研究,提升數據產品化和創新能力。(5)建立一個閉環的工作流程,使相對後端的數據流程參與到企業運營的前端流程中,以便及時反映企業的經營的變化,定期更新指標體系、報表架構及相關應用,避免前後脫節的問題,有效實施數據及應用的生命周期管理。說了這么多,一方面是因為這些年積攢的心裡話不吐不快,另一方面想著這個專業能抓住機會,取得更好的發展成果。想起某位領導多少年前說的那句話~~「有為才有位」。乘著大數據的東風,我們的隊伍已經再次壯大,但是,「理想很豐滿,現實很骨感」,我們更應該意識到差距和肩上的責任,切忌浮躁,要腳踏實地。希望新來的同事們盡快適應,進入角色吧。
⑵ 大數據帶來的大影響
大數據帶來的大影響_數據分析師考試
如果把「數據化」視為信息社會的初級階段,則名不見經傳的英國科學家維克托·邁爾-舍恩伯格,用他別具洞見的天才新著《大數據時代》首次告訴我們:人類正在進入「數據顛覆傳統」的信息社會中級階段。
在此階段,信息無所不在無所不包,其無限膨脹的天文海量催生了「統計+分類-推理分析=決策」的計算機處理程序(有點像刷卡消費一步到位,節省了算賬找補等繁瑣環節),悄然挑戰「去粗取精、去偽存真、由表及裡、由此及彼」的傳統認識論模式,冥冥之中潛移默化,對我們的生活、工作與思維,對人類「階級斗爭、生產斗爭、科學試驗」三大實踐活動產生著重大而深刻的影響。
大數據點燃
美國政府曾為定期公布消費物價指數CPI以監控通脹率,僱用了大量人員向全美90個城市的商店、辦公室進行電話、傳真拜訪,耗資2.5億美元搜集反饋8萬種商品價格的延時信息。然而麻省理工學院兩位經濟學家採取「大數據」方案,通過一個軟體在互聯網上每天搜集50萬種商品價格即時信息。2008年9月雷曼兄弟公司破產後,該軟體馬上發現了通脹轉為通縮的趨勢,而官方數據直到11月才發現。之後該軟體被暢銷到70多個國家。這一案例充分體現出「大數據」顛覆傳統的力量和變革思維的智慧。
「小數據」時代追求精準,竭力避免不精準信息誤導誤判。然而95%被傳統資料庫拒絕接受的非結構化(非標准)數據,在「大數據」時代的模糊化資料庫中發揮了重要的作用,因為數據越模糊越全面,才能有效避免誤導誤判。
從因果關繫到相關關系的思維變革,是「大數據」顛覆傳統認識論模式的關鍵。電腦畢竟不是人腦,電腦永遠搞不懂氣候與機票價格之間有什麼因果關系。公雞打鳴和天亮之間雖無因果關系,但古人通過公雞打鳴來預報天亮卻很少失敗。「如果數百萬條醫療記錄顯示橙汁和阿司匹林的特定組合對癌症治療有效果,那就用不著通過一次次實驗來探索其具體的葯理機制了」。「蘋果之父」喬布斯就主動試用過一些醫療記錄有效但未經臨床驗證的療法同癌症抗爭。你可以嘲笑喬布斯「不講科學」,但他卻因此多活了好幾年。
從根本上說,所謂「大數據挑戰傳統認識論」,其實是人類把復雜的認識過程「全部打包」給了電腦,而電腦懶得分析推理驗證,只通過統計分類對比,交出「最終答案」就OK了。大數據的精髓在於變「少而精」為「多而全」,變「因果」為「相關」。當實地調研開始被數據採集所替代,當嚴密的實驗開始被非線性邏輯所替代,當「唯一真理」開始被多項選擇所替代,「大數據」就用事實向人類宣告:「知其然不知其所以然」,既是電腦望塵人腦的劣勢,也是電腦超越人腦的優勢!
大數據滲透大世界
不要以為「大數據」只是科幻故事或政府與科學家的「專利」。環顧四周,「大數據」早已滲透我們生活和工作的方方面面,衍生出形形色色的數據超市、數據易趣、數據交友、數據聯誼、數據作坊、數據課堂、數據IB等傳奇版本。從治安管理、交通運輸、醫療衛生、商業貿易、批發零售、公益救援直到政治、軍事、經濟、金融、社會、環境、文藝、體育。
UPS國際快運公司從2000年開始通過「大數據」檢測其遍布全美的6萬輛貨車車隊,統計出各損耗零部件的生命周期,改「備份攜帶」為提前更換,有效預防了半路拋錨造成的嚴重麻煩和巨大損失,每年節省數百萬美元。UPS還依靠「大數據」優化行車路線(例如盡量右轉彎,避免左轉彎),2011年全公司車輛少跑4828萬公里,節省燃料300萬加侖,減少碳排放3萬公噸。
為紐約提供電力支持的愛迪生電力公司,針對每年多起電纜沙井蓋爆炸造成嚴重事故,採取「大數據」手段統計出106種預警先兆,預測2009年可能出事的沙井蓋並嚴加監控。結果位列前十分之一的高危井蓋中,預測准確率達44%。
美國里士滿市警察當局憑經驗認定槍擊事件往往導致犯罪高峰期,「大數據」證明這種高峰期往往出現在槍擊事件後2周左右。孟菲斯市2006年啟動「大數據」系統鎖定了更容易發生犯罪的地點和更容易抓捕罪犯的時間,使重大犯罪發生率下降26%。
沃爾瑪2004年依靠「大數據」發現了颶風前夕銷量增加的各類商品,進而每逢預報便及時設立颶風用品專區,並將手電筒、早餐零食蛋撻等擺放於專區附近,明顯增加了「順便購買」的銷量。
至於「大數據」的經濟價值,僅需略舉數例:2006年微軟以1.1億美元購買了埃齊奧尼的Farecast公司,2008年穀歌以7億美元購買了為Farecast提供數據的ITA Software公司。同年在冰島成立的DataMarket網站乾脆專靠搜集提供聯合國、世界銀行、歐盟統計局等權威機構的免費信息來獲利生存,包括倒賣各類研究機構公開發布的研究數據——只要找到買主,往往願出高價!
大數據創造大金融
金融領域當然是「大數據」的主戰場之一。程序化交易也許是現今最主要的「大數據」新式武器。美國股市每天成交量高達70億股,但其中三分之二的交易量並非由人操作,而是由建立在數學模型和演算法之上的計算機程序自動完成。日新月異的程序化交易只能運用海量數據來預測收益、降低風險。幾乎所有銀行、券商、保險、期貨、QFII和投資公司都開發了自己的程序化交易工具。誰的武器更先進?競爭到最後恐怕還是比誰搜集處理的數據更海量。
一家投資基金通過統計大商場周邊停車場及路口交通擁擠狀況,來預測商場經營及當地經濟狀況,進而預測相關股價走勢,最後居然拿數據統計資料換得了該商場的部分股權。
不少對沖基金通過搜集統計社交網站推特上的市場心情等信息來預測股市的表現。倫敦和加利福尼亞的兩家對沖基金,利用「大數據」形成119份表情圖和18864項獨立的指數,向許多客戶推銷股市每分鍾的「動態表情」:樂觀、憂郁、鎮靜、驚恐、呆滯、害怕、生氣、激憤等,以幫助和帶動投資決策。
在金融機構競相拉客理財的今天,如果能及時搜集處理海量的微博、微信、簡訊,自然也能從茫茫人海中及時發現怦然心動打算開戶的,或一氣之下打算「跳槽」的投資者。
當然,如果投資者都能通過「大數據」直接決策,將「刷卡消費」拓展成「刷卡投資」,那藏龍卧虎的分析師群體和爭雄斗妍的研究報告未來還有市場嗎?
大數據暗藏大隱患
像所有新生事物一樣,大數據也是一把雙刃劍。宏觀上看,「大數據」在各個不同的領域將人類虛擬分割為「數據化」與「被數據化」兩大陣營。持續發酵的「棱鏡門」事件披露了美國政府長期監控全世界的「最高機密」,但美國總統、國會和政府都認定這種監控「天經地義」,是「維護國家核心利益」。雖然社會早已建立起龐大的法律法規體系來保障個人信息安全,但在「大數據」時代,這些體系正蛻變為固若金湯但可以隨意繞過的「馬其諾防線」。
「大數據」導致個人信息被交易、個人隱私被外泄還不算,更大的危險在於「個人行為被預測」。正如作者預言——「這些能預測我們可能生病、拖欠還款甚至犯罪的演算法程序,會讓我們無法購買保險、無法貸款,甚至在犯罪實施前就預先被逮捕」——也許你認為這對全社會來說無疑是好事。可是如果預測系統不完善、軟硬體出差錯、數據搜集處理不當、臨時數據未經檢驗、黑客攻擊、有人惡意或善意開玩笑製造假信息……導致你、你的家庭、你的親朋好友、你的所在單位甚至你的祖國被冤枉被制裁,你還能無動於衷嗎?
微觀上看,即使是出於正當目的採集的「大數據」,仍可能在「擴展開發」過程中產生無法想像的副作用。例如谷歌的街景拍攝和GPS數據為衛星定位和自動駕駛儀提供了關鍵的支持,但同時因其有助於黑幫盜賊便捷挑選有利目標而引發了多國民眾的強烈抗議。當谷歌對圖像背景上的業主房屋、花園等目標進行模糊化處理後,反而引起盜賊更加註意。
無論你驚奇還是恐懼,歡迎還是躲避,關注還是漠視,理解還是拒絕,「大數據」都在加快步伐向我們走來。我們只有順勢而為,趨利避害,才不至於被這個充滿機遇和挑戰的新時代提前淘汰。
以上是小編為大家分享的關於大數據帶來的大影響的相關內容,更多信息可以關注環球青藤分享更多干貨