① 大數據時代的隱私現狀
數據,已經是最重要的生產要素之一。
自2008年「大數據」概念被提出以來,這項技術快速對各行業進行「顛覆」。但數據在賦能行業、改變生活的同時,也頻頻引發亂象:大數據殺熟、隱私侵犯、數據黑產等問題考驗著各國政府管理者,更影響了大數據產業的發展。
前一段時間,美國知名社交媒體平台臉書(Facebook)用戶數據遭泄露,3天內曝光了5.33億用戶個人數據,其中涉106個國家和地區,泄露的信息包括用戶在臉書的賬戶名、位置、生日以及電子郵件地址等,非常的詳細。其中還包括不少知名人士和公眾人物。
也許很多人對數據給我們造成的影響,並沒有明顯的感知,我們先用一些事例來說明數據帶來的或大或小的影響。
2013年,電商開始根據用戶的收藏夾、購物種類、搜索記錄、瀏覽記錄、相似推薦等數據,為每一位消費者量身定製自己的購物清單。這一年,余額寶橫空出世,基於淘寶和支付寶的數據平台,余額寶可以及時把握申購、贖回變動信息,同時還可以利用 歷史 數據把握客戶的行為規律。不到半年時間,余額寶規模超1000億、用戶近3000萬,相當於當年國內全部78隻貨幣基金總規模的近20%。互聯網與大數據結合的威懾力,讓傳統銀行側目。
2015年,基於大數據的個性化推薦第一次在雙11中大放異彩:平台的跳失率首次達到個位數,用戶只訪問一個頁面就離開的次數降到了一個 歷史 新低,而個性化推薦系統引導的人數和人均引導頁面數都是前一年的2 3倍。在交通、教育、醫療、智慧城市等領域,大數據也在快速滲透。
至此,人們對英國數據科學家及數學家克萊夫·哈姆比 (Clive Humby) 在2006年提出的口號「數據是新時代的石油」已經完全認可,在 科技 公司口中,它變成了另外一句表述:得數據者得天下。
數據大時代:得數據者得天下
英國皇家工程院院士郭毅可曾在節目中講過一個故事:一家著名的制葯公司,以上百萬英鎊的巨資,購買了一位罕見的癌症患者的數據。這家公司之所以願意花這么多錢,是因為該患者患有6種癌症,他的數據在世界上幾乎是獨一無二的。
互聯網巨頭的數據之爭
2017年6月,順豐關閉豐巢自提櫃和淘寶平台物流數據信息回傳,阿里巴巴旗下物流平台菜鳥與順豐在網路上隔空「掐架」,顯現的是兩者在客戶數據信息控制權的深度較量;兩個月後,華為Magic手機在嘗試人工智慧應用中,想調用微信數據時遭遇騰訊拒絕,進而引發糾紛。企業之間的競爭,變成了對「數據」的競爭。
被詬病無數的「大數據殺熟」
2018年,一些經常出差的網友發現,在攜程預訂機票或酒店時,同一件商品或者同一項服務,平台顯示給老用戶的價格要高於新用戶。隨後,攜程被爆出利用大數據「殺熟」。隨後攜程回應,內部調查中未發現對使用同一賬號,不同手機預定同酒店、同房型進行差別定價。
但對「大數據殺熟」的質疑不僅沒有就此打住,反而波及到互聯網打車、電商、外賣等領域,幾乎成了互聯網行業的「潛規則」。其背後的「推動力」則源於互聯網平台的盈利壓力——為了填平早期燒錢帶來的巨額虧損,只能不斷提價,而老用戶對平台的粘性比新用戶高,因此相對更能承受更高的價格。
個人隱私和「數據啟蒙運動」
最早注冊各種APP的那一批人,根本不會想到這些APP會背叛他們、販賣他們個人隱私。因為互聯網時代是免費的、是公開的、是嘗鮮者的樂園。互聯網時代也是快節奏的,它可以迅速淘汰掉弱者,迅速推翻前一個巨頭。
在這些互聯網公司咿呀學語的時候,都是懵懂無知的理想主義者:扎克伯格並不想在Facebook上放廣告,拉里·佩奇只想做一個簡單的網頁搜索,楊致遠想把雅虎變成一個互聯網門戶,陳士駿只想把 YouTube 變成人們分享小視頻的廣場。
Facebook、谷歌、雅虎,它們最早都不是廣告公司,但都想不出更好的賺錢辦法。於是創業者們發明了一種完美的模式——免費模式。用戶注冊免費,但個人數據會被網站追蹤,用來推送廣告。因為注冊是免費的,所以Facebook、谷歌這樣的公司用戶量會出現暴增,可以迅速成為霸主。個人數據是無窮無盡的,只要認真挖掘,一定能賣個好價錢。
在免費模式里,你和我都不是這些APP的客戶,而是這些APP的產品。我們的隱私數據會被他們提取、優化、處理,打包賣給出價最高的廣告商。可用戶的增長如果達到了飽和怎麼辦?那就從已有的用戶身上挖掘更多的數據,用更高級的工具做出更細致的分析,賣給更多的廣告商。
2018年,360創始人周鴻禕推崇「免費模式」,360快視頻盜取了B站大量賬號和視頻,可以說是把「免費模式」做到了極致。互聯網公司像從奶牛身上擠奶一樣,從用戶身上「擠」數據。
然後數據工程師用 Kafka、Storm、Hadoop、Spark 這些外行人根本沒聽說過的工具,仔細地把用戶數據整理歸類,然後給廣告商端出來。一個谷歌的前部門經理曾說過,谷歌的核心競爭力不是搜索或者安卓,也不是地圖或者日歷,它的競爭力是能把用戶數據變成錢。「把用戶數據變成錢」,這才是免費模式的背後邏輯。
可隨著Facebook隱私丑聞的爆發,人們越來越意識到,泄露個人網路隱私是危險的。這種個人隱私的覺醒,會帶來一場「數據啟蒙運動」,加上數字經濟的崛起及在GDP中的佔比越來越舉足輕重。
這都推動著各國數據隱私立法,數據也不在僅僅是互聯網企業爭奪的對象,它已經上升到國家戰略的層面上。數據安全已經是國家安全的一部分。
一場全球性的數據立法競賽
世界上較早對數據立法的是歐盟。2018年5月25日,歐盟《通用數據保護條例》 (簡稱GDPR) 在成員國內正式生效實施。
該條例的適用范圍極為廣泛,比如:用戶自己的數據,必須可以隨時被自己查看、修改、刪除、下載;任何公司,必須在收集用戶數據之前,讓用戶簽一個協議;收集16歲以下兒童數據,必須經過家長同意。 簡言之,就是用戶的數據,控制權必須要在用戶手中。
其實,GDPR是歐盟2016年就已經頒布的隱私法,但他們給轄區內各大互聯網公司兩年的准備時間,直到2018年5月25日才開始執行。從執行日起,如果發現任何公司違反,要麼罰2000歐元,要麼是該違規公司4%的營業額,哪個罰得多交哪個。
在GDPR生效的第一天,Facebook和谷歌就被告了,理由是強迫用戶同意共享個人數據。2019年1月,法國以谷歌違反歐盟GDPR隱私法為由,對谷歌處以5000萬歐元 (約5700萬美元) 的罰款。
大洋彼岸的美國也未閑著。2018年6月28日,美國加利福尼亞州頒布了《2018年加州消費者隱私法案》 (簡稱CCPA) ,對消費者隱私權和數據安全進行保護。CCPA被認為是美國國內最嚴格的隱私立法,於2020年1月1日生效。
此外,新加坡頒布並實施了《個人資料保護條例》,印度也公布《2019年個人數據保護法》草案。
全球性立法沖動的背後,是大家都逐漸意識到:誰如果在立法上落後一步,誰就將在數字時代處於被動態勢。
盡管我國早在2017年就實施了《網路安全法》,但在數據領域並沒有一部專屬的法律規范。到了2018年9月,全國人大常委會公布了《中華人民共和國數據安全法》立法規劃。 2021年6月10日,《中華人民共和國數據安全法》正式出爐,並將於2021年9月1日起實施,至此,中國也有了第一部針對數據安全的法律。
法律對數據確權的同時,還需要有操作層面的技術支撐。目前建立個人數據賬戶已經沒有技術難度,一個可能的設想是,給個人配套一種類似身份證系統的個人數據授權賬戶系統。有這樣一套系統,就可以使個人對數據授權,進而擁有對個人數據的主動權。
② 大數據時代,用戶還有隱私嗎
當前,數據的數量時刻都在飛速增長。信息分享在全世界范圍內越廣泛,確保數據安全和保護人們隱私的任務就越難完成。現如今,人與人之間交流產生的流量遠遠大於文件傳輸產生的流量,但是,人與人之間的交流可以界定為隱私,屬於比較敏感的范疇。由此看來,整個互聯網都是隱私的,是不可公開的。但是,現有的互聯網結構下,你的所有應用對於服務提供商,其實都是透明的。那麼,人們既想要藉助互聯網的平台與別人交流,又想要自己的空間不被窺探,這是完全不可能的。
隨著社會的發展和公民個人自我意識的不斷覺醒,中國人才漸漸意識到,隱私,其實是一種非常重要的人格權利,它與社會的文明程度和人的尊嚴是緊緊聯系在一起的。與此相對應,在法律對隱私權保護長期缺席後,2010年我國制定的《侵權責任法》中,有了明確的隱私權保護條款
隨著中國社會經濟的快速發展和文明程度的快速提升,中國公民的隱私權保護意識也得到了很大的強化。人們開始採取多種方式來保護自己的隱私,同時,關於隱私的內涵也在不斷豐富。但是,隨著網路傳播技術的飛速發展和大數據時代的到來,公民的隱私面臨巨大的挑戰
簡單地說, 「大數據」是指利用常用軟體工具捕獲、管理和處理數據所耗時間超過可容忍時間的數據集
大數據和海量數據具有根本的區別:如大數據與雲計算技術是一體兩面的, 如果沒有後者, 就不可能有大數據;同時, 大數據是在線可及的, 即其數據是永遠在線的, 且是能隨時調用和計算的
除此之外, 公認的大數據的特徵還包括:規模大、高速性、多樣性和價值密度低等。具體地說, 所謂「規模大」, 是指無論大數據的採集、存儲還是計算, 都具有海量的數據規模;所謂「高速性」, 是指其數據流轉非常快速;所謂「多樣性」, 是指它涵括了多樣的數據類型, 如網路日誌、音頻資料、手機通話記錄、視頻文件、社交媒體、數字資料、互聯網搜索、生物感測器相關的數據等;所謂「價值密度低」是相對於大數據的龐大數據量而言的, 它是指需要對大數據進行「價值提純」, 即專業化處理, 才能挖掘出其價值。而這一價值提純的專業化處理猶如「在黃沙中淘金」
關於隱私至今還沒有一個統一的定義被廣泛認同。隱私作為一種抽象權利所指向的對象與使用的方式、情境蘊含了很多種情況與意義, 我們很難用一個單一的定義來窮盡隱私這個概念
一般而言, 隱私是指一種與公共利益、群體利益無關, 當事人不願他人干涉或他人不便干涉的個人私事, 以及當事人不願他人侵入或他人不便侵入的個人領域
在不同的背景下隱私權具有不同的含義。張新寶教授認為:「隱私權是指公民享有的私人生活安寧與私人信息依法受到保護, 不被他人非法侵擾、知悉、搜集、利用和公開等的一種人格權利。」
楊立新教授認為:「隱私權是指自然人享有的對其個人的與公共利益無關的私人信息、私人活動和私人空間進行支配的具體權利。」
大數據背景下的隱私權是指個人享有的與公共利益無關的網路信息、網路空間不被竊取和打擾的人格權。隱私權包括私生活空間、私生活秘密、私生活的安寧狀態等內容。隱私權的權利主體是自然人, 權利客體是不願公開的個人信息或不願為他人知悉的秘密, 該內容具有真實性和私密性。關於隱私權侵權的行為認定, 存在很多抗辯事由, 比如口頭傳述不足以引起嚴重傷害、當事人的同意以及公眾的知情權等等, 隱私權的價值在於個人的自由、尊嚴和安全。
③ 在這個大數據互聯網時代,我們還有隱私可言嗎
我們當然沒有任何隱私呀,因為大數據深入到人們的每一個生活的角落,讓人無處可藏。