導航:首頁 > 數據分析 > 在大數據時代之前信息如何保存

在大數據時代之前信息如何保存

發布時間:2025-02-13 16:29:06

大數據與個人信息保護

大數據與個人信息保護
數據為王的時代,對於用戶隱私的保護必然會越來越受到重視。那麼,個人隱私保護制度會對互聯網的發展帶來怎樣的影響?如何才能在大數據應用的商業利益與公眾的個人信息保護需求之間取得平衡?在互聯網無時不在、無時不有的今天,我們的隱私在各種情況下被收集、被利用,甚至被濫用,有關個人信息保護的立法也是國家立法計劃中的重要內容,我主要跟大家分享幾個方面,首先什麼是隱私,如果這一點達不成共識,討論就沒有意義了。第二,我們現在所謂隱私保護面臨哪些問題?第三,面對這些問題,未來從法律上怎麼解決這些問題?
隱私是一個法律概念
隱私簡單地說,是一個人不想讓別人知道的東西。但個人的生活、感情因人而異,大家對隱私的看法也不一樣。很多朋友都講,隱私體現的是一種個人的東西,這在我理解的話就是屬於個人信息的范疇。很多人對什麼是隱私有分歧,就同一個人來說也不確定自己哪些是隱私,或者有些時候是,有些時候不是,完全自己說了算。所以這樣的社會里如果較起真來,或者在法律上要維權的話就混亂了。
隱私不是中國本土的概念,隱私是用美國隱私概念的瓶裝入了歐洲隱私的酒拿到中國來的。歐美人並沒有對隱私從不同的學科、不同的語境、不同的地域文化上做區分,在歐美問什麼是隱私,分歧也很大,但可能會比中國好一些,因為這種隱私跟我們的文化水土不服。隱私是一個與地域文化傳統關聯十分密切的概念。
在歐洲,宗教信仰就是隱私,而在中國,誰會認為這是隱私呢?中國傳統上並沒有隱私的概念,有一個觀念是陰私。但上世紀70年代末80年代初,從歐美翻譯過來的隱私的概念傳到中國後廣泛傳播,導致了現在中國的隱私泛濫、泛化,動不動就說侵犯隱私,但你問什麼是隱私,他卻無法給你准確的答案。
隱私應當做不同學科、不同語境、不同地域文化的理解。女性的三圍、身高、體重是心理學或社會學上的隱私,一定不能將這些隱私,包括政治學、經濟學意義上的隱私跟法律上的隱私混為一談。法律上,隱私是通過隱私權來保護的,權利就是行為自由的邊界。這個邊界很清晰,其他人不能進入,否則就可以起訴他侵權。如果法律上的隱私內涵不確定、外延不明確,因人而異,就會出現混亂。
隱私與公共利益無關
隱私絕對是個人的東西,比如國家機關就沒有隱私。法律上的隱私,是個人信息的一部分,但不是所有個人信息都是法律上的隱私,姓名、家庭住址、女性的三圍絕對不是法律上所講的隱私。中國的陰私概念是值得借鑒的,從1956年「民法草案」開始,到1982年的民法通則,這一段時間里中國的法律上就有陰私概念。陰私是指不好的事情,一般正常理性的人,這些事情、信息公布出去會讓他名譽掃地,讓他的社會尊嚴受到傷害。傳統的陰私僅僅是指與性有關的一些東西,比如裸照、性生活、兩性情感。這個價值取向值得我們認可,但缺點是內涵比較窄,僅限於與性有關的方面。
陰私的價值觀我們要繼承。在上世紀70年代、80年代之前,陰私內涵比較窄沒有問題,但是發展到今天,價值取向擴大了。很多人認可隱私這個詞,這就是中國傳統陰私的概念,但是內容要擴展。所以法律上的隱私,不限於與性有關的,還包括不為人知的重大生理疾病缺陷,這些缺陷公布出去同樣會讓他受到歧視,或令他的名譽受到影響。
這里下一個定義,法律上的隱私是指與公共利益、社會利益沒有直接關系,同時又與人的名譽和尊嚴有關的極少數個人信息,這是抽象出來的本質;包括但不限於裸照、性相關、情感經歷、生理疾病等,這是范圍和表象。很多學者批評中國民法通則沒有規范隱私,不重視人權,但是最高法院的司法解釋是把它作為名譽權來保護的,比如披露與性有關的東西,讓人名譽掃地,就認為侵犯了名譽權。其實按我的理解,隱私權不獨立,隱私與名譽是相聯系的。這方面中國其實比歐美先進,中國有陰私概念,披露陰私即會使人名譽掃地。
與公共利益、社會利益的關系還要看具體情況。一般人的婚外情或者是兩性的東西可能被認為是屬於隱私,但是作為政治官員、作為公眾人物,他們的某些個人信息可能與公共利益、社會利益有關系,所以這部分在一定范圍內可以公開。一般人認為屬於隱私的,他們要受到限制。但是無論如何,在披露這些政治人物或者公眾人物隱私時也要考慮到他們作為一個人最起碼的名譽和尊嚴,披露的方式要注意,比如將裸照放在網上是不可以接受的,不能因為是公眾人物就不被保護。再比如犯罪記錄,它有不同國家、不同文化的考量。有的以社會利益為本位的國家不把犯罪記錄作為隱私,他們認為如果把犯罪記錄作為隱私保護起來的話,會對周圍人的安全帶來隱患,雖然公開犯罪記錄也可能會使被公開者的尊嚴受損。
難以操作的個人信息保護指令
我們現在說的個人信息、敏感信息的概念來自歐盟。歐盟與中國國情不同,拿過來沒有可操作性。今天在討論隱私遇到互聯網時,一定要知道這個隱私是什麼樣的隱私,否則討論就沒有任何意義。歐美的隱私觀,表面上看好像尊重了個人權利,好像很現代化,實際上不僅沒有任何積極意義,還會帶來很多消極的作用。現在所說的「隱私遇上互聯網」的這個隱私,不是我講的法律上的隱私,而是受到歐美隱私觀影響的一種東西。
在個人信息中,姓名、家庭地址、電話號碼都是在社會交往中正常產生的,我們反對的是騷擾電話、垃圾簡訊這樣的濫用行為。現在買賣個人信息很常見,發送垃圾簡訊、騷擾電話,有人認為是侵犯隱私,這看起來非常誘人的想法實際上正是導致問題泛濫的根源。按照刑法修正案,情節嚴重的買賣個人信息是一種犯罪行為,但是起訴維權的成本特別高,侵權和犯罪的成本卻特別低。現在的隱私觀念聽起來講人權,但客觀上不利於受害人維權。
我們現在的立法是學習歐盟的,全國人大常委會2012年通過一個規定,互聯網公司在收集個人信息的時候應當徵得當事人的同意,當事人有決定權是否讓你收集;有知情權,你基於什麼樣的目的收集個人信息,收集以後存在什麼地方;當事人也有查看的權利、刪除的權利、修改的權利,比如信息記錄不完整、有出入時可以進行修改;甚至還有被遺忘的權利———以前互聯網上的信息,時過境遷不希望放在網上的時候有權請求刪除,刪除之後在互聯網上就被遺忘了,所以是被遺忘的權利。
收集信息所涉及的同意、知情、查詢、修改、刪除權是歐盟1995年的個人信息保護指令中所規定的內容,去年修改時增加了被遺忘的權利,但是這個權利的落實需要技術上的一個先決條件,就是當事人必須知道自己的信息何時何地被何人收集在了什麼地方,這樣才能行使相關權利。歐盟的個人信息保護指令源於上世紀60年代末70年代初,那時只有銀行、保險、電信公司和政府機構才有大型計算機,但現在,移動互聯網的出現讓信息的收集無時無處不在,每個人的工作單位、電話號碼、家庭地址能說清楚何時何地被何人收集了嗎?所以現在的立法和認識都遠遠過時了,沒有辦法操作。
去年歐洲討論很激烈的是被遺忘的權利,最後勉強通過,我們馬上將歐洲的東西引進過來。歐洲有沒有大的互聯網公司?一個都沒有。歐盟像垂暮的老年,特別保守,極端推崇個人的權利、個人的自由,歐盟的隱私觀就是極端個人主義自由觀的體現。
互聯網收集的信息多數不是隱私
當隱私遇到互聯網,很多時候我們說的那個隱私其實並不是隱私。互聯網收集信息無處不在無時不有,但收集的這些信息多數不屬於隱私范疇:比如說在當當購書了,就會發現上網時會提示你買什麼書;或者使用了搜索引擎,下次再使用時就會自動彈出相關的東西,很多人都錯誤地認為這是侵犯了隱私。排除政府的行為,對互聯網企業來說,你要是認為它收集的信息侵犯了你的隱私,這十有八九是自作多情。互聯網企業無需知道你是張三還是李四,它只需要有針對性地推廣商品和服務。
在互聯網背景下,要區分什麼是我的個人信息,什麼是可以找到我的信息。個人信息是由若乾片斷組合而成的,N個片斷的組合才是我的個人信息。如果N -1個片斷的話,不是完整的我,就不是個人信息了。所以行為偏好不是個人信息,個人信息是能夠直接或間接識別出一個人的信息總和,單單行為偏好的數據不足以識別出一個完整的我。但是行為偏好數據可以讓商家很快找到這個人所需要的服務,對雙方都有好處。所以隱私遇到互聯網,有一個觀念要轉變,很多人認為商家收集信息就是侵犯個人隱私,這是錯誤的,是對互聯網的誤解。一般來說互聯網公司無需知道一個人的個人信息,也沒有動機知道,知道對它沒有任何好處,只有壞處。只有一種情況例外,就是比如公安機關依法定程序找互聯網企業要信息。
現在的大數據時代還意味著,原來散落在互聯網各個角落的信息,通過數據信息的收集、加工技術,海量數據將連在一起。這樣,原來不能識別出一個人的N -1、N - 2、N -3個信息就可以還原為N個信息,就可以找到這個人,實行實名化。所以這里有一個原則,在大數據的背景下對數據的加工分析匹配過程一定要匿名化。匿名化對商家來說,就是處理的這些數據不會知道具體是誰的信息,只是數據而已。收集加工處理越精準,才越有利於用戶和企業之間減少交易成本。當然還有一個原則,陰私是禁止收集、禁止加工的,但遵循匿名原則的話,這個問題就不存在了。
只要我們遵循以上的這些原則,隱私遇到互聯網其實沒有什麼大問題,不像傳說中那麼恐怖。最重要的,一是要規范政府的行為,二是要規范企業的信息加工,使最後的匹配行為一定匿名化。如果這兩點做到了,在互聯網環境下,我們就不要老強調信息安全,害怕泄露隱私。現在我們在觀念上本末倒置,強調信息的安全,事實上無法安全。

② 大數據時代,個人信息如何保護

大數據時代,個人信息如何保護
隨著大數據應用領域不斷涌現新風口,數據合規話題討論迅速升溫。在日前舉行的「2017大數據合作與合規峰會」上,中國社會科學院法學研究所所長陳甦表示,互聯網、大數據、人工智慧等信息技術正在引發新一輪科技革命,數據已成為國家基礎性戰略資源。大數據合規、用戶隱私保護備受矚目。
近年來,大數據在廣告、金融、醫療、出行、人工智慧等領域的廣泛應用,不僅推動了政府、企業、社會組織等的數字化轉型,也使人們的生活變得更加智能化、便捷化。據預測,中國大數據產業市場未來5年內,仍將保持高速增長,到2020年,大數據產業規模將接近5萬億元。
大數據的技術發展與物聯網、雲計算、人工智慧等新技術領域的聯系將更加緊密。如何切實保護用戶權益、促進數據合規運用、建立公平有序的競爭環境,已成為擺在數據合規發展面前的問題之一。
2017年9月,微信、京東商城等10家互聯網產品和服務的企業共同簽署了個人信息保護倡議書,承諾尊重用戶知情權和控制權、遵守用戶授權、保障用戶的信息安全、保障產品和服務的安全可信、聯合抵制黑色產業鏈、倡導行業自律、接受社會監督等。
騰訊集團法務副總裁江波表示,堅持「開放透明、用戶控制、數據安全」的隱私保護原則,需要通過設計保護隱私,在切實保障用戶數據安全的基礎上,不斷提升數據安全保護水平,規范大數據使用。
大數據是新時代的新型財富和資源。在數字經濟的浪潮中,網路商品交易和服務、消費者權益、個人信息保護、數據爭議、網路侵權等方面出現了一些新情況、新問題。對此,專家分析認為,要加快推進完善數據領域立法、提升監管執法效率,優化行業自律標准,構建大數據安全依法有效的保障制度。
中國法學會網路與信息法學研究會副會長周漢華表示,大數據、人工智慧迅猛發展的過程中,企業之間的數據共享問題、數據控制者與數據主體之間的合規問題逐漸顯現,對大數據產業的持續發展帶來諸多挑戰。
政府、行業、企業多方協作和共同努力為數字經濟發展保駕護航,成為大數據時代發展的必然趨勢;保障數據安全、規范數據使用,成為大數據時代行業發展的共識。
為落實《網路安全法》對個人信息保護的相關要求,中央網信辦、工信部、公安部、國家標准委等四部門組成專家工作組,對微信、淘寶等10款網路產品和服務的隱私條款進行了評審,規范收集、保存、使用、轉讓用戶個人信息的行為。
「此次隱私保護專項評審工作中,隱私條款透明度增強、用戶選擇權增多成為亮點。」中國電子技術化研究院副院長楊建軍介紹,10款產品和服務在隱私政策方面均有不同程度提升,均做到明示其收集、使用個人信息的規則,並徵求用戶的明確授權。
目前,高效、流程化的數據合規管理對企業的實踐提出更高要求。這包括建立隱私事務管理部門、規劃數據保護戰略、制定隱私政策程序和指南等方面。業內人士認為,在系統和程序設計中考慮隱私保護,開展隱私影響評估等工作,可以讓隱私保護置於「前端」。在產品初期加入隱私保護理念,後期通過持續的監督和評估,鞏固全生命周期管理策略。
加快建設數字中國,對於大數據的監管也需要新的思路。「如何切實保護消費者權益、促進數據合規運用、建立公平有序的競爭環境,需要帶有審慎包容的態度,及時應對大數據領域的變化。」

③ 大數據時代,數據應該如何存儲

PB或多PB級基礎設施與傳統大規模數據集之間的差別簡直就像白天和黑夜的差別,就像在筆記本電腦上處理數據和在RAID陣列上處理數據之間的差別。"
當Day在2009年加入Shutterfly時,存儲已經成為該公司最大的開支,並且以飛快的速度增長。
"每N個PB的額外存儲意味著我們需要另一個存儲管理員來支持物理和邏輯基礎設施,"Day表示,"面對大規模數據存儲,系統會更頻繁地出問題,任何管理超大存儲的人經常都要處理硬體故障。大家都在試圖解決的根本問題是:當你知道存儲的一部分將在一段時間內出現問題,你應該如何確保數據可用性,同時確保不會降低性能?"RAID問題解決故障的標准答案是復制,通常以RAID陣列的形式。但Day表示,面對龐大規模的數據時,RAID解決問題的同時可能會製造更多問題。在傳統RAID數據存儲方案中,每個數據的副本都被鏡像和存儲在陣列的不同磁碟中,以確保完整性和可用性。但這意味著每個被鏡像和存儲的數據將需要其本身五倍以上的存儲空間。隨著RAID陣列中使用的磁碟越來越大(從密度和功耗的角度來看,3TB磁碟非常具有吸引力),更換故障驅動器的時間也將變得越來越長。
"實際上,我們使用RAID並不存在任何操作問題,"Day表示,"我們看到的是,隨著磁碟變得越來越大,當任何組件發生故障時,我們回到一個完全冗餘的系統的時間增加。生成校驗是與數據集的大小成正比的。當我們開始使用1TB和2TB的磁碟時,回到完全冗餘系統的時間變得很長。可以說,這種趨勢並沒有朝著正確的方向發展。"
對於Shutterfly而言,可靠性和可用性是非常關鍵的因素,這也是企業級存儲的要求。Day表示,其快速膨脹的存儲成本使商品系統變得更具吸引力。當Day及其團隊在研究潛在技術解決方案以幫助控制存儲成本時,他們對於一項叫做糾刪碼(erasure code)的技術非常感興趣。
採用擦除代碼技術的下一代存儲
里德-所羅門糾刪碼最初作為前向糾錯碼(Forward Error Correction, FEC)用於不可靠通道的數據傳輸,例如外層空間探測的數據傳輸。這項技術還被用於CD和DVD來處理光碟上的故障,例如灰塵和劃痕。一些存儲供應商已經開始將糾刪碼納入他們的解決方案中。使用糾刪碼,數據可以被分解成幾塊,單塊分解數據是無用的,然後它們被分散到不同磁碟驅動器或者伺服器。在任何使用,這些數據都可以完全重組,即使有些數據塊因為磁碟故障已經丟失。換句話說,你不需要創建多個數據副本,單個數據就可以確保數據的完整性和可用性。
基於糾刪碼的解決方案的早期供應商之一是Cleversafe公司,他們添加了位置信息來創建其所謂的分散編碼,讓用戶可以在不同位置(例如多個數據中心)存儲數據塊或者說數據片。
每個數據塊就其自身而言是無用的,這樣能夠確保隱私性和安全性。因為信息分散技術使用單一數據來確保數據完整性和可用性,而不是像RAID一樣使用多個副本,公司可以節省多達90%的存儲成本。
"當你將試圖重組數據時,你並不一定需要提供所有數據塊,"Cleversafe公司產品策略、市場營銷和客戶解決方案副總裁Russ Kennedy表示,"你生成的數據塊的數量,我們稱之為寬度,我們將重組數據需要的最低數量稱之為門檻。你生成的數據塊的數量和重組需要的數量之間的差異決定了其可靠性。同時,即使你丟失節點和驅動器,你仍然能夠得到原來形式的數據。"

閱讀全文

與在大數據時代之前信息如何保存相關的資料

熱點內容
怎麼在窗口顯示文件路徑 瀏覽:919
es文件回收後找不到圖片 瀏覽:89
1520win10版本 瀏覽:762
淘寶基礎版10像素代碼 瀏覽:557
華碩路由文件格式或路徑不正確 瀏覽:792
電腦愛奇藝打不開找不到文件名 瀏覽:99
qq密碼破解器源碼 瀏覽:13
oppo手機usb共享網路 瀏覽:644
c語言如何連接資料庫 瀏覽:839
騰訊視頻手機app如何用戶賬戶登錄 瀏覽:252
excelvba讀取文件名 瀏覽:205
word頁眉頁腳不見了 瀏覽:959
升級win10以前的qq記錄 瀏覽:650
成長守護平台QQ密碼 瀏覽:862
win10更新失敗藍屏 瀏覽:434
什麼app相機拍視頻好看 瀏覽:756
如何編寫一個手機編程的app 瀏覽:419
文件中怎麼可以插入圖片 瀏覽:244
112版本懷舊服 瀏覽:522
金蝶的資料庫怎麼選 瀏覽:224

友情鏈接