① 大数据时代的隐私现状
数据,已经是最重要的生产要素之一。
自2008年“大数据”概念被提出以来,这项技术快速对各行业进行“颠覆”。但数据在赋能行业、改变生活的同时,也频频引发乱象:大数据杀熟、隐私侵犯、数据黑产等问题考验着各国政府管理者,更影响了大数据产业的发展。
前一段时间,美国知名社交媒体平台脸书(Facebook)用户数据遭泄露,3天内曝光了5.33亿用户个人数据,其中涉106个国家和地区,泄露的信息包括用户在脸书的账户名、位置、生日以及电子邮件地址等,非常的详细。其中还包括不少知名人士和公众人物。
也许很多人对数据给我们造成的影响,并没有明显的感知,我们先用一些事例来说明数据带来的或大或小的影响。
2013年,电商开始根据用户的收藏夹、购物种类、搜索记录、浏览记录、相似推荐等数据,为每一位消费者量身定制自己的购物清单。这一年,余额宝横空出世,基于淘宝和支付宝的数据平台,余额宝可以及时把握申购、赎回变动信息,同时还可以利用 历史 数据把握客户的行为规律。不到半年时间,余额宝规模超1000亿、用户近3000万,相当于当年国内全部78只货币基金总规模的近20%。互联网与大数据结合的威慑力,让传统银行侧目。
2015年,基于大数据的个性化推荐第一次在双11中大放异彩:平台的跳失率首次达到个位数,用户只访问一个页面就离开的次数降到了一个 历史 新低,而个性化推荐系统引导的人数和人均引导页面数都是前一年的2 3倍。在交通、教育、医疗、智慧城市等领域,大数据也在快速渗透。
至此,人们对英国数据科学家及数学家克莱夫·哈姆比 (Clive Humby) 在2006年提出的口号“数据是新时代的石油”已经完全认可,在 科技 公司口中,它变成了另外一句表述:得数据者得天下。
数据大时代:得数据者得天下
英国皇家工程院院士郭毅可曾在节目中讲过一个故事:一家著名的制药公司,以上百万英镑的巨资,购买了一位罕见的癌症患者的数据。这家公司之所以愿意花这么多钱,是因为该患者患有6种癌症,他的数据在世界上几乎是独一无二的。
互联网巨头的数据之争
2017年6月,顺丰关闭丰巢自提柜和淘宝平台物流数据信息回传,阿里巴巴旗下物流平台菜鸟与顺丰在网络上隔空“掐架”,显现的是两者在客户数据信息控制权的深度较量;两个月后,华为Magic手机在尝试人工智能应用中,想调用微信数据时遭遇腾讯拒绝,进而引发纠纷。企业之间的竞争,变成了对“数据”的竞争。
被诟病无数的“大数据杀熟”
2018年,一些经常出差的网友发现,在携程预订机票或酒店时,同一件商品或者同一项服务,平台显示给老用户的价格要高于新用户。随后,携程被爆出利用大数据“杀熟”。随后携程回应,内部调查中未发现对使用同一账号,不同手机预定同酒店、同房型进行差别定价。
但对“大数据杀熟”的质疑不仅没有就此打住,反而波及到互联网打车、电商、外卖等领域,几乎成了互联网行业的“潜规则”。其背后的“推动力”则源于互联网平台的盈利压力——为了填平早期烧钱带来的巨额亏损,只能不断提价,而老用户对平台的粘性比新用户高,因此相对更能承受更高的价格。
个人隐私和“数据启蒙运动”
最早注册各种APP的那一批人,根本不会想到这些APP会背叛他们、贩卖他们个人隐私。因为互联网时代是免费的、是公开的、是尝鲜者的乐园。互联网时代也是快节奏的,它可以迅速淘汰掉弱者,迅速推翻前一个巨头。
在这些互联网公司咿呀学语的时候,都是懵懂无知的理想主义者:扎克伯格并不想在Facebook上放广告,拉里·佩奇只想做一个简单的网页搜索,杨致远想把雅虎变成一个互联网门户,陈士骏只想把 YouTube 变成人们分享小视频的广场。
Facebook、谷歌、雅虎,它们最早都不是广告公司,但都想不出更好的赚钱办法。于是创业者们发明了一种完美的模式——免费模式。用户注册免费,但个人数据会被网站追踪,用来推送广告。因为注册是免费的,所以Facebook、谷歌这样的公司用户量会出现暴增,可以迅速成为霸主。个人数据是无穷无尽的,只要认真挖掘,一定能卖个好价钱。
在免费模式里,你和我都不是这些APP的客户,而是这些APP的产品。我们的隐私数据会被他们提取、优化、处理,打包卖给出价最高的广告商。可用户的增长如果达到了饱和怎么办?那就从已有的用户身上挖掘更多的数据,用更高级的工具做出更细致的分析,卖给更多的广告商。
2018年,360创始人周鸿祎推崇“免费模式”,360快视频盗取了B站大量账号和视频,可以说是把“免费模式”做到了极致。互联网公司像从奶牛身上挤奶一样,从用户身上“挤”数据。
然后数据工程师用 Kafka、Storm、Hadoop、Spark 这些外行人根本没听说过的工具,仔细地把用户数据整理归类,然后给广告商端出来。一个谷歌的前部门经理曾说过,谷歌的核心竞争力不是搜索或者安卓,也不是地图或者日历,它的竞争力是能把用户数据变成钱。“把用户数据变成钱”,这才是免费模式的背后逻辑。
可随着Facebook隐私丑闻的爆发,人们越来越意识到,泄露个人网络隐私是危险的。这种个人隐私的觉醒,会带来一场“数据启蒙运动”,加上数字经济的崛起及在GDP中的占比越来越举足轻重。
这都推动着各国数据隐私立法,数据也不在仅仅是互联网企业争夺的对象,它已经上升到国家战略的层面上。数据安全已经是国家安全的一部分。
一场全球性的数据立法竞赛
世界上较早对数据立法的是欧盟。2018年5月25日,欧盟《通用数据保护条例》 (简称GDPR) 在成员国内正式生效实施。
该条例的适用范围极为广泛,比如:用户自己的数据,必须可以随时被自己查看、修改、删除、下载;任何公司,必须在收集用户数据之前,让用户签一个协议;收集16岁以下儿童数据,必须经过家长同意。 简言之,就是用户的数据,控制权必须要在用户手中。
其实,GDPR是欧盟2016年就已经颁布的隐私法,但他们给辖区内各大互联网公司两年的准备时间,直到2018年5月25日才开始执行。从执行日起,如果发现任何公司违反,要么罚2000欧元,要么是该违规公司4%的营业额,哪个罚得多交哪个。
在GDPR生效的第一天,Facebook和谷歌就被告了,理由是强迫用户同意共享个人数据。2019年1月,法国以谷歌违反欧盟GDPR隐私法为由,对谷歌处以5000万欧元 (约5700万美元) 的罚款。
大洋彼岸的美国也未闲着。2018年6月28日,美国加利福尼亚州颁布了《2018年加州消费者隐私法案》 (简称CCPA) ,对消费者隐私权和数据安全进行保护。CCPA被认为是美国国内最严格的隐私立法,于2020年1月1日生效。
此外,新加坡颁布并实施了《个人资料保护条例》,印度也公布《2019年个人数据保护法》草案。
全球性立法冲动的背后,是大家都逐渐意识到:谁如果在立法上落后一步,谁就将在数字时代处于被动态势。
尽管我国早在2017年就实施了《网络安全法》,但在数据领域并没有一部专属的法律规范。到了2018年9月,全国人大常委会公布了《中华人民共和国数据安全法》立法规划。 2021年6月10日,《中华人民共和国数据安全法》正式出炉,并将于2021年9月1日起实施,至此,中国也有了第一部针对数据安全的法律。
法律对数据确权的同时,还需要有操作层面的技术支撑。目前建立个人数据账户已经没有技术难度,一个可能的设想是,给个人配套一种类似身份证系统的个人数据授权账户系统。有这样一套系统,就可以使个人对数据授权,进而拥有对个人数据的主动权。
② 大数据时代,用户还有隐私吗
当前,数据的数量时刻都在飞速增长。信息分享在全世界范围内越广泛,确保数据安全和保护人们隐私的任务就越难完成。现如今,人与人之间交流产生的流量远远大于文件传输产生的流量,但是,人与人之间的交流可以界定为隐私,属于比较敏感的范畴。由此看来,整个互联网都是隐私的,是不可公开的。但是,现有的互联网结构下,你的所有应用对于服务提供商,其实都是透明的。那么,人们既想要借助互联网的平台与别人交流,又想要自己的空间不被窥探,这是完全不可能的。
随着社会的发展和公民个人自我意识的不断觉醒,中国人才渐渐意识到,隐私,其实是一种非常重要的人格权利,它与社会的文明程度和人的尊严是紧紧联系在一起的。与此相对应,在法律对隐私权保护长期缺席后,2010年我国制定的《侵权责任法》中,有了明确的隐私权保护条款
随着中国社会经济的快速发展和文明程度的快速提升,中国公民的隐私权保护意识也得到了很大的强化。人们开始采取多种方式来保护自己的隐私,同时,关于隐私的内涵也在不断丰富。但是,随着网络传播技术的飞速发展和大数据时代的到来,公民的隐私面临巨大的挑战
简单地说, “大数据”是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集
大数据和海量数据具有根本的区别:如大数据与云计算技术是一体两面的, 如果没有后者, 就不可能有大数据;同时, 大数据是在线可及的, 即其数据是永远在线的, 且是能随时调用和计算的
除此之外, 公认的大数据的特征还包括:规模大、高速性、多样性和价值密度低等。具体地说, 所谓“规模大”, 是指无论大数据的采集、存储还是计算, 都具有海量的数据规模;所谓“高速性”, 是指其数据流转非常快速;所谓“多样性”, 是指它涵括了多样的数据类型, 如网络日志、音频资料、手机通话记录、视频文件、社交媒体、数字资料、互联网搜索、生物传感器相关的数据等;所谓“价值密度低”是相对于大数据的庞大数据量而言的, 它是指需要对大数据进行“价值提纯”, 即专业化处理, 才能挖掘出其价值。而这一价值提纯的专业化处理犹如“在黄沙中淘金”
关于隐私至今还没有一个统一的定义被广泛认同。隐私作为一种抽象权利所指向的对象与使用的方式、情境蕴含了很多种情况与意义, 我们很难用一个单一的定义来穷尽隐私这个概念
一般而言, 隐私是指一种与公共利益、群体利益无关, 当事人不愿他人干涉或他人不便干涉的个人私事, 以及当事人不愿他人侵入或他人不便侵入的个人领域
在不同的背景下隐私权具有不同的含义。张新宝教授认为:“隐私权是指公民享有的私人生活安宁与私人信息依法受到保护, 不被他人非法侵扰、知悉、搜集、利用和公开等的一种人格权利。”
杨立新教授认为:“隐私权是指自然人享有的对其个人的与公共利益无关的私人信息、私人活动和私人空间进行支配的具体权利。”
大数据背景下的隐私权是指个人享有的与公共利益无关的网络信息、网络空间不被窃取和打扰的人格权。隐私权包括私生活空间、私生活秘密、私生活的安宁状态等内容。隐私权的权利主体是自然人, 权利客体是不愿公开的个人信息或不愿为他人知悉的秘密, 该内容具有真实性和私密性。关于隐私权侵权的行为认定, 存在很多抗辩事由, 比如口头传述不足以引起严重伤害、当事人的同意以及公众的知情权等等, 隐私权的价值在于个人的自由、尊严和安全。
③ 在这个大数据互联网时代,我们还有隐私可言吗
我们当然没有任何隐私呀,因为大数据深入到人们的每一个生活的角落,让人无处可藏。