从Google搜索预测流感疫情引发的热议开始,大数据、人工智能技术带来的社会、经济和思维的变革已经超越了人的想象力。如果说大数据可以预测未婚少女怀孕的信息、预测商场里顾客的购买行为、预测未来机票的价格,那么根据大数据预测一个国家未来五年的GDP也成为可能。从个人级、企业级到国家级乃至世界级的案例中,大数据丰富了人类探索世界的方式,人工智能技术改变了媒介的内容生产方式和内容分发方式,内容生产者可以基于对个人数据的算法分析,实现精准定向信息推送。人们选择信息的信噪比降低,有效信息获取成本降低,享受着大数据带来的种种便利和服务。但同时,也让渡了很大一部分资源,那就是我们的个人数据,个人在网络上产生的内容,如图片、音频、视频、购物记录、浏览痕迹、地理位置等都记录了个人行为轨迹及网络社交图谱,其中包含着大量的个人隐私。通过技术手段将这些数据进行分析、整合,能够完全勾勒出鲜明的个人形象、网络关系以及产生看似与数据不相关的服务与行为。
近年来,用户隐私泄露的事件频频发生,2018年3月,全球最大的社交网站Facebook被爆出了巨大的数据泄露事件,Facebook承认将5000万用户的数据泄露给了剑桥数据分析公司。该公司将5000万用户的数据运用人工智能的算法进行分析,得出精准投放的用户人群,将相关新闻和竞选信息推送给有针对性的用户,实现对特朗普总统竞选事件的操控。数据泄密丑闻发生以后,带来的后续危机仍在持续,几天内Facebook蒸发了500多亿美元市值,虽然扎克伯格亲自发表声明说用户量并未出现大幅下滑,但这次数据泄密事件使用户产生了信任危机,为社交媒体品牌带来的负面效应是世界范围的,关于隐私权保护的问题成为大数据时代一个热点议题。

隐私权与数据隐私权的出现
隐私权的概念最早诞生于美国,美国从19世纪开始提出隐私权的概念,关于对消费者隐私权的保护最早出现在《纽约州权力法案》里,到20世纪不断完善,将隐私权编入《美国法典》。随着网络技术的发展,信息时代的隐私权问题不断突出,在奥巴马政府时代,又制定了信息时代消费者隐私保护的国家标准,并将其写入《消费者隐私权力法案》。而Facebook数据泄密事件恰恰是出现在最早提出隐私权保护的美国,这不是Facebook的第一起隐私泄露案,近十年,Facebook多次陷入数据泄密、维护隐私权的纷争之中,这不得不令人深思,在一个崇尚“轻规制、重监督、重自律”的国家出屡屡出现隐私泄露的问题,这背后的种种原因究竟是什么?是利益主体强大的产业链驱动,还是技术的进步与落后的法制之间的不平衡?在大数据时代究竟应该如何保护用户的数据安全和个人隐私?
对于隐私权的讨论,国际上并没有公认的学术定义,不同国家、行业之间对于隐私的看法也不尽相同,而网络社会的传播是跨边界的,对于隐私权的研究达成共识的难度很大。比如对于电话号码的侵权研究,当个人收到恶意短信或者电话营销时,认为是对个人隐私权赤裸裸地侵犯。电话号码算不算个人隐私?在中国,电话号码使用权和所有权是分离的,因此不属于个人隐私。身份证与电话号码关联不算隐私,身份证跟银行卡关联才是隐私。但是,这种由于个人消费行为或者社会行为中将电话号码泄露,或者相关机构将数据以非告知用户的形式进行售卖的行为,也会导致个人受到干扰甚至欺骗,这应不应该进入到法制监管的视野?什么样的隐私权应该属于公共网络传播中法律规制的范畴?
大数据时代,传统隐私权的内涵和外延应该随着技术的发展而改变。我们应该“重构隐私权”,研究什么是网络时代的“数据隐私权”。个人数据以文字、图片及搜索轨迹等碎片化的形式散落在公共网络上,通过对各种平台的数据获取,可以得到个人的兴趣爱好、消费行为、消费意向以及社交网络图谱等,甚至可以完整描绘出具体的个人形象,这些数据都应该算作数据隐私。在今年Facebook的5000万用户数据泄密事件中,对用户的数据获取是通过一个嫁接在Facebook性格测试小程序上获得的,用户在使用小程序时让渡了一部分个人数据,而公司通过这些个人数据和社交网络好友数据,建立起强大的基于用户爱好、性格及政治倾向的算法,将用户心理性格和Facebook上的行为数据相叠加,从而获得精准的目标用户,将用户分成不同的类属,分类向其推送竞选广告。

数据让渡的无奈与技术的霸权
很多互联网企业认为用户对隐私不敏感,愿意用隐私来换取服务。那为什么用户愿意让渡个人数据获取服务?是因为如果不让渡数据就无法获得相关服务。比如移动终端上安装APP需要获取手机识别码、地理位置等数据才可以使用这项服务,即使是安装个手机手电筒也要获取用户诸如通讯录、照片、录音等相关个人数据。默认的服务条款勾选、长篇累牍的权力不对等告知条约……用户无奈授权数据的背后却是强大的技术霸权。
由于现在技术的发展远远领先于法律,通过技术手段能挖掘出来的数据都可以被使用,导致侵犯个人隐私的事件屡屡发生。究竟哪部分数据允许可以被公开使用,哪部分数据不能被公开使用或者部分使用,可以使用多久,数据一次授权是否可以永久使用及使用的范围等问题都没有上升到法制层面。
但是,数据让渡不代表隐私权的让渡,用户让渡了数据只是为了获取使用该服务的权力,并不代表其愿意将自己的隐私作为网络公开数据被用于其他研究,很多用户甚至是对数据的二次利用毫不知情。究竟用户愿意为获取服务让渡多少数据?应该为获取服务让渡多少数据?这些数据又该如何被使用?
数据让渡与服务获取的平衡
数据隐私权的保护本质上是数据让渡和服务获取之间权力的博弈。网络数据具有长期存在性和易扩散性,只要在公共网络平台留下数据痕迹,是很难彻底消除的。网络服务商在提供服务时已经通过流量及广告资源等获利,但很多网络服务商将获得的个人数据进行二次利用或售卖,造成了对个人数据隐私权的侵犯。而个人在让渡部分数据时,获取服务的权力和其提供的数据隐私不具有等价交换性。数据的二次利用甚至多次利用大多是在个人不知情的情况下进行的,网络服务商或其他机构及个人对个人隐私进行二次利用,用不透明的算法对个人隐私索取超额利益,究其原因本质上是消费者媒介使用权和技术优势的不对等关系。
数据的二次利用,运用得当可以为社会和人类提供更多服务,如将快递数据进行用户购买行为分析,可依据用户行为投放定向广告,可以减少无关广告信息对个人的干扰,也降低企业营销成本。通过对个人网络消费数据分析可以得出用户的信用程度,可以实现快速金融服务,为个人提供便利,降低交易时间和成本。但数据的过度消费就可能产生侵犯个人隐私权的问题。在数据的二次利用时,边界的把握是个难题,如何区分个人隐私和公共数据,需要运用技术手段对数据加以区分和管理。

个人数据的技术保护手段很多,要对用户ID进行隐藏保护,可以使用匿名认证技术,将属性匿名、位置匿名、关系匿名。调用数据时也可以使用控制访问、远程证明等技术,通过技术手段实现个人数据的二次利用知情权。在必须需要用到个人数据时,也要采取加密技术将个人信息隐藏,使用新型密码技术将身份信息加密、用户属性加密等。在技术层面,尽量不要让信息对应到一个具体的个人,可以通过相应的数据关联手段可以实现个人隐私数据的虚假化,如假名系统,将个人信息用一个对应的假名,方便使用数据而减少对个人隐私权的侵犯。这些技术方面的解决方案和实现要依靠人工智能、模式识别、数据挖掘和机器学习等领域的专家和机构。
仅依赖技术来实现个人隐私权的保护还远远不够,个人数据究竟哪些属于隐私,该如何被使用并没有明确的规范。这不仅是技术层面能够解决的问题,需要上升到法制层面。法律应该如何界定数据的使用权?网络服务商的霸王条款应该受到法律的制约吗?
数据让渡与法制监管及新的法律条文的制定
数据安全与大数据发展的顶层设计息息相关,如果能在宏观层面将数据挖掘、数据使用、数据存储等各个阶段等建立起明确的标准规范,将更有利于个人隐私保护。个人隐私的保护是国家数据安全至关重要的内容,是与整个社会稳定息息相关的。中国大陆的苹果icloud服务器授权云上贵州大数据产业发展有限公司,这意味着中国用户的数据将逐步保留在境内的数据中心,将更有利于用户隐私权的保护,也说明我国宏观部门对大数据安全问题重视程度逐渐提高。
中国没有专门的《隐私法》,关于隐私的界定,在我国尚无明确的法律条文规定。对隐私保护的法律零散见于一些法条,在《民法总则》《民法通则》《侵权责任法》等法典中仅概括性地表达了法律保护公民的人格权,包括个人隐私。对个人隐私权保护尤其是数据隐私权保护的力度与网络数据传播的技术发展速度严重不匹配。在个人数据的二次利用上,什么样的数据属于公共数据,什么样的数据属于个人隐私,需要制定相应的法律规范。在个人让渡数据获取信息服务时,应该授予其多样化选择的权力,将数据的使用权限赋予数据所有人,从数据使用时间、范围、程度和数量上赋予法律依据。而目前现实情况更多是,个人并没有被赋予数据二次利用的让渡权和部分让渡权,甚至也没有数据被使用知情权。

如果个人信息被二次利用导致个人隐私被侵犯,个人有没有可能要求网络服务商将涉及个人隐私的内容从网络上彻底删除?早在1995年欧盟在《个人数据保护指令》中提出个人可以依法删除不符合指令规范或不正确的数据。2012年欧盟提出“被遗忘权”的概念,在《通用数据保护条例》(草案)中增设“被遗忘和擦去权”(right to be forgotten and erasure),赋予人们删除数字信息的权力,将被遗忘权视为人权的一部分。条例中扩大了属于隐私保护的用户数据类型,如生物识别数据、遗传数据、政治观点、性取向等。2016年欧盟在《通用数据保护条例》中要求谷歌全球设立站点执行被遗忘权,被遗忘权发布以后引起了很多议,主要集中在“被遗忘权”的价值和可操作性以及使用范畴上。“被遗忘权”在美国、巴西、澳大利亚等国也没有被广泛认可,虽然各国对待该问题的态度不统一,但是这在互联网时代是一个不容被忽视的问题、也是亟待解决的问题。
在中国没有“被遗忘权”的法律条款,只要网络信息不涉及明显侵犯个人利益的内容,都属于网站的正常信息,搜索引擎不负责删除。个人想要删除网上的信息,没有法律依据,难度相当大。如果“被遗忘权”能够有法可依,将在数据使用的源头上进行阻断,在数据存储、挖掘和使用时对数据进行分类,有选择性地进行数据分析。在一定程度上也能够对媒介内容生产者进行约束和规制,生产新闻或广告等信息时就会尽量避免侵犯受众隐私,而被要求网络遗忘和数据删除。
“被遗忘权”在全球推行和实施过程中还有很长一段路要走,会受到多方力量的挑战。首先是各国对该提法的认可度,对概念、主客体的界定、可操作性等没有统一的标准,互联网企业认为这是以牺牲企业发展为代价的权力,也有关于社会伦理道德等方面的制约,认为被遗忘权是抹杀了网络社会的全面性和真实性,与言论自由相违背等。网络信息传播内容不受国家地域的限制,网络数据应该是国家的还是全球的?各国对该问题的理解程度和法律规范不同,如果研究不能达成共识,隐私权保护跨国规制和监管难度更大,隐私权保护更需要世界范围的协作。
文/武汉大学新闻与传播学院 姚曦 傅琳雅