6月30日,滴滴打车在美国IPO后,网传,滴滴出行将用户数据打包交给了美国政府,瞬间引发轩然大波。
7月2日,网络安全审查办公室发布公告,称为了防范国家数据安全风险,维护国家安全,保障公共利益,依据《中国人民共和国国家安全法》、《中华人民共和国网络安全法》,对滴滴出行实施网络安全审查,并停止新用户注册。
7月4日,为配合网络安全审查工作,防范风险扩大,国家互联网信息办公室发布《关于下架“滴滴出行”APP的通报》,要求从7月5日0点起,全网下架该APP。
去年以来,国家反垄断加强,国家对大型垄断性互联网平台实施监管力度加大,但之前对互联网巨头的动作,并未实质性影响到平台的正常经营,而这次突然停止滴滴APP的下载和注册,相当于停止了其新增业务,性质明显不同。
7月5日,网上疯传一篇新华社于2015年发的一篇滴滴研究院报告,仅仅靠分析2天的出行大数据,就得到了国家公安部、财政部、央行、工信部、中纪委、监察部等部门的工作情况、忙碌程度等情况,可畏火上浇油。
需要说明的是,6月10日,全国人大常委会刚刚通过了《中华人民共和国数据安全法》,并将于今年9月1日正式实施。相比较于《网络安全法》,《数据安全法》更为专业和细致,尤其对在境内采集并存储的数据出镜规定更加明确。滴滴正是在该法通过一天后,向美国证券委员会SEC递交了上市招股书,并在不到20天时间内成功上市。不知道这是不是巧合。
这次滴滴事件的性质已经快速上升到了国家安全层面,引起了社会的广泛讨论。
一、数据业务的商业模式
对于滴滴的大讨论焦点在于平台上海量的用户数据究竟属于谁?谁能用?怎么用?
这些数据包括平台用户日常的出行轨迹、办公与家庭地址、常去场所、车内语音录音等等相当敏感的隐私数据。通过这些数据,可以精准地还原出每个用户的生活习惯、工作情况、爱好、生活状态、经济收入、社会关系等画像。而滴滴在美上市,不排除会按照美国相关法律,将这些数据拱手交给美国政府甚至军方(据传滴滴股东中有美国军方人士),会对当前以及未来的中国国家安全、公民安全产生不可估量的风险。相比较美国间谍机构从我国有关人员和部门获取的数据,滴滴出行的数据颗粒度更细、涉及面更广、准确性更高、针对性更强。
在讨论这个话题之前,我们首先需要了解当下互联网平台企业的主流商业模式:
这个商业模式的逻辑是,用户签署用户协议(估计绝大多数用户注册APP的时候都没仔细看过用户隐私协议),授权平台方可以使用某些数据;平台通过对获取的用户数据进行计算加工,提供服务。这些计算加工包括但不限于:
- 搜索,如搜索引擎通过搜索词,给你需要查阅的内容或商业服务信息;
- 娱乐,如抖音通过用户刷视频的习惯,推荐给用户想看的内容和服务广告;
- 出行,如滴滴,通过出发地和目的地,计算出最佳路径并匹配适合司机;
- 购物,如电商平台通过搜索记录和消费历史记录,“千人千面”地计算出每个用户的需求,并推荐最可能购买的产品;
我们把以上计算统一称为大数据计算。
以上对用户数据的加工仅仅是为了平台自身的主营业务发展,但大多数这些主营业务都是免费的或者收入微薄。数据的可复制性以及难以确权的特点,让平台产生了将手中的数据转让给第三方公司客户的想法,于是产生了数据交易市场。
事实上,售卖用户数据已经成了很多大型平台盈利的重要方式,也是跟资本讲故事,谈估值的核心价值点。而通过售卖数据以及资本市场的上市,平台获得的收益远远超过了主营业务收入。现在大数据已经成为大多数互联网公司的核心资产,他们基于客户数据打造多维度的产业生态,达到提高行业护城河和门槛,降维打击市场竞争对手,保持行业领先和垄断利润的目的。
按互联网的俗话,这个商业模式就是:羊毛出在狗身上,猪来买单。那么猪为啥愿意买狗的单呢?因为狗身上有毛:用户数据。狗毛里为什么会有数据?因为猪在狗毛外面批了一层羊毛,让用户使劲薅,薅羊毛的代价是用户贡献自己的数据。所以,这个循环天衣无缝的成立了,猪的目的就是通过狗,搞到了天文级的用户数据。而猪为什么不直接向用户买数据呢?啥呀,用户一看,自己数据这么值钱,早开成添加了。
把这个逻辑看明白了,就知道,如果这头猪是大国竞争的对手,后果将是什么?这样,就理解了为什么滴滴事件会突然上升到国安层面,亮红灯在所难免。
在上述的互联网商业模式下,用户数据隐私保护唯一的方式是加强政府对数据使用方的依法监管与执法力度。但是这种保护无法及时保护,更多时候是杀鸡儆猴或者事后亡羊补牢,这种保护在技术突飞猛进的今天,漏网之鱼比比皆是。
二、数据收集、加工、流转环节的数据安全
根据以上数据业务商业模型,有三个重要环节涉及到隐私保护,分别是:
- 数据从用户端到平台,即数据收集环节。
以滴滴为例,平台采集到用户所在地位置、起始位置、目的地位置、什么时候使用等等,都属于数据收集环节。
- 平台对数据加工并反馈给相应结果和服务给用户。
以滴滴为例,当平台收集到用户数据后,进行路径计算,然后匹配司机位置数据,并将匹配结果返回给打车用户。
- 数据用平台流出到第三方,即数据的销售与流转环节。
针对这三个环节,相关法律分别对数据隐私保护做了规定:
- 在数据收集过程中,平台方需要明示收集数据的、方式和范围,用户需要授权平台数据使用权限。
我国的《网络安全法》第四十一条规定网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。 网络运营者不得收集与其提供的服务无关的个人信息,不得违反法律、行政法规的规定和双方的约定收集、使用个人信息,并应当依照法律、行政法规的规定和与用户的约定,处理其保存的个人信息。
- 在数据的流转环节,《网络安全法》第四十二条规定:
网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。同时第四十四条规定:任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。
- 在数据加工环节,《数据安全法》第二十七条规定:
开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全。利用互联网等信息网络开展数据处理活动,应当在网络安全等级保护制度的基础上,履行上述数据安全保护义务。
三、数据安全与隐私保护技术
现有法律对于数据的收集、存储、传输、提供、公开等环节,都做了较为明确的规定,而对数据生命周期中的核心环节,即数据的使用与加工,仅仅在《数据安全法》中提到了需要“采取相应的技术措施和其他必要措施,保障数据安全”。但是用什么技术,达到什么标准,有非常大的空间。除此之外,针对数据所有权和使用权的界定,更是模糊。
因此,用户数据隐私长时期得不到有效保障的重要原因是:数据在使用与加工环节易泄露隐私,在确权环节缺乏明确的法律界定和技术保障。
区块链和隐私计算是解决以上两个问题的关键技术。
有些人容易把区块链和隐私计算混为一谈,其实两者区别很大。区块链是一种共识计算,即面向公域数据,解决多节点的账本、计算 (智能合约) 的分布式一致性问 题,最终多个节点对计算过程和结果达成共识,任何单一方不可篡改过程。而隐私计算则面向私域数据,在确保参与计算节点原始数据和中间计算结果隐私保护的前提下,仅仅公开最终计算结果,同时证明最终结果是可验证的。共识计算不能解决数据的隐私问题,隐私计算也不能解决数据的信任问题。
区块链的共识计算解决的是数据的确权问题,即不可篡改,不可复制。隐私计算解决的是数据在使用过程中的隐私保护问题,即数据的可用不可见。
现有隐私计算常用技术有:
- 联邦计算
- 多方安全计算(sMPC)
- 零知识证明
- 可信计算环境(TEE)
- 秘密分享
- 混淆电路
- 不经意传输
- 同态加密
等等
四、一个全新的隐私计算解决方案
近几年,著名的密码学家、数据隐私保护技术权威-David Chaum
,在总结了他40多年在隐私保护技术和法律领域的探索后,推出了一个全新的隐私保护方案:xxnetwork。
该网络基于David Chaum
在2016年提出的高性能混合网络(mix network)解决方案cMix
,构建了一条底层的隐私保护的网络elixxir
,并在elixxir
上构建区块链praxxis
和隐私计算、隐私通讯以及各种Dapp。与上述隐私计算技术强调在数据处理过程中保护隐私相比,xxnetwork
更像“地基”,即通过对元数据(metadata)的保护,从根本上实现“身份的可验证不可见”。
从“数据的可用不可见”到“身份的可验证不可见”,是隐私保护技术和方向的一大突破。
从我国对数据隐私保护的司法实践来看,一般对用户身份的保护重于对数据内容的保护。比如《网络安全法》中规定“经过处理无法识别特定个人且不能复原的数据(即数据脱敏),可以在未经被收集者同意情况下,向他人提供”(第42条)。xxnetwork
是实现这种保护的最佳技术解决方案。很多建立在区块链技术上的DID(Decentralized ID)方案也在探索“身份的可验证不可见”,但xxnetwork
方案更注重隐私保护,更底层。
更有意思的是,由于xxnetwork
对身份信息(公钥)做了有效保护,在网络上不再暴露公钥,这意味着随时可能出现的量子计算机失去了用户之地。因为量子计算机的攻击方式是能从公钥计算出私钥,从而彻底击垮现有建立在公私钥密码学基础上的网络系统。作为当代公钥密码学开创者之一,David Chaum
非常清楚量子计算机对公钥密码体系的巨大威胁,也非常清楚在量子计算机这杆“矛”未出现之前,建造任何“盾”都是徒劳的。于是干脆通过隐私保护技术,把公钥“藏”起来。通过这种方式,巧妙的实现了“抗量子计算”。
经过多年的研发和优化,目前xxnetwork已经达到500多个节点在线计算,TPS超过8000,网络延迟约2秒,24小时数据吞吐量超过700多G。
点击这里https://dashboard.xx.network,查看xxnetwork实时数据。
以上数据吞吐量主要由已经上线的聊天工具xxmessage
产生,MPC和智能合约功能将于今年下半年上线,届时,将首次实现对智能合约的隐私保护,有效保护合约的调用参数,返回值以及合约部署人、调用人等。这将在区块链行业中具有革命性意义,我们将告别以太坊等主流区块链上无法保护用户隐私的现状,开启全新的具有隐私保护的Web3.0新世界。