当前,数字资产、数据保护等话题备受关注。8月20日,《个人信息保护法》正式颁布,并于11月1日起施行;9月1日,《中华人民共和国数据安全法》正式施行。业界认为,两部法规的落地,不仅将为数据资源安全保护提供法律依据,同时还将与《网络安全法》一起,共同构成中国网络法律体系的“三驾马车”。在此背景下,中国信息通信研究院云计算与大数据研究所所长何宝宏,分析数据保护的意义以及如何加速数据资产流通。
随着数字经济时代全面开启,信息的重要性日渐提升。何宝宏认为,当前,在物质世界和精神世界之外,信息作为“第三世界”正在崛起。《个人信息保护法》指出,个人信息就是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。“个人信息就是‘你的另一半’,是数字孪生的另一半。”何宝宏提出了这一新颖的观点。
简单理解,个人信息就是我们在数字世界的“孪生化身”,是另外一个世界里的我们。在何宝宏看来,《中华人民共和国数据安全法》和《个人信息保护法》的落地,意味着国家正在通过个人信息保护立法的方式保护数字世界的“我们”。
“除了法律法规,技术的发展和进步,也将为个人信息保护以及数据生产要素化提供有效途径。”何宝宏以当前正在快速兴起的隐私计算技术为例,隐私计算是在保护数据拥有者个人隐私的前提下,实现数据价值的流通及数据价值深度挖掘的一类重要方法。
何宝宏判断,以隐私计算平台为代表的多方安全计算环境,有望成为数据合规流通基础设施的关键一环,在保证安全的前提下有效持续释放数据要素价值,促进数字经济高质量发展。不过,今天的隐私计算行业仍处于规模商用前期,还需要在性能、不同技术的融合、场景化、透明度和信任等方面实现进一步提升,同时在一些非技术因素上形成相关配套。
当前,各行各业加速数字化转型步伐,数据正在加速生产要素化,即数据的价值属性日渐凸显。何宝宏表示,数据具有既代表信息又代表价值的双重属性,在处理数据时如何解耦信息和价值就变得至关重要。“正是在这一背景下,隐私计算和区块链技术正在加速融合。虽然两者目的不同,但都服务于数据价值的流通,服务于数据生产要素化,可谓天生一对。”他补充道。
“如果将数据比作车,那么网络基础设施就是路。”何宝宏介绍,当前的数据保护技术,更多是在“路”上想办法,比如防火墙、网闸、UTM等技术,就是“断路型”技术。一旦“路通了”,“开”着数据出去了,基础设施就很可能对数据失去了控制。因为担心失控,现在很多本该流动的数据被“圈养”在数据孤岛上,价值无法得到有效发挥,大数据长成了“数据巨婴”。
那么,一方面,是数字化浪潮下亟待数据流动和共享;另一方面,则是数据保护技术不够强健,不敢让数据“跑出去”。如何解决这个矛盾?何宝宏认为,可以尝试从数据这个“车”的本身想办法,即将“车”进行“武装”,将数据的信息属性和价值属性进行剥离,让数据要么“看得见信息但价值不能用”,要么“只是能利用价值却看不见信息”。
“可见不可得”,就是只释放出数据对应的信息,把数据对应的价值仍然控制在自己手里。典型代表技术是区块链,链上的每个人都能够看到链上数据的信息,但只是“吃瓜群众”,该数据对应的价值是控制在区块链上且可以有序流动的。
“可得不可见”,就是只释放数据可以产生的价值,数据对应的信息仍然控制在自己手里不公开。典型代表技术是隐私计算,每个人都可能从数据中获得价值,但数据本身是加密后的“盲盒”,原始数据仍然控制在拥有者手中。
何宝宏认为,随着大数据时代的到来,数据的语义日益丰富,数据只是“载体”,将数据的信息语义和价值语义分离,在“放飞”信息时牵牢价值的绳子(如区块链),或者在“放飞”价值时牵牢信息的绳子(如隐私计算),是非常重要的,但目前这两种技术尚处于发展初期,并且“数据要素”的技术家族还需要更多类似的技术。因此可以预见,未来会有更多相关技术诞生,我们即将迎来一个数据大爆炸的时代。
来源:人民邮电报
后记:
区块链+隐私计算
数据时代的信任机制与隐私保护
区块链技术是一种通过去中心化、高信任的方式集体维护一个可靠数据库的技术方案。由于具有“去中心化”、“分布式数据存储”、“可追溯性”、“防篡改性”、“公开透明”等优势特点,区块链技术能够有效解决数据领域的数据真实性、安全性与开放性问题,通过建立可信任的数据管理环境,防范和避免各类数据造假、篡改、遗失等数据管理问题,促进数据的高效共享与应用。
一如上文所述,区块链技术具有“信息数据共享和透明”的特点,但无论从市场商业竞争角度还是个人信息安全角度来看,都没有人希望自己的数据完全公开、透明。因此,隐私保护合规成为数据管理领域的一条重要“红线”,一方面保护着数据所有者的隐私安全,另一方面也影响着数据流通共享的效率与发展。
那么有没有一种技术既可以保证信息数据的高效流通共享,却又不会越过隐私保护合规红线?
图片
如果说“区块链”技术建立了数据时代的信任机制,那么“隐私计算”则在数据共享洪流中为数据所有者建立了安全的隐私保护防线。
“隐私计算”,即面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。简单来说,隐私计算即是从数据的产生、收集、保存、分析、利用、销毁等环节中对隐私进行保护的技术方法。
同区块链技术一样,隐私计算并不特指某一门技术,而是一种融合了密码学、数据科学、经济学、人工智能、计算机硬件、软件工程等多学科的综合技术应用。隐私计算包括一系列信息技术,如业界较早提出的安全多方计算(MPC)技术、以硬件技术隔离保护为主要特点的可信执行环境(TEE)技术、基于密码学和分布式计算实现多方协作机器学习的联邦学习(FL)技术,以及如同态加密、零知识证明、差分隐私等辅助性技术,都属于隐私计算范畴。
1
安全多方计算(MPC),是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。
2
可信执行环境(TEE),是指CPU的一个安全区域,它和操作系统独立开来,且不受操作系统的影响。在这个安全区域里保存和计算的数据不受操作系统的影响,是保密且不可篡改的。
3
联邦学习(FL),是指在多方在不共享本地数据的前提下,进行多方协同训练的机器学习方式。联邦学习技术支持数据不出域,而是让算法模型进行移动,通过数据训练进而优化算法模型。
隐私计算技术的目的在于让数据在流通过程中实现“可用不可见”,即只输出数据结果而不输出数据本身。这一方面保证了数据所有者的数据所有权不受侵犯,满足数据流通的合规性;另一方面在隐私保护技术加持下,各方主体拥有的信息数据能够高效流通使用,不断扩大数据价值,赋能各个行业领域数据应用。
举例如在医疗数据领域,各类医疗数据的隐私性要求较高、数据量较大,通常只保存在本地机构的信息系统中,很难实现高效的医疗数据流通、共享与使用,无法为医疗领域的各类病理研究、医疗诊断与技术创新形成数据支持,不利于创新医疗技术研发与应用。
但如果能通过隐私计算技术支持,在保证数据“可用不可见”的前提下,实现不同区域、不同医疗机构医疗数据的高效流通使用,持续优化医疗行业的各类算法模型,将为实现医疗行业的精准医疗、远程医疗、智能医疗等医疗技术服务创新形成强力数据支持。
![]() |
地址:河北省365bet假网站_世界杯365软件_365 体育投注广阳道39号国土资源大厦 065000 联系电话:0316-2237138 主办:365bet假网站_世界杯365软件_365 体育投注自然资源和规划局 维护单位:365bet假网站_世界杯365软件_365 体育投注自然资源和规划局信息中心 版权所有,未经授权,禁止转载 冀ICP备19031506号-4 冀公网安备 13100302000692号 网站标识码 1310000025 网站地图 |