1 引言
在当前的大数据时代,各类数据分析应用技术已经广泛应用在国家治理、企业运行、个人日常生活等各个方面,数据成为时下最热门的基础资源,因此数据安全的受关注程度也在不断攀升,成为颇受重视的话题。
近年来,在国际上数据安全事件频发,尤其是数据泄露事件,根据Risk Based Security于2019年下半年发布的数据,整个2019年上半年发生数据泄露事件3800余起,相对于2018年同期数据增长了54%。数据泄露事件通常还会带来显式或隐式的经济损失,安全研究中心Ponemon Institute和IBM Security联合发布的《2019年数据泄露成本报告》中指出,超过100万条记录的泄露预计会给企业带来4200万美元的损失,当泄露记录超过5000万条时,预计带来的损失将达到3.88亿美元[1]。
安全事件的不断爆发,以及事件背后相应可能带来的潜在重大危害和巨额损失,不断驱使着国家、行业、企业等各层面更加重视数据安全,并开始从法规、标准、制度等方面切入展开相应举措。欧盟在2018年出台《通用数据保护条例》(GDPR),规定了企业如何收集、使用和处理欧盟公民的个人数据。2019年5月28日,国家互联网信息办公室发布的《数据安全管理办法(征求意见稿)》中,明确要求对于个人信息的保存和提供要经过匿名化处理,以切实降低在数据应用中个人信息可能存在的泄露风险[2]。
2 数据脱敏技术
数据脱敏技术是一种可以通过数据变形方式对于敏感数据进行处理,从而降低数据敏感程度的一种数据处理技术。适当地使用数据脱敏技术,可以有效地减少敏感数据在采集、传输、使用等环节中的暴露,降低敏感数据泄露的风险,尽可能降低数据泄露造成的危害。根据不同的数据脱敏规则和算法,可以对特定敏感数据使用若干种数据变形方式进行组合处理,在不同程度上降低数据的敏感程度,在较为严格的脱敏规则和算法下可实现匿名化处理。
数据脱敏技术本质上是对于数据的变形处理,因此数据脱敏技术的另一大特点是能够在一定程度上保持数据原本的一些特性,使脱敏后的数据依旧存在可用性。针对整个数据集使用统一的脱敏处理算法,可以保证在降低数据敏感程度的同时,数据集整体的统计特性、数据唯一性不发生改变,从而能够继续满足关联分析、机器学习、即时查询等应用场景的使用需求。
2.1 数据脱敏算法与匿名化方法
在实际应用数据脱敏技术时,常常会涉及到脱敏算法、脱敏规则、脱敏策略3 个不同的概念。
数据脱敏技术的核心是通过对敏感数据进行变形处理以降低其敏感程度。其中,在脱敏处理过程中使用的特定数据变形方式为脱敏算法。在原始脱敏算法的基础上,通过将一种或多种脱敏算法的组合应用在一种特定的敏感数据上便形成了脱敏规则。在具体的业务场景中,根据不同业务场景选择特定一系列脱敏规则可称为脱敏策略。
对于数据脱敏技术以及实现数据脱敏的应用及工具,数据脱敏算法均是其中的核心能力,常见的脱敏算法包括加密、掩码、替换、模糊等。
在上述提到的基础脱敏算法之外,为了实现更高程度的敏感信息保护能力,尤其是达到特定水平的敏感程度降低,还存在
转载请注明:IT运维空间 » 安全防护 » 数据安全事件频发的当下,数据脱敏技术发展趋势如何?
发表评论