基于机器学习的数据脱敏系统研究与设计
3 脱敏任务配置
在完成脱敏策略制定后,为使脱敏任务能够长时间工作,首先需在脱敏系统中对源数据所在业务系统的地址及端口号进行注册[14]。然后,获取已制定的脱敏策略,脱敏系统按照选择的脱敏算法及相关参数生成脱敏代码。用户根据应用场景选择脱敏实现方式,对于静态脱敏,系统先执行脱敏操作,并将脱敏结果缓存在本地存储,待目标系统需要获取脱敏数据时,用户在脱敏系统中注册目标系统的地址及端口,最后将本地脱敏数据传输至目标系统。而对于动态脱敏,用户必须先在脱敏系统中注册目标系统地址、端口以及目标系统使用账号,然后将脱敏代码下发至代理服务器,由代理服务器进行在线数据脱敏,并将脱敏结果返回至脱敏系统,最后传输至目标系统,由目标系统中的数据需求方的账号使用。脱敏任务配置流程如
4 应用验证
本文以营销业务应用系统数据库中的实收电费信息表为例[15],分析人员希望通过分析某一用电用户的欠费历史,对该用户的用电行为进行评估。实收电费信息表中涉及的用户用电欠费信息和缴费信息均为敏感信息,因此在使用数据表进行分析之前,应对其进行脱敏处理。
在明确敏感信息后,脱敏实现的关键点为脱敏算法的选择。脱敏算法选择决策树如
欠费信息是统计分析的对象,数据应具有可用性和真实性。同时,由于是分析某一用户,因此用户编号字段和欠费信息间的对应关系不能被破坏,数据需要具有关联性,而时效性、可重现和可配置3个因素在这里则无关紧要。因此,综合考虑因素分析,系统用户可按照
在系统用户完成静态脱敏任务配置后,脱敏系统可按照选择的脱敏策略对实收电费信息表进行脱敏,待分析人员的目标地址及端口在脱敏系统中注册后,即可将脱敏表从本地缓存传给用于分析的目标系统。
5 结语
数据脱敏将成为大数据时代企业数据化运行维护的必要安全机制。本文从国家电网公司信息化建设实际情况出发,分析并提出了一种数据脱敏系统设计方法,探讨利用机器学习方法使脱敏过程更加系统化、智能化、专业化,并结合实际应用场景验证了脱敏策略制定功能。随着未来对数据脱敏的进一步研究,脱敏系统将可实现更细粒度的访问控制、更精确的需求理解能力、更强的扩展能力以及更友好的交互方式,从而满足更多跨系统、跨专业、跨行业的数据交互、共享和融合需求。
责任编辑:售电衡衡
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网
-
新基建助推 数据中心建设将迎爆发期
2020-06-16数据中心,能源互联网,电力新基建 -
泛在电力物联网建设下看电网企业数据变现之路
2019-11-12泛在电力物联网 -
泛在电力物联网建设典型实践案例
2019-10-15泛在电力物联网案例
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
能源革命和电改政策红利将长期助力储能行业发展
-
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网 -
5G新基建助力智能电网发展
2020-06-125G,智能电网,配电网 -
从智能电网到智能城市