文档简介:
技术优势
联邦学习是关注跨机构跨组织的大数据合作场景,提出的“电信数据+”的解决方案,在不泄露任何个人隐私数据的基础上,将电信数据和其他领域数据结合起来,将新方法应用到老场景,比如风险控制、精准营销等。可以在不同数据结构、不同机构间发挥作用,没有领域和算法限制,同时具有模型质量无损、保护隐私、确保数据安全的优势。
1.数据隔离,数据不会泄露到外部,满足用户隐私保护和数据安全的需求。
2.能够保证模型质量无损,不会出现负迁移,保证联邦模型比割裂的独立模型效果好。
3.参与者地位对等,能够实现公平合作。
4.能够保证参与各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。
5.产品扩展能力强,除了基础联合建模分析外,还可以提供定制化的模型指标分析、算法实现、联邦学习大数据解决方案等服务。
合规安全优势
中国电信践行央企责任,严格遵守各项国家法律法规,专业安全部门按照最高标准进行数据资源管理,数据安全有保障。
1.数据隐私加密能力。基于加密分布式机器学习系统,保障隐私数据安全。应用技术路线包括:
a.同态加密技术:同态加密允许在不知道解密密钥的情况下对密文进行有效操作。加法同态加密定义了两个数值加密后相加等于他们相加之后再加密;乘法同态加密定义了一个已知的数值与加密后的数值相乘等于他们相乘之后再加密。即
- [[·]]代表同态加密
- 加法同态加密:[[a]]+[[b]] = [[a+b]]
- 乘法同态加密:5x[[a]] = [[5xa]],其中5可以是任何已知的数
b.密码算法库:平台底层提供多种必需的密码算法或协议,包括基于RSA的盲签名、Paillier加法同态加密、基于算术秘密分享的安全多方计算等。
基于RSA的盲签名用于构建安全求交协议,实现参与方之间样本或特征的对齐,避免交集之外的样本标识或特征标识泄露给其他参与方。
Paillier加法同态加密用于建模过程中的中间变量的加密保护和密态运算,提供密态加法、系数倍乘等关键运算功能。
安全多方计算协议用于构建参与方之间无可信中间方的安全计算,用以去除某些联邦机器学习算法中存在的协调方角色。
2.加密数据联合建模分析。联邦学习平台可实现远程服务器组件配置及模型搭建,加密后的数据可以不出本地,并远程高效便捷操作。
合作用户在不同业态下的特征联合,在传统的机器学习建模过程中,需要将两部分数据集中到一个数据中心,然后再将每个用户的特征合并成一条数据用来训练模型,所以就需要双方有用户交集并有一方存在数据标签。