1月28日,iDASH-2021国际隐私计算大赛结果正式公布,腾讯云Angel PowerFL和腾讯安全联合项目团队提交的方案,凭借领先的模型准确率和最快的推理速度获得差分隐私赛道冠军。在2020年的iDASH 可信计算赛道上,腾讯云也斩获冠军,成为中国企业届首次在可信计算(SGX)赛道上夺冠的技术团队。
iDASH比赛是隐私计算国际最权威的比赛,已经举办八届,是由美国国立卫生研究院 (NIH) 主办,专注于云环境下的隐私计算问题和面向隐私保护的机器学习问题,已成为全球基因组数据隐私保护和安全共享领域最高规格的国际竞赛。
历年来,iDASH国际隐私计算大赛吸引了包括麻省理工学院、耶鲁大学、谷歌、IBM等在内的学界及业界的顶尖团队参赛。今年更有EPFL、华盛顿大学、天普大学、新加坡A*STAR、IBM、三星集团等在内的来自15个国家的69支参赛队伍参与角逐,在区块链、同态加密、差分隐私三个赛道中展开比拼。
其中,在差分隐私赛道,大赛组委会要求参赛团队实现基于差分隐私的两方横向联邦学习模型训练,用于通过已知表型样本预测野生型转甲状腺素蛋白淀粉样心肌病。这里的主要挑战是要满足差分隐私要求,训练数据具有很稀疏的特征,并且两方拥有的数据是非独立同分布的。
值得一提的是,今年iDASH-2021差分隐私赛道吸引了来自世界各地的30个顶级团队报名参与竞逐,其中有9个参赛团队提交了技术方案和实现代码,并获得了有效的比赛成绩。腾讯云AngelPowerFL和腾讯安全联合团队提交的技术方案在合理的时间内完成了满足差分隐私要求的两方联邦学习模型训练,获得了领先的模型准确率,且具有最快的模型推理速度。
在实际应用中,离线模型训练可以在允许的时间内完成,而在线模型推理需要最优速度,且模型准确率(或AUC)是首要指标。在腾讯提交的方案里,首先,联邦学习各参与方利用指数机制筛选重要特征用于建模,从而提高模型准确率和加快模型推理。其次,参与方在其本地基于所选择的特征生成多个逻辑回归模型,并基于指数机制选择模型发送给对方。最后,参与方通过对多个模型输出结果进行平均的方式生成联邦集成学习模型。传统的基于联邦平均的联邦学习方案不能很好的处理非独立同分布数据,会导致联邦模型效果差。腾讯提供的联邦集成学习方案,可以有效应对非独立同分布数据问题,提升联邦模型的准确率。
据了解,腾讯Angel PowerFL团队是国内较早开展联邦学习研究和应用的团队,在大数据、分布式计算、分布式机器学习、分布式消息中间件、安全多方计算、密码学等领域都有丰富的研发和应用经验,已发表近10篇联邦学习研究论文,提交了50多件联邦学习技术发明专利申请,完成多个商用隐私计算和联邦学习的产品研发。
腾讯云安全隐私计算平台Angel PowerFL源于腾讯的大数据和安全技术生态,支持超大规模数据量的多方联合建模和联合统计分析,拥有高性能和高容错性,且不依赖于可信中心节点,目前已经在腾讯内外部众多业务场景中落地应用,并取得了良好的效果。