Files
openmlsys-zh/chapter_federated_learning/overview.md
2022-03-11 16:25:37 +08:00

2.4 KiB
Raw Blame History

概述

为了解决“隐私保护”与“数据孤岛”这两大难题联邦学习Federated LearningFL应运而生。联邦学习的概念最早在2016年被提了出来能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下进行数据使用和机器学习建模。在联邦学习场景中每个用户被定义为客户端这一角色使用各自的本地数据进行训练、模型更新、权重上传并在中央服务器的协调下多个客户端协作建立机器学习模型。

根据数据分布的不同联邦学习可以分为跨设备cross-device与跨组织cross-silo联邦学习。一般而言跨组织联邦学习的用户一般是企业、机构单位级别的而跨设备联邦学习针对的则是便携式电子设备、移动端设备等。表:numref:differences-and-connections展示了两者的区别和联系:

跨设备联邦学习 跨组织联邦学习
组网架构 由中央服务器和不同客户端之间的交互,且客户端之间没有直接联系。
数据分布 不同客户端上的数据非独立同分布。
主要瓶颈 客户端的计算性能以及中央服务器的内存 通信开销
客户端来源 不同的终端设备 不同的组织
客户端性能 较差 较好
客户端规模 较大 较小
客户端参与情况 不会参与所有联邦迭代 参与大部分联邦迭代
客户端状态 无状态 有状态
客户端可靠性 高度不可靠 相对可靠

🏷️differences-and-connections

下面就联邦学习中的要点:系统架构、联邦平均算法、隐私加密算法以及实际部署时的挑战进行详细描述。