mirror of
https://github.com/openmlsys/openmlsys-zh.git
synced 2026-04-14 18:39:49 +08:00
2.4 KiB
2.4 KiB
概述
为了解决“隐私保护”与“数据孤岛”这两大难题,联邦学习(Federated Learning,FL)应运而生。联邦学习的概念最早在2016年被提了出来,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。在联邦学习场景中,每个用户,被定义为客户端这一角色,使用各自的本地数据进行训练、模型更新、权重上传,并在中央服务器的协调下,多个客户端协作建立机器学习模型。
根据数据分布的不同,联邦学习可以分为跨设备(cross-device)与跨组织(cross-silo)联邦学习。一般而言,跨组织联邦学习的用户一般是企业、机构单位级别的,而跨设备联邦学习针对的则是便携式电子设备、移动端设备等。表:numref:differences-and-connections展示了两者的区别和联系:
| 跨设备联邦学习 | 跨组织联邦学习 | |
|---|---|---|
| 组网架构 | 由中央服务器和不同客户端之间的交互,且客户端之间没有直接联系。 | |
| 数据分布 | 不同客户端上的数据非独立同分布。 | |
| 主要瓶颈 | 客户端的计算性能以及中央服务器的内存 | 通信开销 |
| 客户端来源 | 不同的终端设备 | 不同的组织 |
| 客户端性能 | 较差 | 较好 |
| 客户端规模 | 较大 | 较小 |
| 客户端参与情况 | 不会参与所有联邦迭代 | 参与大部分联邦迭代 |
| 客户端状态 | 无状态 | 有状态 |
| 客户端可靠性 | 高度不可靠 | 相对可靠 |
🏷️differences-and-connections
下面就联邦学习中的要点:系统架构、联邦平均算法、隐私加密算法以及实际部署时的挑战进行详细描述。