随着全世界的开发团队争相开发ai工具,在边缘设备上训练算法变得越来越普遍。联合学习是分布式机器学习的子集,是一种相对较新的方法,它允许企业在不直接访问原始用户数据的情况下改进其ai工具。
联合学习由google在2017年提出构想,是一种去中心化的学习模型,通过该模型可以在边缘设备上训练算法。关于google的“设备上机器学习”方法,这家搜索巨头将其预测文本算法推到了android设备上,汇总了数据,并将新知识的摘要发送回了中央服务器。为了保护用户数据的完整性,此数据是通过同态加密或差分隐私传递的,这是对数据添加噪声以使结果模糊的一种做法。
一般而言,通过联合学习,可以对ai算法进行训练,而无需识别任何单个用户的特定数据。实际上,原始数据永远不会离开设备本身。仅汇总的模型更新会发回。这些模型更新随后在交付到中央服务器后解密。然后,将更新后的模型的测试版本发送回选定的设备,并且在重复此过程数千次之后,显着改善了ai算法,同时又不会危及用户隐私。
预计该技术将在医疗保健领域掀起波澜。例如,医疗初创公司owkin目前正在探索联合学习。为了利用来自多个医疗机构的患者数据,owkin使用联合学习来利用来自不同医院的数据来构建ai算法。这可能会产生深远的影响,尤其是医院在保持患者数据的完整性并遵守hipaa法规的前提下,能够相互共享疾病进展数据非常宝贵。绝非唯一的医疗行业采用这项技术。自动驾驶汽车公司,智慧城市,无人机和金融科技组织将越来越多地使用联合学习。其他一些联合学习型初创公司也正在上市,包括snips,s20.ai和xnor.ai,后者最近被apple收购。