【流行前沿】QSFL: A Two-Level Uplink Communication Optimization Framework for Federated Learning

2023年6月4日下午1:40 • 人工智能 • 阅读 62

今天分享一篇研究模型细粒度传输的联邦学习文章，作者Liping Yi来自于南开大学，发表在ICML 2022。

故事的起源还是来自于深度网络越来越大，导致上行链路达到了TB级别，这对于低带宽的无线上行链路来说太难传输了，因此要对通信过程进行优化。作者总结了现有的communication-effective schemes，也就是delaying communication, sampling clients, encoding models, sparsification, quantization，然后说这些都不行。这里就有点牵强，明明有部分效果还不错而且也有理论分析的。那这篇文章呢，就提出了更进一步的传输方式，主要是两个level：

接下来根据这两个部分分别讨论。

用户质量的刻画使用了 贡献度和 相关性的加权平均，具体表达式为

在贡献度方面，文章是选取loss大的用户而不是loss小的用户。按理说loss越小模型越好，但是文章的解释是loss越大，梯度下降越大，收敛速率越快。此时舍弃一些已经训练到小loss的用户，对整体的loss下降没什么影响。其实也有道理，因为大loss表示这个用户急待更新，将其作为上传的组成是合理的。

在相关性方面，文章比较了用户梯度与上一轮全局梯度在方向上的差异。文章的解释是梯度符号的一致性能够保证一致的梯度方向，因此收敛速率会加快。这个选择确实能很快收敛到至少一个方向上的最优点，对于iid的时候应该是很有效的。

总之，这两个方法都是为了比较快的让所有用户都达到收敛条件。

模型先被切分为若干帧，然后每个用户传一帧。需要确保上传的帧数不小于上传用户的帧数，这样模型才能完整传输。还有一个trick是，上传帧的时候，其ID的计算是((client id + round)\%NS)，因此每个用户相邻两次上传都是一个模型的相邻两个部分，具有很强的相关性。估计这样的原因是为了让整体模型没有比较大的抖动，在训练上保持了一致性。

首先文章只证明了帧传输技术是收敛的，对于用户选取没有证明（毕竟这个太麻烦了）。文章的证明思路来源于”randomly discarding a fraction of the gradients/parameters”。猜测这个证明思路应该是先分析模型传输部分时带来的向量，然后结合到收敛框架中作为一个项。其实这也打开了一种思路，不管是什么天花乱坠的操作方法，只要以距离为起点，应该就能推出来收敛界。

另外在优化超参的时候，文章直接用了GA，这方面没什么好说的。

文章开源了官方代码，让人非常感动，就冲这份勇气也要好好扒一下这个代码！

扒了一下午，失败了。今晚看懂Flask，下次开一篇重新讲，

文章用了bash文件来进行批处理，看来这个是常规操作，也需要学。

另外仿真结果还是有一点值得说一下。仿真的用户数量上，文章选取了(C ∈ {10, 20, 30, 40, 50})。注意单独的帧传输几乎是不受用户数量影响的，但是在用户选取的时候，只有在用户数量超过40的时候才没有震荡。也就是说，更新步子不能太大，否则会扯着蛋；另外就是iid的冗余度太高了，确实不太需要传输这么多类似的模型参数。

另外这个收敛速率肯定是会慢一点的，作者也承认了不过就没做实验，具体有多慢就不知道了。

这篇文章展示的一个趋势是多种communication-efficient技术的交叉使用。在这篇文章里，就综合应用了client sampling, uploading delaying, sparsification三种方式。目前来看自己在代码上面还差得比较多，就快速理解复现上面还做得不太行。还得多看多想才行。

Original: https://www.cnblogs.com/mhlan/p/16491657.html
Author: 木坑
Title: 【流行前沿】QSFL: A Two-Level Uplink Communication Optimization Framework for Federated Learning

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/568154/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

丰收互联蓝牙key怎么开机_【测评】百元性价比之王，Redmi AirDots2 蓝牙耳机

新品测评米家在你的生活中，你会遇到各种各样的人，他们大多只是相遇或擦肩而过，有人会成为你生命中某个阶段的一道风景，真正陪你走到最后的人必须和你有同样的灵魂–有趣和有爱…

人工智能 2023年5月27日
00210
分类-决策树

决策树中的叶子节点代表决策的结果，决策的结果是根据树的根节点到该叶子节点的路径上的一系列问题来决定的。决策树模型的核心问题是如何根据训练数据自动生成决策树。数据示例：决策树： ; …

人工智能 2023年7月2日
0097
VAE生成模型（附VAE实现mnist代码）

本文是在基于此博客上的转载，如有讲述不清楚的地方，推荐原博客【学习笔记】生成模型——变分自编码器自编码器AE 自编码器是一类在半监督学习和非监督学习中使用的人工神经网络，其功能…

人工智能 2023年7月20日
0063
【基于知识图谱的前后端（vue+django）分离的问答系统的设计与实现（一）：总体介绍】

基于知识图谱的前后端（vue3+django）分离的问答系统的设计与实现基于知识图谱的前后端（vue3+django）分离的问答系统的设计与实现（一）：总体介绍基于知识图谱的前后…

人工智能 2023年5月27日
00110
Python 计算机视觉（八）—— OpenCV 进行图像增强

参考的一些文章以及论文我都会给大家分享出来 —— 文章链接就贴在原文，论文我上传到资源中去，大家可以免费下载学习，如果当天资源区找不到论文，那就等等，可能正在审核，审核完后就可以下…

人工智能 2023年7月4日
0073
SVM ValueError: y should be a 1d array, got an array of shape (1, 250) instead. Found input variable

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！文章目录阅读前请看一…

人工智能 2023年7月29日
0068
10行代码集2000张美女图，Python爬虫120例，再上征途

《Python 爬虫 120 例》专栏简介 Python 爬虫 100 例教程，编写自 2018-07-30 到 2020-10-28，将近 800 天，至今依旧是 Python …

人工智能 2023年7月3日
0062
目标检测：RCNN-＞Fast RCNN-＞Faster RCNN

一、RCNN RCNN（Region with CNN feature）是深度卷积神经网络应用于目标检测问题的一个里程碑的飞跃。2014年提出的，之前都是传统的检测算法。算法步骤…

人工智能 2023年7月12日
0055
【K-Means】基于经纬度的城市聚类

文章目录 1. 项目准备 * 1.1. 问题导入 1.2. 数据集简介 2. K-Means算法 * 2.1. 算法特点 2.2. 算法流程 2.3. 算法缺陷 2.4. 算法改进…

人工智能 2023年6月2日
0084
数据清洗及特征处理

数据清洗及特征处理导入numpy、pandas包和数据 import numpy as np import pandas as pd df = pd.read_csv(‘trai…

人工智能 2023年7月8日
0084
NumPy 数组的组合和拆分操作

一、数组的组合参数： a1, a2, …：sequence of array_like，除了将被对应的轴之外，数组必须是相同的形状； axis：int, optional，将…

人工智能 2023年6月11日
00183
Pandas中的连接函数汇总

如有错误欢迎指正~ 在数据分析的过程中数据的重构是非常重要的，本篇文章将详细讲解pandas中四个重要的连接函数：concat(), merge(), join(), append…

人工智能 2023年7月9日
0060
如何使用OpenCV在图像中抠出指定的颜色区域

1 简要说明及流程我们往往需要在图像中抠出指定颜色的区域。在实际工况下这种指定颜色不是简单的纯色，往往难以单一的用R G B的某个范围值去确定。本文以PhotoShop为基准,…

人工智能 2023年7月19日
0043
数据挖掘算法——序列模式

目录序列模式挖掘简介问题定义序列模式挖掘的应用背景应用案例：客户购买行为模式分析应用案例：疾病诊断序列模式挖掘算法概述类Apriori算法基于划分的模式生长算法 G…

人工智能 2023年7月17日
0050
个人总结的三种Python读取txt文件（高效快捷）

不管什么时候，读取txt文件，并生成一个完美的DataFrame数据结构，对我来说都是一项较为艰难的工作。接下来我分享三种比较简单实用的方法，是我自己长期揣摩的方法： read_…

人工智能 2023年7月7日
00100
【机器学习】多项式回归案例四：员工职位与薪回归模型分析

员工职位与薪资多项式回归模型 3 多项式回归 * 案例四：员工职位与薪资多项式回归模型 – 3.1.1 模块加载与数据读入 3.1.2 数据可视化 3.1.3 模型创建…

人工智能 2023年6月17日
00107

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【流行前沿】QSFL: A Two-Level Uplink Communication Optimization Framework for Federated Learning

大家都在看