一个很自然的想法:A-A-A-A-B ,按权重顺序依次分配,同时计数,每分配1次,计数减1,减到0后,再分配『次权重』的服务器。
看上去好象也凑合能用,但如果A:B的权重是100:1,A-A…-A-…(100次后),才分到B,B要坐很长时间的冷板凳,这显然不太好。
于是就有了个这个算法,它的思路如下:
初始状态时,配置的权重为:{A:80, B:20},然后给每个服务器,加1个动态的当前权重(curWeight),默认为0,按以下步骤:
1、curWeight += weight (注:weight为配置的权重)
2、挑选curWeight最大的,做为本次分配的结果,然后将curWeight -= sum(weight) ,即:分到的服务器,其动态权重- sum(配置权重)
3、开始下1次分配,分配前将每台服务器上的curWeight += weight(即:重复步骤1)
不断重复上述过程即可,下面分解下具体过程:
weight 初始状态:{80, 20},curWeight初始状态:{0,0}
次数 curWeight += weight max(curWeight) curWeight -= sum(weight) 1 {0,0}+{80,20} = {80,20} 80,即A {80 – 100 ,20} = {-20, 20} 2 {-20,20}+{80,20} ={60,40} 60,即A {60-100 ,40} = {-40, 40} 3 {-40, 40}+{80,20}={40,60} 60,即B {40, 60-100} = {40, -40} 4 {40, -40}+{80,20}={120,-20} 120,即A {120-100,-20} = {20, -20} 5 {20, -20}+{80,20}={100,0} 100,即A {100-100,0} = {0,0}
注:所有服务器curWeight归0时,这一轮分配就结束,
下次又回到原点,开始轮回
所以,最终分配的顺序就是 A – A – B – A – A,比原来的A – A – A – A – B ,是不是更为合理? 这个算法巧妙的地方在于,每一轮分配完成,所有服务器的动态权重都会归0,回到初始状态!另外1个优势在于,它能让所有权重的服务器,尽早分配到,而非等到高权重的服务器分配完,才轮到自己。
想想这其中的数学原理也不复杂,每次分到的服务器,其curWeight 减掉了 配置权重的总和sum(weight),然后下次分配前,又将配置权重加回来了,所以一减一加,正好抵消。
理解其中的原理后,用java代码来实现一把:
先定义一个服务器类:
然后开干:
输出:
A A B A A
A A B A A
最后扩展一下,这个算法不仅仅可用于负载均衡,很多业务系统也能用到,比如:在线客服系统,当有客人来咨询时,系统会从空闲的客服列表里,分配一个适合的客服来为其服务。因为客服的业务能力不同,能力强的客服可以配置更高权重,多分一些进线给他,反之新人就少分配一些,只要为客服的权重标签设置不同的值即可。
Original: https://www.cnblogs.com/yjmyzz/p/15916460.html
Author: 菩提树下的杨过
Title: 算法练习(20)-平滑加权轮询算法
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/547815/
转载文章受原作者版权保护。转载请注明原作者出处!