https://www.jianshu.com/p/723a5755daf0
nginx集群原理
- 利用虚拟IP,将同一个虚拟IP绑定到多个实际网卡上的IP,形成访问一个虚拟IP时,实际访问的是多个实际IP。每个实际IP对应一个nginx服务。
keepalived 交换机制软件
- Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
- VRRP协议:VRRP全称 Virtual Router Redundancy Protocol,即 虚拟路由冗余协议。可以认为它是实现路由器高可用的容错协议,即将N台提供相同功能的路由器组成一个路由器组(Router Group),这个组里面有一个master和多个backup,但在外界看来就像一台一样,构成虚拟路由器,拥有一个虚拟IP。
keepalived虚拟IP切换的原理如下:
- 正常情况下,用户通过虚拟IP是直接访问到Keepalived-Master的(没有成为Master的就是Backup);
- 成为Master的Keepalived,会每秒向所有的Backup发送VRRP包,通告自己是主,且运行正常;
- 当Master因为网络原因或者是别的原因导致与集群断开之后,Backup会在3.6秒左右(以优先级100为例,计算公式为3 × 1 + 256 × (256 – 100))认定Master宕机;
- 如果是多播的情况下,Master宕机,那么剩余的Backup要通过选举产生新的Master
- 如果是单播,则由剩下的Bakcup直接作为新的Master。
选举机制如下:
- keepalived中优先级高的节点为MASTER。MASTER其中一个职责就是响应VIP的arp包,将VIP和mac地址映射关系告诉局域网内其他主机,同时,它还会以多播的形式(默认目的地址224.0.0.18)向局域网中发送VRRP通告,告知自己的优先级
- 网络中的所有BACKUP节点只负责处理MASTER发出的多播包,在抢占模式下,当发现MASTER的优先级没自己高,或者没收到MASTER的VRRP通告时,BACKUP将自己切换到MASTER状态,然后做MASTER该做的事:响应arp包和发送VRRP通告
- 如果在同一个广播域的同一个VRRP组内出现了两台Master路由器,那么它们收到对方发送的VRRP通
 告报文之后,将比较自己与对方的优先级,优先级的值更大的设备胜出,继续保持Master状态,而
 竞争失败的路由器则切换到Backup状态。
- 如果这两台Master路由器的优先级相等,那么接口IP地址
 更大的路由器接口将会保持Master状态,而另一台设备则切换到Backup状态。
Nginx + Keepalived 搭建(实现主备切换)
- 原理图
 原理图 原理图
环境准备
- Centos 7 x86_64系统2台,实际IP分别为:192.168.250.102 和 192.168.250.103
- nginx version: nginx/1.20.2
- Keepalived v1.3.5 (03/19,2017)
- 虚拟IP设置为:192.168.250.250
- Keepalived Master 在192.168.250.102机器上,Backup 在192.168.250.103机器上。
安装nginx 和 keepalived
- nginx 安装自行查阅,不赘述
- keepalived 安装:yum install -y keepalived即可
keepalived配置
- keepalived配置文件在:/etc/keepalived/keepalived.conf(有可能跟我不一样,自行确认一下)
- Master(192.168.250.102机器上是master)配置信息如下
#全局配置
global_defs {
   #启用脚本安全
   enable_script_security
}
# 调整优先级脚本
vrrp_script chk_nginx {
    # shell脚本路径
    script "/etc/keepalived/chk_nginx.sh"
    #执行脚本的用户名
    user root
    # 脚本执行间隔时间(单位s)
    interval 2
    # weight 大于0
    #       如果脚本监测失败,优先级不变,如果成功,优先级增加,
    #       如果后续监测失败,则优先级在增加的基础上回退,
    #       这个weight不会持续增加或减小,只会存在两个值
    # weight 小于0
    #       如果脚本监测失败,优先级降低,
    #       如果成功,优先级不变,
    #       这个weight不会持续增加或减小,只会存在两个值
    weight -30
}
# 虚拟IP配置
vrrp_instance VI_1 {
    # 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP)
    # 都设置为BACKUP,首先启动的作为Master
    state MASTER
    # 虚拟IP绑定网卡 值为:网卡名称(注意:改成自己机器网卡)
    interface ens33
    # 主、备服务器的 virtual_router_id需要一致
    # 虚拟路由id,这个id在整个局域网中需要唯一
    virtual_router_id 99
    # 优先级(主大备小)master优先级大于backup
    # 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换
    # 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换
    priority 120
    # VRRP广播的时间间隔
    advert_int 1
    # keepalived认证,类型有AH加密和PASS明文
    # 密码,集群中保持一致,且取前8个字符
    authentication {
        auth_type PASS
        auth_pass 123456
    }
    # 绑定本机实际IP
    unicast_src_ip 192.168.250.102
    # 其他 keepalived ip地址
    unicast_peer {
        192.168.250.103
    }
    #虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip)
    virtual_ipaddress {
        192.168.250.250
    }
    # 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置)
    track_script {
        # 脚本名称
        chk_nginx
    }
}
- Backup Keepalived配置
#全局配置
global_defs {
   #启用脚本安全
   enable_script_security
}
# 调整优先级脚本
vrrp_script chk_nginx {
    # shell脚本路径
    script "/etc/keepalived/chk_nginx.sh"
    #执行脚本的用户名
    user root
    # 脚本执行间隔时间(单位s)
    interval 2
    # weight 大于0
    #       如果脚本监测失败,优先级不变,如果成功,优先级增加,
    #       如果后续监测失败,则优先级在增加的基础上回退,
    #       这个weight不会持续增加或减小,只会存在两个值
    # weight 小于0
    #       如果脚本监测失败,优先级降低,
    #       如果成功,优先级不变,
    #       这个weight不会持续增加或减小,只会存在两个值
    weight -30
}
#虚拟IP配置
vrrp_instance VI_1 {
    # 表示当前是主服务器 还是 备份服务器(如果是备份服务器,则值为BACKUP)
    # 都设置为BACKUP,首先启动的作为Master
    state BACKUP
    # 虚拟IP绑定网卡 值为:网卡名称(注意:机器网卡)
    interface ens33
    # 主、备服务器的 virtual_router_id需要一致
    # 虚拟路由id,这个id在整个局域网中需要唯一
    virtual_router_id 99
    # 优先级(主大备小)master优先级大于backup
    # 当待出现脚本执行错误时,keepalived会自行调整优先级,形成主备切换
    # 注意 优先级跨度不要超出weight的值,否则出现错误后,无法形成主备切换
    priority 110
    # VRRP广播的时间间隔
    advert_int 1
    # keepalived认证,类型有AH加密和PASS明文
    # 密码,集群中保持一致,且取前8个字符
    authentication {
        auth_type PASS
        auth_pass 123456
    }
    # 绑定本机实际IP
    unicast_src_ip 192.168.250.103
    # 其他 keepalived ip地址
    unicast_peer {
        192.168.250.102
    }
    #虚拟IP地址(启动后使用ip add命令,能看到interface的网卡下存在绑定的虚拟ip)
    virtual_ipaddress {
        192.168.250.250
    }
    # 执行的script脚本,当脚本执行失败,则降低优先级(脚本在vrrp_script配置)
    track_script {
        # 脚本名称
        chk_nginx
    }
}
keepalived中执行的 chk_nginx.sh脚本
- 脚本文件用户和用户组要设置成keepalived.conf中的用户(我的是root)
- chk_nginx.sh脚本文件注意修改权限(最好改成- 0755防止- keepalived无法执行)
- chk_nginx.sh脚本文件路径要与- keepalived.conf配置保持一致
- 脚本内容如下:
#!/usr/bin/bash
#统计nginx 命令启动的进程数有几个
PIDS=`ps -C nginx --no-header | wc -l`
if [ $PIDS -eq 0 ]; then
    # 如果没有nginx进程,利用exit退出带正数,表示有错误退出
    # 那么keepalived认为此次脚本执行错误
    # # 这里可以加 重启nginx逻辑 如下:
    # # 如果重启后还是没有nginx进程,则脚本带错误退出
    #/usr/local/bin/nginx -c /opt/nginx/conf/nginx.conf
    # #等待3s
    #sleep 3
    #IDS=`ps -C nginx --no-header | wc -l`
    #if [ $PIDS -eq 0 ]; then
    #   exit 127
    #else
    #   exit 0
    #fi
    # 为了演示主备切换,就不设置重启nginx逻辑,直接返回脚本执行错误
    exit 127
else
    exit 0
fi
nginx配置(略)
- 请自行上网查阅
- 至此搭建结束,下面进入测试
Nginx + Keepalived 集群测试
准备工作:
- 我们在 192.168.250.102和103上分别启动nginx 和 keepalived(注意:先启动nginx,否则keepalived会发生主备切换)
- nginx :启动/停止,自行查阅
- keepalived 启动命令:keepalived -f /etc/keepalived/keepalived.conf(-f 后面是keepalived的配置文件路径)
- keepalived 关闭:kill ${对应keepalived pid}即可
- keepalived 启动后,其日志文件在/var/log/messages可以看到(后续我将使用tail -f /var/log/messages来观察keepalived的变化)
102机器启动Keepalived
- 下图可以看出,192.168.250.102机器上的keepalived以 Master 启动起来。
 192.168.250.102 192.168.250.102
103机器启动Keepalived
- 下图:192.168.250.103机器上的keepalived以 Backup 启动起来。
 192.168.250.103 192.168.250.103
使用虚拟IP 192.168.250.250访问
- 可以看出,我们当前访问的是Master上的nginx。
 虚拟IP访问 虚拟IP访问
将102上的nginx服务停止
- 下面2张图,可以看出102的优先级降低,从120 -> 90,并切换为Backup。
- 而103变成新的Master。
 192.168.250.102上Nginx停止,102变成backup 192.168.250.102上Nginx停止,102变成backup 192.168.250.103变成Master 192.168.250.103变成Master
再用虚拟IP访问
- 下图:再使用虚拟IP访问时,已经访问的是103上备份的nginx
 成功切换到备份Nginx上 成功切换到备份Nginx上
重启102机器上Nginx
- 可以看出:102优先级从90回到120,并且成功切换成Master。
- 103 由于优先级为110,从而切换为Backup
 192.168.250.102重启Nginx,ch_nginx.sh脚本执行成功,从而102重回Master 192.168.250.102重启Nginx,ch_nginx.sh脚本执行成功,从而102重回Master 103优先级低于102,故重回Backup 103优先级低于102,故重回Backup
再次访问虚拟IP 192.168.250.250
- 下图:重新请求到102Master主机上的nginx。
 虚拟IP访问回到102主机上 虚拟IP访问回到102主机上
总结
- chk_nginx.sh脚本要注意权限,防止keepalived没有权限自行脚本
- keepalived.confMaster 和 Backup 配置文件不要搞乱
- 注意Master 和 Backup 中的优先级值设置,防止主备切换时,优先级值设置不正确,导致主备切换失败。
- 要利用 tail -f /var/log/messages观察keepalived的执行日志
