Nginx 负载均衡
负载均衡
负载均衡是实际开发必须掌握的技能,Nginx 如何将少数请求跟多台服务器进行沟通,让每一台服务器的请求处理面面俱到?本内容将学习 Nginx 的负载均衡知识。
负载均衡概述
早期的网站流量和业务功能都比较简单,单台服务器足以满足基本的需求,但是随着互联网的发展,业务流量越来越大并且业务逻辑也跟着越来越复杂,单台服务器的性能及单点故障问题就凸显出来了,因此需要多台服务器进行性能的水平扩展及避免单点故障出现。那么如何将不同用户的请求流量分发到不同的服务器上呢?这就需要负载均衡来处理。
负载均衡原理及处理流程
系统的扩展可以分为纵向扩展和横向扩展。
- 纵向扩展是从单机的角度出发,通过增加系统的硬件处理能力来提升服务器的处理能力
- 横向扩展是通过添加机器来满足大型网站服务的处理能力
如上图,负载均衡涉及到两个重要的角色分别是「应用集群」和「负载均衡器」。
- 应用集群:将同一应用部署到多台机器上,组成处理集群,接收负载均衡设备分发的请求,进行处理并返回响应的数据
- 负载均衡器:将用户访问的请求根据对应的负载均衡算法,分发到集群中的一台服务器进行处理
负载均衡作用
- 解决服务器的高并发压力,提高应用程序的处理性能
- 提供故障转移,实现高可用
- 通过添加或减少服务器数量,增强网站的可扩展性
- 在负载均衡器上进行过滤,可以提高系统的安全性
负载均衡常用处理方式
先说明,我们常用的是 四/七层负载均衡 方式,前面两个方式可以了解。
用户手动选择
这种方式比较原始,主要实现的方式就是在网站主页上面提供不同线路、不同服务器链接方式,让用户来选择自己访问的具体服务器,来实现负载均衡。
如下图,用户点击不同的下载方式,就会跳转到不同的下载地址。这是主动式的负载均衡,我们无法控制用户的选择。如果用户全部点击第一个下载方式,那么服务器的压力将非常大。
DNS轮询方式
DNS:域名系统(服务)协议(DNS)是一种分布式网络目录服务,主要用于域名与 IP 地址的相互转换。
大多域名注册商都支持对同一个主机名添加多条 A 记录,这就是 DNS 轮询,DNS 服务器将解析请求按照 A 记录的顺序,随机分配到不同的 IP 上,这样就能完成简单的负载均衡。DNS 轮询的成本非常低,在一些不重要的服务器,被经常使用。
如下图:客户端如果想访问服务器集群,首先去 DNS 服务器获取我们曾经在 DNS 服务器保存的「记录表」,这个「记录表」将会把某个服务器的地址返回给客户端,客户端再根据这个地址,访问指定的服务器。这个「记录表」在开始期间需要我们去 DNS 服务器进行添加。
「记录表」长什么样,如下图的主机记录 www。这是我为某一个域名添加的 IP 地址,用 2 台服务器来做负载均衡。其中两个记录值都绑定了 www.nginx521.cn
地址。(一个域名可以绑定多个IP地址)
验证:
1 | ping www.nginx521.cn |
注意:记得清空本地的 DNS 缓存,如果本地有缓存,无论你怎么 ping
,都会 ping
到缓存的服务器地址,无法负载均衡
1 | ipconfig/flushdns |
目前需要 ping
一次然后清理一次缓存,才能实现负载均衡的轮询效果。
我们发现使用 DNS 来实现轮询,不需要投入过多的成本,虽然 DNS 轮询成本低廉,但是 DNS 负载均衡存在明显的缺点:
可靠性低
假设一个域名 DNS 轮询多台服务器,如果其中的一台服务器发生故障,那么所有的访问该服务器的请求将不会有所回应,即使你将该服务器的 IP 从 DNS 中去掉,但是由于各大宽带接入商将众多的 DNS 存放在缓存中,以节省访问时间,导致 DNS 不会实时更新。所以 DNS 轮流上一定程度上解决了负载均衡问题,但是却存在可靠性不高的缺点。
负载均衡不均衡
DNS 负载均衡采用的是简单的轮询负载算法,不能区分服务器的差异,不能反映服务器的当前运行状态,不能做到为性能好的服务器多分配请求,另外本地计算机也会缓存已经解析的域名到 IP 地址的映射,这也会导致使用该 DNS 服务器的用户在一定时间内访问的是同一台 Web 服务器,从而引发 Web 服务器减的负载不均衡。
负载不均衡则会导致某几台服务器负荷很低,而另外几台服务器负荷确很高,处理请求的速度慢,配置高的服务器分配到的请求少,而配置低的服务器分配到的请求多。
四/七层负载均衡
介绍四/七层负载均衡之前,我们先了解一个概念,OSI(open system interconnection),叫开放式系统互联模型,这个是由国际标准化组织 ISO 指定的一个不基于具体机型、操作系统或公司的网络体系结构。该模型将网络通信的工作分为七层。
- 应用层:为应用程序提供网络服务。
- 表示层:对数据进行格式化、编码、加密、压缩等操作
- 会话层:建立、维护、管理会话连接
- 传输层:建立、维护、管理端到端的连接,常见的有 TCP/UDP
- 网络层:IP 寻址和路由选择
- 数据链路层:控制网络层与物理层之间的通信
- 物理层:比特流传输
什么是四层负载均衡
所谓四层负载均衡指的是 OSI 七层模型中的传输层,主要是基于 IP + PORT 的负载均衡
实现四层负载均衡的方式:
- 硬件:F5 BIG-IP、Radware 等,性能好,成本高、无法扩展
- 软件:LVS、Nginx、Hayproxy 等,性能较好,成本低、可以扩展
什么是七层负载均衡
所谓的七层负载均衡指的是在应用层,主要是基于虚拟的 URL 或主机 IP 的负载均衡
实现七层负载均衡的方式:
- 软件:Nginx、Hayproxy 等
四层和七层负载均衡的区别
- 四层负载均衡数据包是在底层就进行了分发,而七层负载均衡数据包则在最顶端进行分发,所以四层负载均衡的效率比七层负载均衡的要高(四层比七层少,速度块,效率高,但是可能请求丢失等)
- 四层负载均衡不识别域名,而七层负载均衡识别域名
处理四层和七层负载以外,其实还有二层、三层负载均衡,二层是在数据链路层基于 mac 地址来实现负载均衡,三层是在网络层一般采用虚拟 IP 地址的方式实现负载均衡。
实际环境采用的模式:四层负载(LVS) + 七层负载(Nginx)
七层负载均衡
Nginx 要实现七层负载均衡需要用到 proxy_pass 代理模块配置。Nginx 默认安装支持这个模块,我们不需要再做任何处理。Nginx 的负载均衡是在 Nginx 反向代理的基础上把用户的请求根据指定的算法分发到一组「upstream 虚拟服务池」。
七层负载均衡指令
upstream指令
该指令是用来定义一组服务器,它们可以是监听不同端口的服务器,并且也可以是同时监听 TCP 和 Unix socket 的服务器。服务器可以指定不同的权重,默认为 1。
语法 | 默认值 | 位置 |
---|---|---|
upstream <name> {…} | — | http |
server指令
该指令用来指定后端服务器的名称和一些参数,可以使用域名、IP、端口或者 Unix socket。
语法 | 默认值 | 位置 |
---|---|---|
server <name> [paramerters] | — | upstream |
server 后的 name 就是 upstream 后的 name,两者保持一致。
七层负载均衡指令案例
准备四台服务器,一台用来做负载均衡器,三台用来接收负载均衡器的请求。
因为目前只有两台服务器,所以一台用来做负载均衡器,另外一台用来接收负载均衡器的请求。
服务器设置:这里以三个端口代替三个服务器,在配置文件进行如下配置:
1 | # 服务器 1 |
负载均衡器设置:这是一个 Nginx 代理服务器,让它去负载均衡访问三个服务器,在配置文件进行如下配置:
1 | upstream backend{ |
访问负载均衡器的地址,如 http://192.168.200.133:8083
,它会找到 proxy_pass
后的地址,比如上方,它会根据 backend 找到对应的 upstream 里内地址,替换掉 backend,变成:
- proxy_pass
http://192.168.200.146:9091
- proxy_pass
http://192.168.200.146:9092
- proxy_pass
http://192.168.200.146:9093
但是它不会全部访问三个服务器地址,而是根据自己的算法(轮询)选择其中一个服务器地址。
七层负载均衡状态
代理服务器在负责均衡调度中的状态有以下几个:
状态 | 概述 |
---|---|
down | 当前的 server 暂时不参与负载均衡 |
backup | 预留的备份服务器 |
max_fails | 允许请求失败的次数 |
fail_timeout | 经过 max_fails 失败后,服务暂停时间 |
max_conns | 限制最大的接收连接数 |
down
down
指令将该服务器标记为永久不可用,那么负载均衡器将不参与该服务器的负载均衡。
如下,如果不希望负载均衡器以负载均衡来处理 192.168.200.146
服务器:
1 | upstream backend{ |
该状态一般会对需要停机维护的服务器进行设置。
backup
backup
指令将该服务器标记为备份服务器,当主服务器不可用时,才用备份服务器来传递请求。
它不同于 down 指令,down 指令将服务器永久禁止,而 backp 指令仅仅临时禁止,当主服务器不可用后,临时禁止的服务器就会站出来。
1 | upstream backend{ |
上方代码中 9001 服务器永久禁止,而 9002 服务器是备份服务器,所以 9003 服务器是主服务器。
此时需要将 9003 端口的访问禁止掉,用它来模拟当唯一对外提供访问的服务宕机以后,backup 的备份服务器就能开始对外提供服务。
为了测试验证,我们需要使用防火墙来进行拦截。
介绍一个工具 firewall-cmd
,该工具是 Linux 提供的专门用来操作 firewall 防火墙的。
查询防火墙中指定的端口是否开放
1 | firewall-cmd --query-port=9001/tcp |
开放一个指定的端口
1 | firewall-cmd --permanent --add-port=9002/tcp |
批量添加开发端口
1 | firewall-cmd --permanent --add-port=9001-9003/tcp |
如何移除一个指定的端口
1 | firewall-cmd --permanent --remove-port=9003/tcp |
重新加载
1 | firewall-cmd --reload |
其中
--permanent
表示设置为持久--add-port
表示添加指定端口--remove-port
表示移除指定端口
经过测试,禁用掉 9003 端口后,再次访问负载均衡器,它只会请求 9002 端口的服务器(备份服务器),而恢复 9003 端口,只会请求 9003 端口的服务器。
max_conns
max_conns
指令用来限制同时连接到 upstream 负载上的单个服务器的最大连接数。默认为 0,表示不限制,使用该配置可以根据后端服务器处理请求的并发量来进行设置,防止后端服务器被压垮。
语法 | 默认值 | 位置 |
---|---|---|
max_conns=<number> | 0 | upstream |
- number 是大于 0 的数字。
1 | upstream backend{ |
第 4 行配置标识 9003 端口的服务器最大能被 2 个客户端请求。
max_fails和fail_timeout
max_fails
指令设置允许请求代理服务器失败的次数,默认为 1。
fail_timeout
指令设置经过 max_fails 失败后,服务暂停的时间,默认是 10 秒。
语法 | 默认值 | 位置 |
---|---|---|
max_fails=<number> | 1 | upstream |
fail_timeout=<time> | 10 秒 | upstream |
- number 是大于 0 的数字
- time 是时间,单位为秒
1 | upstream backend{ |
七层负载均衡策略
介绍完 Nginx 负载均衡的相关指令后,我们已经能实现将用户的请求分发到不同的服务器上,那么除了采用默认的分配方式以外,我们还能采用什么样的负载算法?
Nginx 的 upstream 支持如下六种方式的分配算法,分别是:
算法名称 | 说明 |
---|---|
轮询 | 默认方式 |
weight | 权重方式 |
ip_hash | 依据 IP 分配方式 |
least_conn | 依据最少连接方式 |
url_hash | 依据 URL 分配方式 |
fair | 依据响应时间方式 |
轮询
这是 upstream
模块负载均衡默认的策略。每个请求会按时间顺序逐个分配到不同的后端服务器。轮询不需要额外的配置。
1 | upstream backend{ |
weight加权[加权轮询]
weight
指令用来设置服务器的权重,默认为 1,权重数据越大,被分配到请求的几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的,所有此策略比较适合服务器的硬件配置差别比较大的情况。
语法 | 默认值 | 位置 |
---|---|---|
weight=<number> | 1 | upstream |
- number 是大于 0 的数字
1 | upstream backend{ |
ip_hash
当对后端的多台动态应用服务器做负载均衡时,ip_hash
指令能够将某个客户端 IP 的请求通过哈希算法定位到同一台后端服务器上。
这样,当来自某一个 IP 的用户在后端 Web 服务器 A 上登录后,在访问该站点的其他 URL,能保证其访问的还是后端 Web 服务器 A
总结:哪个服务器曾经处理过请求,无论在哪里,相同的请求依然让该服务器处理
语法 | 默认值 | 位置 |
---|---|---|
ip_hash; | — | upstream |
1 | upstream backend{ |
需要额外多说一点的是使用 ip_hash 指令无法保证后端服务器的负载均衡,可能导致有些后端服务器接收到的请求多,有些后端服务器接收的请求少,而且设置后端服务器权重等方法将不起作用。
least_conn
最少连接数,把请求转发给连接数较少的后端服务器。
轮询算法是把请求平均的转发给各个后端,使它们的负载大致相同;但是,有些请求占用的时间很长,会导致其所在的后端负载较高。这种情况下,least_conn
这种方式就可以达到更好的负载均衡效果。
1 | upstream backend{ |
此负载均衡策略适合请求处理时间长短不一造成服务器过载的情况。
url_hash
按访问 URL 的 hash 结果来分配请求,使每个 URL 定向到同一个后端服务器,要配合缓存命中来使用。
当出现同一个资源多次请求,可能会到达不同的服务器上,导致不必要的多次下载,缓存命中率不高,以及一些资源时间的浪费时,使用 url_hash
,可以使得同一个 URL(也就是同一个资源请求)会到达同一台服务器,一旦缓存住了资源,再此收到请求,就可以从缓存中读取。
总结:发送相同的请求时,希望只有一个服务器处理该请求,使用 uri_hash
。因为 URL 相同,则哈希值(hash)相同,那么哈希值对应的服务器也相同。
1 | upstream backend{ |
如图:文件系统有一个文件,目前只有 web 服务 1 和服务 3 获取了该文件,那么我们想要下载这个文件时,只能找服务 1 或服务 3,这时候就固定一个 URL,该 URL 不允许服务 2 进行处理,那么如何规定哪个服务处理呢?就用到 url_hash
。
它会根据 URL 计算处哈希值,由哈希值对应服务,所以固定下载文件的 URL,就固定了一个服务处理。
fair
fair
指令采用的不是内建负载均衡使用的轮换的均衡算法,而是可以根据页面大小、加载时间长短智能的进行负载均衡。
那么如何使用第三方模块的 fair 负载均衡策略?
1 | nupstream backend{ |
但是这样直接使用会报错,因为 fair 属于第三方模块实现的负载均衡。需要添加 nginx-upstream-fair
模块,如何添加对应的模块:
- 下载
nginx-upstream-fair
模块,下载地址如下:
1 | https://github.com/gnosek/nginx-upstream-fair |
- 将下载的文件上传到服务器并进行解压缩
1 | # 进入安装包目录 |
- 我的解压目录在
/opt
,所以第 6 步记得指定好模块的路径。
1 | mv nginx-upstream-fair-master fair |
- 将原有
/usr/local/nginx/sbin/nginx
进行备份
1 | mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginx.backup |
- 查看
configure arguments
的配置信息,拷贝出来
1 | nginx -V |
- 进入 Nginx 的安装目录,执行 make clean 清空之前编译的内容
1 | cd /root/nginx/core/nginx-1.21.6 |
- 使用 configure 来配置参数,添加模块,记得加上第(4)步拷贝的配置信息
1 | ./configure --add-module=/opt/fair # 记得添加 configure arguments 后的数据 |
- 通过 make 模板进行编译
1 | make |
编译可能会出现如下错误,ngx_http_upstream_srv_conf_t
结构中缺少 default_port
解决方案:
在 Nginx 的源码目录(安装包目录)中 src/http/ngx_http_upstream.h
,找到 ngx_http_upstream_srv_conf_s
,在模块中添加添加 default_port
属性
1 | vim /opt/nginx/core/nginx-1.21.6/src/http/ngx_http_upstream.h |
添加内容:
1 | in_port_t default_port |
然后再进行 make。
- 将安装目录下的 objs 中的 nginx 拷贝到 sbin 目录
1 | cd /opt/nginx/core/nginx-1.21.6/objs |
10 .更新nginx
1 | cd /opt/nginx/core/nginx-1.21.6 |
上面介绍了 Nginx 常用的负载均衡的策略,有人说是 5 种,是把轮询和加权轮询归为一种,也有人说是 6 种。那么在咱们以后的开发中到底使用哪种,这个需要根据实际项目的应用场景来决定的。
七层负载均衡案例
案例一:对所有请求实现一般轮询规则的负载均衡
1 | upstream backend{ |
案例二:对所有请求实现加权轮询规则的负载均衡
1 | upstream backend{ |
处理请求概率:9001 端口 > 9003 端口 > 9002 端口
案例三:对特定资源实现负载均衡
1 | upstream videobackend{ |
发送 /video/
请求会被 9001 和 9002 端口的服务器处理。
发送 /file/
请求会被 9003 和 9004 端口的服务器处理。
案例四:对不同域名实现负载均衡
1 | upstream frxbackend{ |
www.frx.com
地址的请求由 9001 端口和 9002 端口处理。
www.bing.com
地址的请求由 9003 端口和 9004 端口处理。
案例五:实现带有URL重写的负载均衡
1 | upstream backend{ |
将 /file/xxx
请求重写为 /server/xxx
,然后触发 location /server
,实现负载均衡。
此时被负载均衡的服务器地址也会带有 /server
以及后面的参数,如 192.168.200.146:9001/server/xxx
四层负载均衡
Nginx 在 1.9 之后,增加了一个 stream 模块,用来实现四层协议的转发、代理、负载均衡等。stream 模块的用法跟 http 的用法类似,允许我们配置一组 TCP 或者 UDP 等协议的监听,然后通过 proxy_pass 来转发我们的请求,通过 upstream 添加多个后端服务,实现负载均衡。
四层协议负载均衡的实现,一般都会用到 LVS、HAProxy、F5 等,要么很贵要么配置很麻烦,而 Nginx 的配置相对来说更简单,更能快速完成工作。
添加stream模块的支持
Nginx 默认是没有编译这个模块的,需要使用到 stream 模块,那么需要在编译的时候加上 --with-stream
。
完成添加 --with-stream
的实现步骤:
- 将原有
/usr/local/nginx/sbin/nginx
进行备份 - 拷贝
Nginx -V
的 configure arguments 配置信息 - 在 Nginx 的安装源码进行配置指定对应模块:
./configure --with-stream 加上一步拷贝的configure arguments 配置
- 通过 make 模板进行编译
- 将 objs 下面的 nginx 移动到
/usr/local/nginx/sbin
下 - 在源码目录下执行
make upgrade
进行升级,这个可以实现不停机添加新模块的功能
添加模块的详细步骤我已经在 七层负载均衡策略-fair 指令、静态资源部署-Nginx 模块添加、反向代理-添加ssl支持 描述过,而你只需要替换模块名字罢了。
四层负载均衡指令
如果不想在 http 模块使用负载均衡,可以在 steam 模块使用。
stream指令
该指令提供在其中指定流服务器指令的配置文件上下文。和 http 模块同级。
语法 | 默认值 | 位置 |
---|---|---|
stream { … } | — | main |
如:
1 | http { |
upstream指令
该指令和七层负载均衡的 upstream 指令是类似的。
四层负载均衡的案例
准备两台服务器,这里称为 A 和 B。服务器 A 的 IP 为 192.168.200.146
,服务器 B 的IP 为 192.168.200.133
,服务器 A 存放 Redis 和 Tomcat,服务器 B 作为负载均衡器,对服务器 A 的端口进行负载均衡处理。
需求分析
Redis 配置
准备 Redis 服务器,在服务器 A 上准备两个 Redis,端口分别是 6379、6378。
- 上传 redis 的安装包
redis-4.0.14.tar.gz
,这里上传目录是/opt
- 将安装包进行解压缩
1 | tar -zxf redis-4.0.14.tar.gz |
- 进入redis的安装包
1 | cd redis-4.0.14 |
- 使用 make 和 install 进行编译和安装,这里的安装路径是
/usr/local/redis/redis01
1 | make PREFIX=/usr/local/redis/redis01 install |
- 拷贝 redis 配置文件
redis.conf
到/usr/local/redis/redis01/bin
目录中,因为安装后,目录并没有 redis.conf
1 | cp /opt/redis-4.0.14/redis.conf /usr/local/redis/redis01/bin |
- 修改 redis.conf 配置文件,注意:不是添加内容,是修改内容,要自己搜索 bind、port 和 daemonize 进行修改
1 | bind 0.0.0.0 # 允许任意地址访问 |
- 将 redis01 复制一份为 redis02
1 | cd /usr/local/redis |
- 将 redis02 文件夹中的 redis.conf 进行修改,注意:不是添加内容,是修改内容,要自己搜索 bind、port 和 daemonize 进行修改
1 | bind 0.0.0.0 # 允许任意地址访问 |
- 分别启动,即可获取两个 Redis 并查看
1 | ps -ef | grep redis |
使用 Nginx 将请求分发到不同的 Redis 服务器上。
安装 Redis 并验证能启动成功后,在另一台服务器 B 192.168.200.133
的 Nginx 配置文件添加如下内容:(确保安装了 steam 模块)
1 | stream { |
此时利用 redis-cli 连接测试
服务器 B 通过负载均衡连接到了服务器 A 的 Redis,只是不知道连接的是 6378 还是 6379 端口,可以在 Redis 添加不一样的数据来测试,这里不演示了。
Tomcat 配置
准备 Tomcat 服务器 到服务器 A
- 上传 tomcat 的安装包,
apache-tomcat-8.5.56.tar.gz
- 将安装包进行解压缩
1 | tar -zxf apache-tomcat-8.5.56.tar.gz |
- 进入 tomcat 的 bin 目录,启动 tomcat
1 | cd apache-tomcat-8.5.56/bin |
服务器 B 的配置文件 nginx.conf 配置如下:
1 | stream { |
访问服务器 B 的地址进行测试:192.168.200.133:82
。