Nginx 缓存集成

Nginx 缓存集成

缓存的概念

缓存就是数据交换的缓冲区(称作:Cache),当用户要获取数据的时候,会先从缓存中去查询获取数据,如果缓存中有就会直接返回给用户,如果缓存中没有,则会发请求从服务器重新查询数据,将数据返回给用户的同时将数据放入缓存,下次用户就会直接从缓存中获取数据。

image

缓存其实在很多场景中都有用到,比如:

场景 作用
操作系统磁盘缓存 减少磁盘机械操作
数据库缓存 减少文件系统的IO操作
应用程序缓存 减少对数据库的查询
Web 服务器缓存 减少对应用服务器请求次数
浏览器缓存 减少与后台的交互次数

缓存的优点

  • 减少数据传输,节省网络流量,加快响应速度,提升用户体验
  • 减轻服务器压力
  • 提供服务端的高可用性

缓存的缺点

  • 数据的不一致
  • 增加成本

image

静态资源部署 - 缓存配置 的时候,我们学习了如何在浏览器进行缓存,而本内容学习的是 Nginx。

Nginx 作为 Web 服务器,Nginx 作为 Web 缓存服务器,它介于客户端和应用服务器之间,当用户通过浏览器访问一个 URL 时,Web 缓存服务器会去应用服务器获取要展示给用户的内容,将内容缓存到自己的服务器上,当下一次请求到来时,如果访问的是同一个 URL,Web 缓存服务器就会直接将之前缓存的内容返回给客户端,而不是向应用服务器再次发送请求。Web 缓存降低了应用服务器、数据库的负载,减少了网络延迟,提高了用户访问的响应速度,增强了用户的体验。

Web缓存服务

Nginx 是从 0.7.48 版开始提供缓存功能。Nginx 是基于 Proxy Store 来实现的,其原理是把 URL 及相关组合当做 Key,在使用 MD5 算法对 Key 进行哈希化,得到硬盘上对应的哈希目录路径,从而将缓存内容保存在该目录中。它可以支持任意 URL 连接,同时也支持 404/301/302 这样的非200 状态码。Nginx 即可以支持对指定 URL 或者状态码设置过期时间,也可以使用 purge 命令来手动清除指定 URL 的缓存。

image

缓存设置相关指令

Nginx 的 Web 缓存服务主要是使用 ngx_http_proxy_module 模块相关指令集来完成,接下来我们把常用的指令来进行介绍下。

ngx_http_proxy_module 文档地址

proxy_cache_path

该指定用于设置缓存文件的存放路径。

语法 默认值 位置
proxy_cache_path <path> [levels=number]
<keys_zone=zone_name:zone_size> [inactive=time][max_size=size];
http

path:缓存路径地址,如:

1
/usr/local/proxy_cache

levels: 指定该缓存空间 path 基础上新建的目录,最多可以设置 3 层,每层取 1 到 2 个字母作为目录名,格式为:

1
2
3
levels=num:num:num   # 三个 num 代表三层,每层目录名分别取 num 个字母
levels=num:num # 两个 num 代表两层,每层目录名分别取 num 个字母
levels=num # 一个 num 代表一层,每层目录名分别取 num 个字母

如:

1
levels=1:2   # 缓存空间有两层目录,第一层目录名取 1 个字母,第二层目录名取 2 个字母

字母名从 MD5 加密的值后面往前截取。

举例说明:

1
2
3
4
# 假设 proxy_cache_key 为 kele,通过 MD5 加密以后的值为 27ce47ea65c1381dbe5175f7c77d8a3a
levels=1:2 # 最终的存储路径为 /usr/local/proxy_cache/a/a3,每层截取个数根据 1:2
levels=2:1:2 # 最终的存储路径为 /usr/local/proxy_cache/3a/a/d8,每层截取个数根据 2:1:2
levels=2:2:2 # 最终的存储路径为 /usr/local/proxy_cache/3a/8a/7d,每层截取个数根据 2:2:2

还不理解吗?存储路径在 path 目录基础上再创建新的目录,新的目录名从加密后的值的后面往前面截取。

keys_zone:用来为这个存key的缓存区设置名称和指定大小,如:

1
keys_zone=kele:200m  # 缓存区的名称是 kele,大小为 200M,1M 大概能存储 8000 个 keys

inactive:指定的时间内未访问的缓存数据会从缓存中删除,默认情况下,inactive 设置为 10 分钟。如:

1
inactive=1d   # 缓存数据在 1 天内没有被访问就会被删除

max_size:设置最大缓存空间,如果缓存空间存满,默认会覆盖缓存时间最长的资源,默认单位为兆。如:

1
max_size=20g    # 最大缓存空间为 20G

配置实例:

1
2
3
http{
proxy_cache_path /usr/local/proxy_cache keys_zone=kele:200m levels=1:2:1 inactive=1d max_size=20g;
}

此时重启 Nginx 配置文件,发现 /usr/local 目录里多出一个目录,名字叫做 proxy_cache。

proxy_cache

该指令用来开启或关闭代理缓存,如果是开启则自定使用哪个缓存区来进行缓存。默认关闭。

语法 默认值 位置
proxy_cache <zone_name | off>; proxy_cache off; http、server、location

zone_name:指定使用缓存区的名称。

缓存区的名称必须是 proxy_cache_path 里的 keys_zone 生成的缓存名。

proxy_cache_key

该指令用来设置 Web 缓存的 key 值,Nginx 会根据 key 值利用 MD5 计算处哈希值并缓存起来,作为缓存目录名的参考。

语法 默认值 位置
proxy_cache_key <key>; proxy_cache_key $scheme$proxy_host$request_uri; http、server、location

如 kele 由 MD5 计算出来是 27ce47ea65c1381dbe5175f7c77d8a3a

在哪计算出来的? 前往 MD5 在线加密网站

proxy_cache_valid

该指令用来对不同返回状态码的 URL 设置不同的缓存时间。

语法 默认值 位置
proxy_cache_valid [code …… ] <time>; http、server、location

如:

1
2
3
proxy_cache_valid 200 302 10m; # 为 200 和 302 的响应 URL 设置 10 分钟缓存时间
proxy_cache_valid 404 1m; # 为 404 的响应 URL 设置 1 分钟缓存时间
proxy_cache_valid any 1m; # 对所有响应状态码的URL都设置 1 分钟缓存时间

proxy_cache_min_uses

该指令用来设置资源被访问多少次后才会被缓存。默认是 1 次。

语法 默认值 位置
proxy_cache_min_uses <number>; proxy_cache_min_uses 1; http、server、location

proxy_cache_methods

该指令是设置缓存哪些 HTTP 方法的请求资源。

语法 默认值 位置
proxy_cache_methods <GET | HEAD | POST>; proxy_cache_methods GET HEAD; http、server、location

默认缓存 HTTP 的 GET 和 HEAD 方法的请求资源,不缓存 POST 方法的请求资源。

缓存设置案例

需求分析

image

步骤实现

应用服务器的环境准备

  1. 192.168.200.146 服务器 A 上的 tomcat 的 webapps 下面添加一个 js 目录,并在 js 目录中添加一个 jquery.js 文件

  2. 启动 tomcat

1
2
cd /usr/local/tomcat/bin
./startup.sh
  1. 访问服务器 A 进行测试
1
http://192.168.200.146:8080/js/jquery.js

Nginx 的环境准备

  1. 准备服务器 B 完成 Nginx 的反向代理配置
1
2
3
4
5
6
7
8
9
10
11
12
http{
upstream backend{
server 192.168.200.146:8080; # 服务器 A 地址
}
server {
listen 8080;
server_name localhost;
location / {
proxy_pass http://backend/js/;
}
}
}
  1. 完成 Nginx 缓存配置

有注释版

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
http{
proxy_cache_path /usr/local/proxy_cache levels=2:1 keys_zone=bing:200m inactive=1d max_size=20g;
upstream backend{
server 192.168.200.146:8080; # 服务器 A 的地址
}
server {
listen 8080; # 监听 8080 端口
server_name localhost; # 监听 localhost 的IP
location / { # 监听包含 / 的请求
proxy_cache bing; # 开启 bing 缓存区,和第 2 行的 keys_zone 对应
proxy_cache_key kele; # 缓存的 key 值,会被 MD5 解析成字符串用于生成缓存的目录
proxy_cache_min_uses 5; # 资源被访问 5 次后才会被缓存
proxy_cache_valid 200 5d; # 为 200 响应 URL 设置 5 天缓存时间
proxy_cache_valid 404 30s; # 为 404 的响应 URL 设置 30 秒缓存时间
proxy_cache_valid any 1m; # 为除了上方的任意响应 URL 设置 1 分钟缓存时间
add_header nginx-cache "$upstream_cache_status"; # 将缓存的状态放到请求头里
proxy_pass http://backend/js/; # 代理 backend,将 /js/ 追加到 backend 模块里的地址后面
}
}
}

无注释版

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
http{
proxy_cache_path /usr/local/proxy_cache levels=2:1 keys_zone=bing:200m inactive=1d max_size=20g;
upstream backend{
server 192.168.200.146:8080;
}
server {
listen 8080;
server_name localhost;
location / {
proxy_cache bing;
proxy_cache_key kele;
proxy_cache_min_uses 5;
proxy_cache_valid 200 5d;
proxy_cache_valid 404 30s;
proxy_cache_valid any 1m;
add_header nginx-cache "$upstream_cache_status";
proxy_pass http://backend/js/;
}
}
}
  1. 测试是否缓存成功

利用 $upstream_cache_status 的值在控制台(F12)查看是否缓存。

第一次访问 192.168.200.113:8080/jquery.js,如图:

image

因为第一次访问时,正在缓存,所以返回的请求头 MISS 是没有缓存成功。

第二次访问 192.168.200.113:8080/jquery.js,如图:

image

HIT 代表成功缓存。

  1. 测试 404 缓存时间

测试 404 缓存时间,我们访问 192.168.200.113:8080/jquery.js111,它会返回 404 页面,并缓存 404 页面,当我们立即访问正确的 192.168.200.113:8080/jquery.js,它依然返回 404 页面,因为 /jquery.js 请求目前被缓存为 404,还没到 30 秒过期,等 30 秒后再访问,就成功了。

缓存的删除

这里介绍两种方式:

  • 删除对应的缓存目录
  • 使用第三方扩展模块

删除缓存目录

假设缓存目录是 /usr/local/proxy_cache/

1
rm -rf /usr/local/proxy_cache/......

如果想删除某个缓存目录,就在后面加上目录名。如果想删除整个缓存目录,直接删除 /usr/local/proxy_cache/ 即可。

ngx_cache_purge删除

使用第三方扩展模块 ngx_cache_purge 进行删除缓存。

  1. 下载 ngx_cache_purge 模块对应的资源包,并上传到服务器的 /root/nginx/module/ 目录下。

    这里的资源包是 ngx_cache_purge-2.3.tar.gz

  2. 对资源文件进行解压缩

1
tar -zxf ngx_cache_purge-2.3.tar.gz
  1. 修改文件夹名称为 purge,方便后期配置
1
mv ngx_cache_purge-2.3 purge
  1. 查询 Nginx 的配置参数 configure arguments,并拷贝出来
1
nginx -V
  1. 进入 Nginx 的安装包目录,使用 ./configure 进行参数配置,记得加上 nginx -V 查询出来的 configure arguments 参数
1
./configure --add-module=/root/nginx/module/purge  # 加上之前的 configure arguments 参数
  1. 使用 make 进行编译
1
make
  1. 将 Nginx 安装目录的 nginx 二级制可执行文件备份
1
mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginx.backup
  1. 将编译后的 objs 中的 nginx 拷贝到 nginx 的 sbin 目录下
1
cp objs/nginx /usr/local/nginx/sbin
  1. 使用 make upgrade 进行升级,记得在安装包目录下执行
1
2
3
cd /opt/nginx/core/nginx-1.20.2

make upgrade
  1. 在 Nginx 配置文件中进行如下配置
1
2
3
4
5
server{
location ~/purge(/.*) {
proxy_cache_purge bing kele;
}
}

proxy_cache_purge 指令

语法 默认值 位置
proxy_cache_purge <cache> <key> - http、server、location

资源不缓存

前面咱们已经完成了 Nginx 作为 Web 缓存服务器的使用。但是我们得思考一个问题,不是所有的数据都适合进行缓存。比如说对于一些经常发生变化的数据。如果进行缓存的话,就很容易出现用户访问到的数据不是服务器真实的数据。所以对于这些资源我们在缓存的过程中就需要进行过滤,不进行缓存。

Nginx 也提供了这块的功能设置,需要使用到如下两个指令:

  • proxy_no_cache
  • proxy_cache_bypass

proxy_no_cache

该指令是用来定义不将数据进行缓存的条件,也就是不缓存指定的数据。

语法 默认值 位置
proxy_no_cache <string> …… ; http、server、location

可设置多个 string。

配置实例:

1
proxy_no_cache $cookie_nocache $arg_nocache $arg_comment;

proxy_cache_bypass

该指令是用来设置不从缓存中获取数据的条件,也就是虽然缓存了指定的资源,但请求过来也不会去获取它,而是去服务器里获取资源。

语法 默认值 位置
proxy_cache_bypass <string> …… ; http、server、location

可设置多个 string。

配置实例:

1
proxy_cache_bypass $cookie_nocache $arg_nocache $arg_comment;

上述两个指令都有一个指定的条件,这个条件可以是多个,并且多个条件中至少有一个不为空且不等于「0」,则条件满足成立。

上面给的配置实例是从官方网站获取的,里面使用到了三个变量,分别是 $cookie_nocache$arg_nocache$arg_comment

常用不缓存变量

常用不缓存的三个变量分别为:

  • $cookie_nocache
  • $arg_nocache
  • $arg_comment

这三个变量分别代表的含义是:

  • $cookie_nocache:指的是当前请求的 cookie 中 key 为 nocache 的 value 值
  • $arg_nocache$arg_comment:指的是当前请求的参数中属性名为 nocache 和 comment 对应的属性值

案例演示:

1
2
3
4
5
6
7
8
9
10
11
log_format params $cookie_nocache | $arg_nocache | $arg_comment
server {
listen 8081;
server_name localhost;
location / {
access_log logs/access_params.log params;
add_header Set-Cookie 'nocache=888';
root html;
index index.html;
}
}

访问 192.168.200.133:8081?nocache=999&comment=777,然后去日志查看结果,如图所示:

image

以后访问的某一个资源如果不想缓存,在 URL 后面加入三个变量中的任意一个或多个即可,只要它们不为空或 0。

这三个变量推荐作为不缓存资源的条件,但并不是只能作为不缓存资源的条件。

案例模板

设置不缓存资源的配置方案模板:

  • 如果访问的是 js 文件,则不会缓存该 js 文件
  • 如果 $nocache $cookie_nocache $arg_nocache $arg_comment 任意不为空或 0,则访问的资源不进行缓存
1
2
3
4
5
6
7
8
9
10
11
server {
listen 8080;
server_name localhost;
location / {
if ($request_uri ~ /.*\.js$){
set $nocache 1;
}
proxy_no_cache $nocache $cookie_nocache $arg_nocache $arg_comment;
proxy_cache_bypass $nocache $cookie_nocache $arg_nocache $arg_comment;
}
}

为什么不会缓存 js 文件呢,看第 5 - 6 行代码。如果访问的文件是 js 文件,则设置 $nocache 为 1,只要它不为 0,则触发第 8 行代码,proxy_no_cache 后面的参数只要有一个不为空或 0,则访问的资源不进行缓存。


补充

proxy_cache_path设置缓存路径,其中有一个inactive参数设置cache设置不活跃缓存的删除时间。
proxy_cache_valid设置不同响应码的缓存过期时间。

提出问题

那么这俩参数同时设置,哪个生效呢?

根据上面Stack Overflow的说法。inactive应该需要设置的比valid中时间长。

注意,inactive时间到了,数据删除。valid过期了数据不会删除。有请求,inactive就刷新计时,valid不变。没请求,inactive和valid都不变。

分析各种情况:

1、inactive设置1m,valid设置1h
首先,请求进来,cache出现,两个时间开始倒计时。
情况一:不断请求这个cache,inactive不断刷新1m倒计时,直到到达1h,valid过期。这时你去请求了一次,nginx重新去读取服务器数据,刷新valid倒计时。期间数据一直在缓存里。不请求,就再过1m删掉。
情况二:两次请求间隔超过了1min,inactive生效,删除了这个cache数据,没了。你再请求,相当于重新去服务器拿了一次数据,inactive和valid倒计时都会重新刷新,不请求,cache里就没有这份数据了

2、inactive设置1m,valid设置1m
首先,请求进来,cache出现,两个时间开始倒计时。
情况一:1m内不请求,最后inactive生效删掉。不请求就没缓存了,请求了一次,重新从服务器读取一份,两个计时刷新。
情况二:1m内请求了一次,inactive时间刷新,但是valid还在计时,所以1m到了后,缓存过期了。你再请求就重新从服务器读取一份,刷新计时。不请求,就等待1m,由inactive生效删除了缓存

3、inactive设置1h,valid设置了1m
首先,请求进来,cache出现,两个时间开始倒计时。
过了1m,缓存过期,数据在没删掉。不请求,直到1h到,inactive删掉缓存。请求了一次,重新从服务器读取,刷新两个计时。

所以,结论inactive应该需要设置的比valid中时间长。
目的是针对,一个长期不使用的缓存数据,把他删掉不占用存储,或者强制刷新。

  • inactive是针对两次请求间隔时间,到时间就删掉不占用内存。
  • valid是针对持续不断的请求,导致一直缓存,我设置时间强制刷新一下。例如,支付宝每时每刻都有人访问,一直请求,缓存就一直不刷新一直是旧的。

inactive和valid是配合使用,不是谁时间短覆盖谁的关系。

文章作者: GeYu
文章链接: https://nuistgy.github.io/2022/11/14/Nginx_Cache_integration/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Yu's Blog