Nginx 缓存集成
缓存的概念
缓存就是数据交换的缓冲区(称作:Cache),当用户要获取数据的时候,会先从缓存中去查询获取数据,如果缓存中有就会直接返回给用户,如果缓存中没有,则会发请求从服务器重新查询数据,将数据返回给用户的同时将数据放入缓存,下次用户就会直接从缓存中获取数据。
缓存其实在很多场景中都有用到,比如:
场景 | 作用 |
---|---|
操作系统磁盘缓存 | 减少磁盘机械操作 |
数据库缓存 | 减少文件系统的IO操作 |
应用程序缓存 | 减少对数据库的查询 |
Web 服务器缓存 | 减少对应用服务器请求次数 |
浏览器缓存 | 减少与后台的交互次数 |
缓存的优点
- 减少数据传输,节省网络流量,加快响应速度,提升用户体验
- 减轻服务器压力
- 提供服务端的高可用性
缓存的缺点
- 数据的不一致
- 增加成本
在 静态资源部署 - 缓存配置 的时候,我们学习了如何在浏览器进行缓存,而本内容学习的是 Nginx。
Nginx 作为 Web 服务器,Nginx 作为 Web 缓存服务器,它介于客户端和应用服务器之间,当用户通过浏览器访问一个 URL 时,Web 缓存服务器会去应用服务器获取要展示给用户的内容,将内容缓存到自己的服务器上,当下一次请求到来时,如果访问的是同一个 URL,Web 缓存服务器就会直接将之前缓存的内容返回给客户端,而不是向应用服务器再次发送请求。Web 缓存降低了应用服务器、数据库的负载,减少了网络延迟,提高了用户访问的响应速度,增强了用户的体验。
Web缓存服务
Nginx 是从 0.7.48 版开始提供缓存功能。Nginx 是基于 Proxy Store 来实现的,其原理是把 URL 及相关组合当做 Key,在使用 MD5 算法对 Key 进行哈希化,得到硬盘上对应的哈希目录路径,从而将缓存内容保存在该目录中。它可以支持任意 URL 连接,同时也支持 404/301/302 这样的非200 状态码。Nginx 即可以支持对指定 URL 或者状态码设置过期时间,也可以使用 purge 命令来手动清除指定 URL 的缓存。
缓存设置相关指令
Nginx 的 Web 缓存服务主要是使用 ngx_http_proxy_module
模块相关指令集来完成,接下来我们把常用的指令来进行介绍下。
proxy_cache_path
该指定用于设置缓存文件的存放路径。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_path <path> [levels=number] <keys_zone=zone_name:zone_size> [inactive=time][max_size=size]; |
— | http |
path
:缓存路径地址,如:
1 | /usr/local/proxy_cache |
levels
: 指定该缓存空间 path
基础上新建的目录,最多可以设置 3 层,每层取 1 到 2 个字母作为目录名,格式为:
1 | levels=num:num:num # 三个 num 代表三层,每层目录名分别取 num 个字母 |
如:
1 | levels=1:2 # 缓存空间有两层目录,第一层目录名取 1 个字母,第二层目录名取 2 个字母 |
字母名从 MD5 加密的值后面往前截取。
举例说明:
1 | # 假设 proxy_cache_key 为 kele,通过 MD5 加密以后的值为 27ce47ea65c1381dbe5175f7c77d8a3a |
还不理解吗?存储路径在 path
目录基础上再创建新的目录,新的目录名从加密后的值的后面往前面截取。
keys_zone
:用来为这个存key的缓存区设置名称和指定大小,如:
1 | keys_zone=kele:200m # 缓存区的名称是 kele,大小为 200M,1M 大概能存储 8000 个 keys |
inactive
:指定的时间内未访问的缓存数据会从缓存中删除,默认情况下,inactive
设置为 10 分钟。如:
1 | inactive=1d # 缓存数据在 1 天内没有被访问就会被删除 |
max_size
:设置最大缓存空间,如果缓存空间存满,默认会覆盖缓存时间最长的资源,默认单位为兆。如:
1 | max_size=20g # 最大缓存空间为 20G |
配置实例:
1 | http{ |
此时重启 Nginx 配置文件,发现 /usr/local
目录里多出一个目录,名字叫做 proxy_cache。
proxy_cache
该指令用来开启或关闭代理缓存,如果是开启则自定使用哪个缓存区来进行缓存。默认关闭。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache <zone_name | off>; | proxy_cache off; | http、server、location |
zone_name:指定使用缓存区的名称。
缓存区的名称必须是 proxy_cache_path
里的 keys_zone
生成的缓存名。
proxy_cache_key
该指令用来设置 Web 缓存的 key 值,Nginx 会根据 key 值利用 MD5 计算处哈希值并缓存起来,作为缓存目录名的参考。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_key <key>; | proxy_cache_key $scheme$proxy_host$request_uri; | http、server、location |
如 kele 由 MD5 计算出来是 27ce47ea65c1381dbe5175f7c77d8a3a
在哪计算出来的? 前往 MD5 在线加密网站
proxy_cache_valid
该指令用来对不同返回状态码的 URL 设置不同的缓存时间。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_valid [code …… ] <time>; | — | http、server、location |
如:
1 | proxy_cache_valid 200 302 10m; # 为 200 和 302 的响应 URL 设置 10 分钟缓存时间 |
proxy_cache_min_uses
该指令用来设置资源被访问多少次后才会被缓存。默认是 1 次。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_min_uses <number>; | proxy_cache_min_uses 1; | http、server、location |
proxy_cache_methods
该指令是设置缓存哪些 HTTP 方法的请求资源。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_methods <GET | HEAD | POST>; | proxy_cache_methods GET HEAD; | http、server、location |
默认缓存 HTTP 的 GET 和 HEAD 方法的请求资源,不缓存 POST 方法的请求资源。
缓存设置案例
需求分析
步骤实现
应用服务器的环境准备
在
192.168.200.146
服务器 A 上的 tomcat 的 webapps 下面添加一个 js 目录,并在 js 目录中添加一个 jquery.js 文件启动 tomcat
1 | cd /usr/local/tomcat/bin |
- 访问服务器 A 进行测试
1 | http://192.168.200.146:8080/js/jquery.js |
Nginx 的环境准备
- 准备服务器 B 完成 Nginx 的反向代理配置
1 | http{ |
- 完成 Nginx 缓存配置
有注释版
1 | http{ |
无注释版
1 | http{ |
- 测试是否缓存成功
利用 $upstream_cache_status
的值在控制台(F12)查看是否缓存。
第一次访问 192.168.200.113:8080/jquery.js
,如图:
因为第一次访问时,正在缓存,所以返回的请求头 MISS 是没有缓存成功。
第二次访问 192.168.200.113:8080/jquery.js
,如图:
HIT 代表成功缓存。
- 测试 404 缓存时间
测试 404 缓存时间,我们访问 192.168.200.113:8080/jquery.js111
,它会返回 404 页面,并缓存 404 页面,当我们立即访问正确的 192.168.200.113:8080/jquery.js
,它依然返回 404 页面,因为 /jquery.js
请求目前被缓存为 404,还没到 30 秒过期,等 30 秒后再访问,就成功了。
缓存的删除
这里介绍两种方式:
- 删除对应的缓存目录
- 使用第三方扩展模块
删除缓存目录
假设缓存目录是 /usr/local/proxy_cache/
1 | rm -rf /usr/local/proxy_cache/...... |
如果想删除某个缓存目录,就在后面加上目录名。如果想删除整个缓存目录,直接删除 /usr/local/proxy_cache/
即可。
ngx_cache_purge删除
使用第三方扩展模块 ngx_cache_purge
进行删除缓存。
下载
ngx_cache_purge
模块对应的资源包,并上传到服务器的/root/nginx/module/
目录下。这里的资源包是 ngx_cache_purge-2.3.tar.gz
对资源文件进行解压缩
1 | tar -zxf ngx_cache_purge-2.3.tar.gz |
- 修改文件夹名称为
purge
,方便后期配置
1 | mv ngx_cache_purge-2.3 purge |
- 查询 Nginx 的配置参数
configure arguments
,并拷贝出来
1 | nginx -V |
- 进入 Nginx 的安装包目录,使用 ./configure 进行参数配置,记得加上
nginx -V
查询出来的configure arguments
参数
1 | ./configure --add-module=/root/nginx/module/purge # 加上之前的 configure arguments 参数 |
- 使用 make 进行编译
1 | make |
- 将 Nginx 安装目录的 nginx 二级制可执行文件备份
1 | mv /usr/local/nginx/sbin/nginx /usr/local/nginx/sbin/nginx.backup |
- 将编译后的 objs 中的 nginx 拷贝到 nginx 的 sbin 目录下
1 | cp objs/nginx /usr/local/nginx/sbin |
- 使用
make upgrade
进行升级,记得在安装包目录下执行
1 | cd /opt/nginx/core/nginx-1.20.2 |
- 在 Nginx 配置文件中进行如下配置
1 | server{ |
proxy_cache_purge
指令
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_purge <cache> <key> | - | http、server、location |
cache
是proxy_cache
,详细内容看 proxy_cachekey
是proxy_cache_key
,详细内容看 proxy_cache_key
资源不缓存
前面咱们已经完成了 Nginx 作为 Web 缓存服务器的使用。但是我们得思考一个问题,不是所有的数据都适合进行缓存。比如说对于一些经常发生变化的数据。如果进行缓存的话,就很容易出现用户访问到的数据不是服务器真实的数据。所以对于这些资源我们在缓存的过程中就需要进行过滤,不进行缓存。
Nginx 也提供了这块的功能设置,需要使用到如下两个指令:
- proxy_no_cache
- proxy_cache_bypass
proxy_no_cache
该指令是用来定义不将数据进行缓存的条件,也就是不缓存指定的数据。
语法 | 默认值 | 位置 |
---|---|---|
proxy_no_cache <string> …… ; | — | http、server、location |
可设置多个 string。
配置实例:
1 | proxy_no_cache $cookie_nocache $arg_nocache $arg_comment; |
proxy_cache_bypass
该指令是用来设置不从缓存中获取数据的条件,也就是虽然缓存了指定的资源,但请求过来也不会去获取它,而是去服务器里获取资源。
语法 | 默认值 | 位置 |
---|---|---|
proxy_cache_bypass <string> …… ; | — | http、server、location |
可设置多个 string。
配置实例:
1 | proxy_cache_bypass $cookie_nocache $arg_nocache $arg_comment; |
上述两个指令都有一个指定的条件,这个条件可以是多个,并且多个条件中至少有一个不为空且不等于「0」,则条件满足成立。
上面给的配置实例是从官方网站获取的,里面使用到了三个变量,分别是 $cookie_nocache
、$arg_nocache
、$arg_comment
常用不缓存变量
常用不缓存的三个变量分别为:
$cookie_nocache
$arg_nocache
$arg_comment
这三个变量分别代表的含义是:
$cookie_nocache
:指的是当前请求的 cookie 中 key 为 nocache 的 value 值$arg_nocache
和$arg_comment
:指的是当前请求的参数中属性名为 nocache 和 comment 对应的属性值
案例演示:
1 | log_format params $cookie_nocache | $arg_nocache | $arg_comment; |
访问 192.168.200.133:8081?nocache=999&comment=777
,然后去日志查看结果,如图所示:
以后访问的某一个资源如果不想缓存,在 URL 后面加入三个变量中的任意一个或多个即可,只要它们不为空或 0。
这三个变量推荐作为不缓存资源的条件,但并不是只能作为不缓存资源的条件。
案例模板
设置不缓存资源的配置方案模板:
- 如果访问的是 js 文件,则不会缓存该 js 文件
- 如果
$nocache
$cookie_nocache
$arg_nocache
$arg_comment
任意不为空或 0,则访问的资源不进行缓存
1 | server { |
为什么不会缓存 js 文件呢,看第 5 - 6 行代码。如果访问的文件是 js 文件,则设置 $nocache
为 1,只要它不为 0,则触发第 8 行代码,proxy_no_cache
后面的参数只要有一个不为空或 0,则访问的资源不进行缓存。
补充
proxy_cache_path设置缓存路径,其中有一个inactive参数设置cache设置不活跃缓存的删除时间。
proxy_cache_valid设置不同响应码的缓存过期时间。
提出问题
那么这俩参数同时设置,哪个生效呢?
根据上面Stack Overflow的说法。inactive应该需要设置的比valid中时间长。
注意,inactive时间到了,数据删除。valid过期了数据不会删除。有请求,inactive就刷新计时,valid不变。没请求,inactive和valid都不变。
分析各种情况:
1、inactive设置1m,valid设置1h
首先,请求进来,cache出现,两个时间开始倒计时。
情况一:不断请求这个cache,inactive不断刷新1m倒计时,直到到达1h,valid过期。这时你去请求了一次,nginx重新去读取服务器数据,刷新valid倒计时。期间数据一直在缓存里。不请求,就再过1m删掉。
情况二:两次请求间隔超过了1min,inactive生效,删除了这个cache数据,没了。你再请求,相当于重新去服务器拿了一次数据,inactive和valid倒计时都会重新刷新,不请求,cache里就没有这份数据了
2、inactive设置1m,valid设置1m
首先,请求进来,cache出现,两个时间开始倒计时。
情况一:1m内不请求,最后inactive生效删掉。不请求就没缓存了,请求了一次,重新从服务器读取一份,两个计时刷新。
情况二:1m内请求了一次,inactive时间刷新,但是valid还在计时,所以1m到了后,缓存过期了。你再请求就重新从服务器读取一份,刷新计时。不请求,就等待1m,由inactive生效删除了缓存
3、inactive设置1h,valid设置了1m
首先,请求进来,cache出现,两个时间开始倒计时。
过了1m,缓存过期,数据在没删掉。不请求,直到1h到,inactive删掉缓存。请求了一次,重新从服务器读取,刷新两个计时。
所以,结论inactive应该需要设置的比valid中时间长。
目的是针对,一个长期不使用的缓存数据,把他删掉不占用存储,或者强制刷新。
- inactive是针对两次请求间隔时间,到时间就删掉不占用内存。
- valid是针对持续不断的请求,导致一直缓存,我设置时间强制刷新一下。例如,支付宝每时每刻都有人访问,一直请求,缓存就一直不刷新一直是旧的。
inactive和valid是配合使用,不是谁时间短覆盖谁的关系。