Nginx 学习笔记 (8) - 缓存加速指南 (proxy_cache)
服务端缓存
proxy_cache
运用局部性的原理,备存一些先前被访问过、料将被再度使用的资源,使用户得以由前端服务器直接取得,从而减少后端服务器的资源开销,并缓解整个系统的压力。缓存也是反代的用途之一。本文介绍 Nginx 基本的缓存配置。
1) 定义一个缓存目录,路径为 /usr/local/nginx/cache
;采用二级的目录结构;建立一块用于存放缓存键 (cache keys) 和元数据 (metadata) 的共享内存区,名叫 “the_cache_zone” 且分配 10MB 的内存;不活跃的缓存文件 1 小时后将被清除;缓存所占磁盘空间的上限是 512MB;不另设临时目录。
http {
...
proxy_cache_path /usr/local/nginx/cache levels=1:2 keys_zone=the_cache_zone:10m inactive=1h max_size=512m use_temp_path=off;
...
}
2) 启用缓存。方便除错计,添加一响应头用以指示缓存状态 (MISS / BYPASS / HIT …)。
下列指令请斟酌——proxy_cache_bypass
用于指定忽略缓存的情况,当其值为空或为零时,使用缓存。proxy_cache_key
用于生成缓存键,区分不同的资源。要特别留心 Query String。proxy_cache_min_uses
则规定缓存门槛,请求过多少次才缓存,不缓存低频请求,避免浪费。
在下例中,$is_args
反映请求的 URI 是否带参数(网址中问号后面那一长串),若没有即为空值。$request_uri
近似于 $uri$is_args$args
。key 是决定缓存命中率的因素之一。
location / {
...
proxy_pass http://www.example.com;
proxy_cache the_cache_zone;
# proxy_cache_bypass $is_args;
# (default) proxy_cache_key $scheme$proxy_host$request_uri;
# proxy_cache_min_uses 3;
add_header X-Cache-Status $upstream_cache_status;
...
}
3) Nginx 作反代时,相对来说也是客户端。若希望抓取的源站内容总是新鲜,还需要忽略上游的缓存期限,即不遵循源站的 Cache-Control
和 Expires
等响应头,然后再来配置自己的缓存期限。
服务端一侧,proxy_cache_valid
控制的是 expiration (有效期),针对不同的 HTTP 状态码可以设定不同的有效期。inactive
决定的是 retention (保留期限),时间一到管你新不新鲜都要丢掉 (refresh)。可以理解为 inactive
要优位于 proxy_cache_valid
。
proxy_cache_revalidate
将对客户端传来之 Etag
或 Last-Modified
作出验证,若服务端资源没有变化,则使用“稍早前”缓存页面,无论其有效期为何。有助减少回源次数。
location / {
...
proxy_ignore_headers X-Accel-Expires Cache-Control Expires;
proxy_cache_valid 301 1h;
proxy_cache_valid 200 30m;
proxy_cache_valid any 1m;
proxy_cache_revalidate on;
...
}
4) 缓存一时爽,全家火葬场。一大波缓存同时失效,会导致缓存雪崩 (Cache stampede),使得大批请求涌向源站。如果网站不是特别大、并发要求不是特别高,可以采取加锁排队和暂时返回陈旧数据的方式缓解问题。但根本的还是要各别设定缓存期限,错峰更新缓存,不要一窝蜂。
proxy_cache_lock
对同一资源,未命中一次只回源一次,阻塞后续请求直至当前请求完成。proxy_cache_lock_age
“不能者止”,如果当前请求未能如期完成,就放行后续请求。proxy_cache_lock_timeout
发生超时,同样放行,但不作缓存。
proxy_cache_use_stale
则是指定“共体时艰”的情境,比如服务器正在更新 (updating) 缓存的时候,或者遭遇 503 服务不可用错误的时候,勉予使用 (inactive
还未清理的) 过期缓存,以保持可用性。proxy_cache_background_update
返回陈旧数据时,也跟源站要一份新鲜的,下次用。
location / {
...
proxy_cache_lock on;
# (default) proxy_cache_lock_age 5s;
# (default) proxy_cache_lock_timeout 5s;
proxy_cache_use_stale error timeout updating http_503;
proxy_cache_background_update on;
...
}
5) 倘若有手动清除缓存的需求,又用不起 NGINX Plus,不妨考虑 ngx_cache_purge。
照前文 Nginx 学习笔记 (7) 的步骤,下载源码、nginx -V
检视参数、追加参数 --add-module=../ngx_cache_purge-2.3
且重新编译 Nginx,以完成添加模块的动作。
proxy_cache_purge
得回头看前面的配置,使用的缓存路径与 proxy_cache
的对应、缓存键向 proxy_cache_key
的看齐。URI 前面加上 /purge
即为清除缓存接口(最好不要被外部访问)。
location / {
...
proxy_cache the_cache_zone;
proxy_cache_key $scheme$proxy_host$request_uri;
...
}
location ~ /purge(/.*) {
...
allow 127.0.0.1;
deny all;
proxy_cache_purge the_cache_zone $scheme$proxy_host$1$is_args$args;
...
}