Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, & c$ i$ g9 q$ j* v( q0 G# Y
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 2 H* f m: `* u0 a( X* h! i
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。0 {. j: ?% m. ~% q( L
6 v. U& z9 K5 P" \1 W' k那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
3 g2 p; h$ Q4 K/ O1 P/ K" N% b7 i/ J8 c1 ^' b: q" q0 c5 w
( @- I3 s2 J# a8 @ q7 o9 J Q- worker_processes 1;, R0 b. v6 q: P E) j8 ^9 c! [$ z% J
- events{
复制代码
" ?$ V* V$ ]+ L& S5 i# K
% v5 h9 g0 R5 ^' ~1 T- Y, y$ o% Y重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方8 Q9 Q0 ]2 @$ n
; Y: e; ^7 z; j6 T' @9 }) |3 ~比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。6 ]7 I' b7 V; K7 M! [" T: Y9 h
8 s8 ]& D" a5 Q3 t, Q9 u9 r9 K
3 p8 [9 h; i- R% f+ L8 r" N! u
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?! Y5 `) G9 ~' q; N
1 \) E" @: J# S# L# E3 b
2 Q/ q# k& n+ ^: @6 c$ D4 o/ }/ x% |
# D& l- X- }8 t% W8 R0 _
6 ~5 c& @+ b6 |( C负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
* f8 R3 q1 C$ d- K0 G" ]) c* D
+ ]% J$ u" `: v' }& |2 p, c
" s1 n7 a g6 q9 G这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。0 B# G6 D7 W5 |: Y& K1 J# x d1 z
2. 加权轮询,使用weight参数设置,配置如下
4 Q+ }1 |0 L: p3 R) `
: U) W! d: w& N( A9 ^+ B, \
3. ip_hash策略+ n* @( z2 m, O' ~; y
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:
! h- ?! H* K; m 其他地方保持不变,在upstreaem中如下设置:
. i+ T: i7 {9 c) N) ]8 O% R% h
9 ~' L" m1 A- q1 Y0 T9 R d2 t$ X Q6 w' _- }' q# ?
' J% [& z+ ]2 p3 S R* ^' Q; h5 e1 Y) g* s
4 `; x. g8 B; U, i3 I# \4. fair策略
# O- L, a0 A5 Z" {(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)4 }) M' {/ z( \% Z
5. url_hash策略
* E0 v9 ]0 Y8 e% E$ p
' v' G( A! H2 N' C! q(类似于ip,只不过绑定的值是url,这个也是第三方策略)
3 B9 ~, t0 E* [. E* gfair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可; c1 @+ U1 l8 Z$ x# v& S
5 M6 g8 L1 J" l
, }/ P% v3 w; Z, [
7 H7 j, h# Q9 D4 L+ i( iurl_hash策略的用处?
0 o3 N" P2 {; p) w5 K* N
% l' Q- Z6 k) ]/ O7 {$ f- Uurl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。- P% M& @# |# [( p1 e6 [. }$ P' ^
0 r6 o; [3 N4 n" ?: l; C7 _
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
3 o/ h, c1 e2 n& [
+ | {+ T- S6 Z C- U) |: R; V' q/ A$ O8 M) t- [( z
3 m' C+ \ K& j# @4 @6 \& {
其他的配置8 }7 {: l& T. r3 P3 C; q! k
备份与停机状态:% c* E* n3 v5 U6 W, l* t
server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;& V) N9 x+ B$ w" R
1 f; f. Z8 F) e2 Jserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,* I0 P' P4 @3 s- q
- ^, v/ _$ x5 f3 [
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
1 E9 ?5 k- V( T( m* u+ _$ ~+ j. N% c
1 r2 \( h- s, l6 O/ s, a- B5 H4 c# _% x+ [) `: `
max_fails: 达到指定次数后认为服务器挂掉
3 o5 K2 K. d: B$ j+ H
+ Y, U: G0 C; U- K* _ fail_timeout:挂掉多久后再次测试是否已经挂掉7 Y5 y2 l; E0 a, E% z, [+ B) j
4 P. Q* u5 `- C' m: E& q9 g8 x1 r配置命令
" Q" g! x+ K4 Q" a0 K' N: c) e9 O
/ V6 ] `! G1 n" |' {. s% {1 Gserver 192.168.1.66 max_fails=2 fail_timeout=60s;* ~3 `0 ]8 P% y1 \ v
3 k2 y& z S t! Y j 后记- x! ~) `6 N- K3 v/ F8 c. e
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
7 u' O' G, l( f. b I: u- j2 K2 A0 U* F% b7 `; e! Q% t
$ e, a) s9 P' }/ M- J3 Z" Q
. w# ^4 B1 d; s* h& F+ J9 l0 }0 t$ S9 e% ?) q
& [$ h7 v: H, [
|