Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, # V/ p# K5 l/ c" x) F6 V, l
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 9 ^ {/ ^6 g+ j: F$ B7 v% L8 d
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。
$ C2 i9 Q6 z8 z$ ?
# T/ h2 b, |, U5 ^- e5 E那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)
+ E& \9 j8 E8 l* L6 q
' [, P! Y' [0 \( A7 l; g3 ]! l
$ U, L W; s7 j# n8 |# [% Z7 ^- worker_processes 1;; N6 y2 @9 M! e) B0 e9 M% J* d% E! s
- events{
复制代码
M* b7 _: G+ U" N" r, T8 }
o e- H) g0 v5 ?6 U* m; p重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
0 q3 i1 C8 _8 A Q) l! w" l; g4 z4 \# O( N4 C7 Y( N
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
. Y$ o# W% i9 d6 J5 N+ `: e6 H
3 T" c; d$ e. ?, }3 p0 r: ~, g! T( d
9 i8 m. ?! {, D' c/ e9 Z0 O接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
2 x* Z- P* e& }( P
6 J1 ?7 ^0 @1 _* A7 O- c
* n2 L D' T% M& W
9 D, }5 E6 l6 K/ q: s" u& Q& F" {+ ^4 P, |
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: ; C1 P o$ X H ]9 A! G4 A
V4 {% _' X! T3 { X, Q5 M0 d' z
# y) v. O# X( @' n
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。 \% s, K5 _6 E4 z. R* F' k
2. 加权轮询,使用weight参数设置,配置如下: x( ?/ P( {5 e' [) R( G
, h9 _3 V% O5 S6 }. ?: q6 p3. ip_hash策略 Y( R7 k8 Y4 P4 Y1 R* c
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:$ u+ o9 w9 R8 s A8 z2 W
其他地方保持不变,在upstreaem中如下设置:2 H6 c: ?& i' Z. a1 @: V9 ^
& n! q3 y/ G- n. K) t" X
( K; ~, T* `1 Z& Z5 u/ P) k
) j% p, e3 v* ?: I6 I9 P( P7 @
9 `, q Z3 N" N3 s, F; N+ s
4. fair策略
2 T+ z Z8 \" a( g0 M! a(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)" X R: P6 L' s$ c
5. url_hash策略
% q2 G# V- o! W8 D( T
$ q- p0 w; `) y3 e(类似于ip,只不过绑定的值是url,这个也是第三方策略)2 L7 g- w9 s4 f$ K' ~" X8 i
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可' o+ j" {4 g% N) { U
5 \& X7 V% r5 j/ d* c
- o1 x* f# ~2 A7 }
3 l: p8 l6 n5 d# purl_hash策略的用处?
+ C1 f! f0 d5 |& D- P+ R
8 n, B6 `7 m6 x! {( u1 G$ {* yurl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
& D* N0 {" J/ ^+ ]: O9 Q; d
; t8 Y* j, a) u8 H5 Z G原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;5 F7 y8 l1 W1 s" @$ u$ q5 T& s# f
A2 |# @% n) o1 D# `+ A9 T ]
9 m$ h5 Q0 H7 F
( l. _/ s( f6 Y R其他的配置
. Y& E* P0 Q- ^" s! H$ J+ x备份与停机状态:
3 s# h1 k& F& n% c. D2 h* s6 ^server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
) z. B1 T% R5 d1 ]
* `* N6 a" U8 r M5 Pserver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
" F' ^5 M9 y( d: ~4 z G1 E/ ~
* r' u" q& H+ s Ndown存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。
0 ]1 T6 z# I# {- I( I
1 ^- z; p9 X& C2 T5 B
" s9 h, d3 M" h9 @9 c% N0 d0 p8 ]/ V* x6 d5 d
max_fails: 达到指定次数后认为服务器挂掉
- X% l% U' E% c+ Y1 j2 e Y. W- a; }; L3 y. t2 Z/ V- [
fail_timeout:挂掉多久后再次测试是否已经挂掉
0 \( `. A1 |. Q
! o% v' r9 F5 p l7 V- ^配置命令
( a* K$ Q- G- s3 a( n+ A1 R) h8 B, S0 W4 G( d& ]" q
server 192.168.1.66 max_fails=2 fail_timeout=60s;* |! [1 u' t, C0 \8 n1 G
) V2 g. v: U! C 后记
}& L8 r, ]0 S, x7 {+ w0 m- |5 r我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
" U5 `5 W( i% n1 \: e2 W
8 j" f- V% z' d/ r1 g$ p7 h7 |! l, {& d& t6 ~) S9 g p' \+ C/ Y2 j
3 u$ g' t# l9 U2 T6 w
2 g7 n) G9 {- P1 O2 h$ b. F
7 @, N# `" u! ]8 R6 T* C9 V' l2 G0 s# f
|