Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, ! T3 D5 e3 p" S# }* |3 V1 B4 b t
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 3 F. E1 R0 V* a- z3 }9 S
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。0 Z; R$ i' k& W9 w- Y
) z( G8 Y" E' E% m1 R5 ]3 C: E那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)& s, `0 Z, ~3 t7 }
* }$ i- s+ b! ]" ?0 s6 P0 H+ H0 T# m) i$ z' L `6 ]5 i
- worker_processes 1;
7 O, [6 i' D: q- ?, D, u - events{
复制代码
5 J5 X# A/ @7 t
1 u$ s- I. R5 {, d: E1 d# ?重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
8 V6 O$ m5 I3 n" [
3 Z. C$ o$ j2 c1 E: w比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。
$ F) G2 M( Z9 v% q$ K' b" q$ N, {5 ?* Y
# W) {! o& g# M2 t% s( E* P接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
0 a' G5 W" R5 K! N" X% O8 |9 k( V; A
/ \8 e+ S/ b$ j$ E8 H) V8 z
- P2 v* P$ g4 y" G$ o: @8 Q% i; I. @
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图:
. O0 W7 c7 e* ~% o
2 y% D/ ?: q! B/ B8 a
+ H' ]) o- H- Y这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。7 l$ x) V1 ]) }9 n d0 Q
2. 加权轮询,使用weight参数设置,配置如下
; T4 D" [2 y9 }3 B2 @+ n! g( V& u% p
; x, I+ S" n2 v8 N, s3. ip_hash策略
+ k8 [8 }' M* a' b! }2 F! o5 r(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:/ J5 U2 C+ K: h4 m H2 k
其他地方保持不变,在upstreaem中如下设置:5 _6 H# S! l; @
& M/ {) e O+ H, ^5 n
- x7 [3 Y) Z+ z- S+ P1 d3 e
+ |7 m* z7 F7 i$ A& n* |) ~* k! U: I I2 v- N2 I( G
4. fair策略
3 P' ?* z# o( _9 R(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)
1 l" v& b# L* E- v: ~5. url_hash策略
4 A/ c. T. g% Q, N! v- b: H. z: Q0 S0 T% _2 S1 g" O- ~
(类似于ip,只不过绑定的值是url,这个也是第三方策略)9 P) s$ r- D" o
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
9 i3 i5 i6 c1 p+ U* e. m( t9 s
& C4 k6 q, a9 ]5 k* l* U9 E V! d# {9 }( e
' d4 p+ ?$ C) O; E6 h) kurl_hash策略的用处?
+ W2 F3 r; l& _9 j" X4 b Y7 J, a
0 ^3 x7 ^: a \* g4 g n( T! Rurl_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。0 O4 x- ?, Z4 X/ T1 {( z( e
3 `* R- }* H% C6 G. F( H9 r4 E原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;: b5 a9 t( ?9 Y. W* j
$ W* L* j, p3 d" M& ]# d$ d
& ~# F8 _8 t6 Y h* E" A+ V9 m
- n* O4 l \, H8 |其他的配置
, j1 y, c4 p* a备份与停机状态:
1 d+ i" N; V7 k: F: c1 Gserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;5 Y5 Z( Z# s$ N2 o
* g& m0 K% ^( B' \: a. E
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,9 ]1 ~0 @( E y# d
$ v' J( k. n2 k8 }
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。/ ^" }" f q8 G0 S+ s
~. }& Q" z! x
6 c/ j8 \. p* ^# r* B/ o5 v B4 @6 c1 ] h% S, C1 J6 O/ t: t
max_fails: 达到指定次数后认为服务器挂掉
# ]& f# `9 V4 X3 `6 p5 f- K: ^' h
7 ?: b2 d% E3 Z% B$ o6 o fail_timeout:挂掉多久后再次测试是否已经挂掉/ ?- J" Y6 D9 ~' [3 n8 O0 i5 `1 I2 P/ J
3 N4 a6 t) a1 q& Z7 C) O配置命令
1 M8 h5 g: [, @' |, ^6 f
5 J' Y% i& @+ d3 ^server 192.168.1.66 max_fails=2 fail_timeout=60s;
2 K9 Z+ O2 U0 _; J, Q. @
5 h9 m/ F4 z* a) u: Q% x 后记
) @( m( |$ C6 d( p6 h* @我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。3 C7 r' v9 L) K5 I, G
( w1 w3 P8 v, w% u3 d
; _- I: q6 q2 q$ l& f' Z( u) q
, `9 A& c& m: j8 c+ ?
: w' i1 ]3 L- {/ F
% E( }1 P9 M$ t$ X
|