Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, ' E, y) K0 } B
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ : d8 G% @" O+ C; Q8 J
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。1 @2 G* B; H7 F7 @
0 \; ~% F; S( |2 B! P( g那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)9 i) e& J( P# G4 z) K9 B* o
0 H: y" s8 {% r; e c: a
0 V* X# D5 F( d1 z5 V) r' ?- worker_processes 1;4 W' K$ H# [9 `( V6 ?& S6 n
- events{
复制代码 : g6 f! ?$ [" J; [$ a# D, w
3 }8 e% g" M6 r" P& y
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方
# W; P9 a. q& e0 z4 g3 c. z% {- I% t" }" x6 ?3 Z0 q0 q2 b0 J
比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。$ g$ c0 H n4 G+ K9 o9 c
% S8 h5 t% `4 D( e
5 n \* Q: ^: Q! }8 d6 t* C& F" F
接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?! B! _( K4 @) A' ^: P" C- ~2 ?
9 ^; p: T! M3 E. L$ ?
# d$ w a3 [& T
# Z9 s" w- a7 \ [
7 k* ~+ Y" [7 |1 z2 n负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: 2 j6 o$ V+ \; ~# C6 d
4 r( ]5 r# c4 z4 g
4 b+ ~) z: p/ O4 I+ W7 a; q
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
! t! \0 b! I2 t4 Q4 f 2. 加权轮询,使用weight参数设置,配置如下5 X4 E3 L; w0 e- z- W
0 d7 w/ c3 a3 D( s( f3. ip_hash策略 o; Z9 b& \3 Q; g6 h, V3 M1 m: ]
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:* g# R( G( A& [9 H; h9 D$ O
其他地方保持不变,在upstreaem中如下设置:
3 t# x& ?& W9 b6 I
! r% j) V% h2 k! Z' N& x' Y( I( I- b6 t. p# v. r% S a2 p7 W+ ^
6 g% Q/ Q' Q# Q8 V7 n, ^5 _& C: d% ?
4. fair策略
/ c' _) n& J7 _3 R(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)" @( j" f* r8 j# H. v; h+ D+ f+ I
5. url_hash策略
4 D: b7 `8 ?& c" W7 J8 @1 o8 f3 r1 V f
(类似于ip,只不过绑定的值是url,这个也是第三方策略)3 G9 }: D9 v) p
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可4 E3 ^2 z9 M- o0 H" y' e
! C5 ]% W" G* [- S% W( C+ P @7 \! b
- Q0 z2 A, {2 aurl_hash策略的用处?
6 l3 s4 X! f! V0 c4 `) E# v$ B$ v4 ~; Q
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
- y i7 ]& F/ `9 d* w# x
' r) m! p) R; ?% j# V/ d8 p原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;
* o; y" t' b0 @% f8 }/ l5 j' j/ p: d% u4 q6 b, a
7 l( C' Q, a3 N
4 R( d9 K1 B2 D- D5 \7 |+ q& |其他的配置
H3 a: Z* l8 o- x5 O/ G6 A: ^备份与停机状态:
2 d4 _" F: [. \$ o% n" o* _3 u4 `3 h2 Nserver 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;
! E X% `1 S6 r, D% y% |3 r5 _) v
. ?- u, c* c) r: e+ R" p. Userver 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,
5 _. v5 @/ ^" W$ _" H6 a# y$ ?3 f5 @, T8 \! ?; F/ c
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。6 ]6 h" g. [3 J& G% h
: r9 s1 Y& j% d" A0 V! [. E- z' C
. o% O+ `9 s0 smax_fails: 达到指定次数后认为服务器挂掉
' }6 ]6 U0 }8 K) s
' G5 Z$ K9 G8 L: ]( L8 _% j fail_timeout:挂掉多久后再次测试是否已经挂掉
1 t) d; w, n8 }" X9 L; B: Y3 |
( n) O0 t! r u& o5 K配置命令( s$ X3 L, [8 ?9 [' S7 [
2 K3 I# v" J+ S' @6 p2 O" o d
server 192.168.1.66 max_fails=2 fail_timeout=60s;0 ?5 J) m: Y2 c8 _' L2 `0 L
/ n; t3 X8 \) n+ S$ x
后记: H' M& M8 C! Q% l( h3 r# w& P) c
我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
( s7 e( f* ~( n h) Z4 X
4 @! G2 N3 _, _ P+ x: E* L: M
( Z) G$ `; C% O: ?4 H
. m5 Z9 t, d* W) H/ I$ e4 ^1 O" {$ j+ v" W
8 g1 z4 H' P$ m! k2 z3 O( Y, u$ V( | |