Nginx的负载均衡是基于反向代理实现的,因此,本文先讨论什么是反向代理,再在这个的基础上讨论负载均衡以及负载均衡时应该注意哪些策略。 反向代理:如下图所示, : j5 P) r; x; t! C
↓-----Nginx将结果返回给浏览器---丨 对Tomcat来说,只知道服务对象是Nginx服务器 浏览器 -发起对该域的访问请求-> Nginx --------------Nginx将请求来转发给Tomcat服务器----> Tomcat... 丨-对Tomcat来说,只对nginx负责,将结果返回给Nginx服务器---↑ 1 o5 V9 Z9 D0 w) n7 B4 p
从图中,我们可以知道,对于浏览器来说,他会发一个http://www.a.com/uri请求到Nginx服务器,对于他来说,他认为数据就是从http://www.a.com/uri域中返回的,事实上,当http://www.a.com/uri到达Nginx服务器后,Nginx服务器会将其转发给http://www.b.com/uri,从http://www.b.com/uri域中取得数据并将其返回给浏览器,这个步骤浏览器是不知道的,也就是说,浏览器并不知道http://www.b.com/uri该域的存在,同理,http://www.b.com/uri所在的域(图中的Tomcat)也并不知道浏览器的存在,他也只对Nginx负责。Nginx的这么一个过程便称为反向代理。( `% }6 H* ~+ h; C
' U# s. m" @) K% M2 `
那么,Nginx服务器是如何实现这一步的呢,事实上也很简单,只需要在location中做一下简单的配置即可,命令大概如下图所示:(配置完命令记得reload重新加载才能生效)6 A2 k/ |* q( R. N8 e3 o& y; A# W
^0 y5 I2 X" W# m* F& d
/ Q7 t3 y8 q! j' t- worker_processes 1;
* w9 U, v P$ z - events{
复制代码 ) _& k/ g. L2 p
: J& v8 r9 F% q; Y; N) i. l
重点在于location处,这样的配置代表的是,所有来自浏览器的请求,在Nginx收到之后,都会代理到http://192.168.1.62:8080所在的地方, B' p! \! e& S' U+ B& S2 E8 _
K4 Q! V/ B9 D7 e ]3 }/ F比如,我浏览器上发起http://192.168.1.61/a/index.html;Nginx收到之后,将会发出http:// 192.168.1.62:8080/a/index.html这么一个请求到所连接的服务器上,如上图的Tomcat。- l( k9 O& w8 ~
5 z4 F) `" Z' C% X2 C" d
7 [& k* A: E8 x; t6 L接下来我们做这样一个假设,假如后端连接着几台。几十台服务器呢,这个时候Nginx也是做同样的代理吗,答案是肯定的。图示如下:那么,在这么多台服务器上,Nginx的转发又是基于怎样的策略呢?这个时候就涉及在负载均衡了,说白了就是,应该怎样的分发,才能做到资源的最大限度的利用?
P% r5 w% n, d9 p2 q# g8 C
; D$ B! [) I3 V& H3 c" }! z" t: o. R3 v* _8 L) l
4 g% T% s( A- o. Z0 p
3 M. V3 h0 d+ u- U6 R) u- Q8 D
负载均衡策略( 我们这里假设三台服务器的IP地址分别为 http:// 192.168.1.62:8080 http:// 192.168.1.63:8080 http:// 192.168.1.64:8080 ) 1. 平均轮询配置如下图: ) h D' D) m" Z, x. V
( M/ B& b) P. I; Y; ]& Z. M3 W' B* E( U+ P
这里我们把后台所有的服务器放入upstream中,并在代理中进行引用。
8 H @: Z6 @# x8 y+ c2 R! y) C 2. 加权轮询,使用weight参数设置,配置如下
) ^5 w% V& E& U; U8 J" l9 x
A7 z. A9 d1 Q# r6 P3. ip_hash策略; i9 D* L# j$ T- L1 h! d2 e
(根据用户的IP地址进行hash运算,只要是同个用户发的请求,就会被永远地转发在某台服务器上,比如张三发的请求第一次时是由Tomcat1返回的,李四的是有Tomcat2返回的,那么,以后张三的所有请求,都有由Tomcat1返回,这就是ip_hash策略),配置如下:& f" Q3 g G7 X! \7 n* r
其他地方保持不变,在upstreaem中如下设置:& l2 L" u$ X0 f+ v
) F' m) y; H% W
; I- H' B! S; B7 x; |/ W1 e
, A& Y1 s- U! V6 r6 [
; P9 j% `3 l5 x: U# v4. fair策略
0 M4 B# ^+ R" P5 ?. N* C1 `3 @(动态weight策略,我们的加权轮询是显式指定weight的,而fair策略是根据服务器的响应能力进行动态指定的,而意义上讲,我觉得是更为智能化的解决方法,不过这里要记住一点,fair策略是一个第三方策略)% _, R. c, D- e$ L
5. url_hash策略
6 o5 F( H' B. t' F3 e
0 l8 I: ^' K. G0 a# y; Z8 V% y! _(类似于ip,只不过绑定的值是url,这个也是第三方策略)9 g+ ?+ D7 l. P' @. g2 D$ A
fair策略与url_hash策略的配置与ip_hash策略的类似,直接把upstream tomcats 中的ip_hash替换为fair和url_hash即可,不过这里需要注意的是fair和url_hash都是第三方扩展,因此需要先安装第三方扩展模块,直接百度搜索nginx-upstream-fair-master.zip与upstream-url-hash -master.zip;解压安装使用make&&make install重新编译源文件即可
O4 q F9 L4 \2 q5 U
& M) H$ ^9 y3 d% `. {3 U: z
- i3 w) }* O! {# d b* y& X; ?4 O. v
url_hash策略的用处?& Y: ^/ c/ C+ u6 V- V+ `% O2 A. |
) r" t. B( J" n7 X1 l" M/ _
url_hash策略比较适合于大型电子商务网站,对于不同的商品便是不同的url,我们可以据此进行负载均衡。
8 x+ B* T! p8 b2 ]# @; T8 k8 g2 a7 m7 B8 i* t
原理就是不同的商品形成不同的静态页面,然后服务器根据不同商品的火爆程度,按照命中率高的放在缓存里,加快访问速度,也就是说实现了一个基于缓存的服务器,相当于把有限的缓存最优化起来;( v' P5 S6 b5 L$ m m
% v2 d( h+ z9 Z& U1 R% v) R: p1 z0 ]4 [/ M
& g3 y0 b# U, e- g7 K8 e
其他的配置 \+ E- E, ?8 b8 D; m
备份与停机状态:
/ r6 Y. [2 M' P0 b4 |server 192.168.1.64 backup;//备份,不参与转发,只有当所有服务器都挂掉时才参与转发;# v3 s! |* p1 _
9 o' @- k) v% z$ n; M. J
server 192.168.1.65 down;//临时停机维护,不参与任何转发,是关闭状态,0 n5 r7 s1 d# v* X# f; |
; q C6 e0 V+ L1 Y7 Y" r
down存在的意义在于,有时我们需要对服务器做临时停机更新维护,假如我们直接关闭服务器的话,那么对于Nginx来说,他还是会把请求发到该服务器上的,因为他并不知道服务器已关,而设置down后,Nginx则不会再发到该服务器上了,避免造成无用的请求浪费。7 B6 ?3 G9 Z) S0 s# X y
& m' S' }$ \% i+ r' n
; F/ c2 Y' t$ p R9 M7 j; ?
; k1 E/ i6 i$ G0 Kmax_fails: 达到指定次数后认为服务器挂掉; i4 C% I) |# w$ @9 {' U) b$ G
6 S! O: b! b* B, ^, t' r4 I
fail_timeout:挂掉多久后再次测试是否已经挂掉
# }+ m/ M3 N0 D
% }. t& X8 G% B( R9 ]配置命令2 f% L! N+ N- F( z1 a
" A; [+ S- e' h6 |: k
server 192.168.1.66 max_fails=2 fail_timeout=60s;
, L7 ?& O" I' P0 M6 T! B7 g1 Y/ g9 m, P4 ^+ d$ L5 _+ ^/ l2 v
后记
9 D& n' _( u: G! C" X" m. w我们知道,服务器是会存储用户的session的,那么,如果按照上文所说的,比如fair策略,每次Nginx会根据后端服务器群的能力把请求分发出去,那假如第一次时分在了A,那么我把数据存储到了A服务器上,第二次时,刚好被分配到了B服务器上,那么问题来了,我的session不就不见了?(这就是我们在访问部分网站时有时我们的登录状态会不见)当然了,你可能 会说,ip_hash策略不就可以避免这一点吗?没错,这确实是一个解决方法,那除了ip_hash呢?其他策略下又当如何呢?下篇博客将会讲到负载均衡下如何对session进行处理。
4 V8 R) D9 F( O: u0 k9 N5 p3 o: S6 }8 Q; b
1 C0 i/ ?! T8 R9 p/ q; @" |
$ s7 Z$ n$ s0 X9 F# z4 r* W7 @/ O/ J8 D& j
4 A8 a' m5 V: k z- O
|