【转】haproxy详解

软件负载均衡一般通过两种方式来实现：基于操作系统的软负载实现和基于第三方应用的软负载实现。LVS就是基于Linux操作系统实现的一种软负载，HAProxy就是开源的并且基于第三应用实现的软负载。HAProxy相比LVS的使用要简单很多，功能方面也很丰富。当前，HAProxy支持两种主要的代理模式:"tcp"也即4层（大多用于邮件服务器、内部协议通信服务器等），和7层（HTTP）。在4层模式下，HAProxy仅在客户端和服务器之间转发双向流量。7层模式下，HAProxy会分析协议，并且能通过允许、拒绝、交换、增加、修改或者***请求 (request)或者回应(response)里指定内容来控制协议，这种操作要基于特定规则。（新的1.3之后的版本引入了frontend,backend指令；frontend根据任意 HTTP请求头内容做规则匹配,然后把请求定向到相关的backend.）
我现在用HAProxy主要在于它有以下优点，这里我总结下：
1、HAProxy是支持虚拟主机的，通过frontend指令来实现
2、能够补充Nginx的一些缺点比如Session的保持，Cookie的引导等工作
3、支持url检测后端的服务器出问题的检测会有很好的帮助。
4、它跟LVS一样，本身仅仅就只是一款负载均衡软件；单纯从效率上来讲HAProxy更会比Nginx有更出色的负载均衡速度，在并发处理上也是优于Nginx的。
5、HAProxy可以对Mysql读进行负载均衡，对后端的MySQL节点进行检测和负载均衡，不过在后端的MySQL slaves数量超过10台时性能不如LVS，所以我向大家推荐LVS+Keepalived。
6、能对请求的url和header中的信息做匹配，有比lvs有更好的7层实现
7、HAProxy的负载均衡算法现在也越来越多了，具体有如下8种：
①roundrobin，表示简单的轮询，这个不多说，这个是负载均衡基本都具备的；
②static-rr，表示根据权重，建议关注；
③leastconn，表示最少连接者先处理，建议关注；
④source，表示根据请求源IP，这个跟Nginx的IP_hash机制类似，我们用其作为解决session问题的一种方法
⑤ri，表示根据请求的URI；
⑥rl_param，表示根据请求的URl参数'balance url_param' requires an URL parameter name；
⑦hdr(name)，表示根据HTTP请求头来锁定每一次HTTP请求；
⑧rdp-cookie(name)，表示根据据cookie(name)来锁定并哈希每一次TCP请求。

一，安装
# wget http://haproxy.1wt.eu/download/1.4/src/haproxy-1.4.25.tar.gz
# tar xf haproxy-1.4.25.tar.gz
# cd haproxy-1.4.25

# make TARGET=linux26 PREFIX=/usr/local/haproxy install
注：TARGET后面根据本机操作系统内核版本来填写
创建配置文件目录，日志目录，并根据需求编写配置文件
# mkdir /usr/local/haproxy/{conf,logs}
# vim /usr/local/haproxy/conf/haproxy.cfg
配置haproxy的日志环境
# vim /etc/syslog.conf
添加：
local0.* /usr/local/logs/haproxy.log
local3.* /usr/local/logs/haproxy_err.log
#vim /etc/sysconfig/syslog
修改：
SYSLOGD_OPTIONS="-r -m 0"
service syslog restart
注： -r enables logging from remote machines

启动：
# /usr/local/haproxy/sbin/haproxy -c /usr/local/haproxy/conf/haproxy.cfg

二、haproxy配置详解
HAProxy配置中分五大部分：
global：全局配置参数，进程级的，用来控制Haproxy启动前的一些进程及系统设置
defaults：配置一些默认的参数，可以被frontend，backend，listen段继承使用
frontend：用来匹配接收客户所请求的域名，uri等，并针对不同的匹配，做不同的请求处理
backend：定义后端服务器集群，以及对后端服务器的一些权重、队列、连接数等选项的设置，我将其理解为Nginx中的upstream块
listen：frontend和backend的组合体

配置案例：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145

global # 全局参数的设置
   log 127.0.0.1 local0 info
   # log语法：log [max_level_1]
   # 全局的日志配置，使用log关键字，指定使用127.0.0.1上的syslog服务中的local0日志设备，
   记录日志等级为info的日志
   user haproxy
   group haproxy
   # 设置运行haproxy的用户和组，也可使用uid，gid关键字替代之
   daemon
   # 以守护进程的方式运行
   nbproc 16
   # 设置haproxy启动时的进程数，根据官方文档的解释，我将其理解为：该值的设置应该和服务
   #器的CPU核心数一致，即常见的2颗8核心CPU的服务器，即共有16核心，则可以将其值设置为：
   #<=16 ，创建多个进程数，可以减少每个进程的任务队列，但是过多的进程数也可能会导致进程
   #的崩溃。这里我设置为16
   maxconn 4096
   # 定义每个haproxy进程的最大连接数，由于每个连接包括一个客户端和一个服务器端，所以单
   #个进程的TCP会话最大数目将是该值的两倍。
   #ulimit -n 65536
   # 设置最大打开的文件描述符数，在1.4的官方文档中提示，该值会自动计算，所以不建议进行
   #设置
   pidfile /var/run/haproxy.pid
   # 定义haproxy的pid


defaults # 默认部分的定义
   mode http
   # mode语法：mode {http|tcp|health} 。http是七层模式，tcp是四层模式，health是健康检测
   #，返回OK
   log 127.0.0.1 local3 err
   # 使用127.0.0.1上的syslog服务的local3设备记录错误信息
   retries 3
   # 定义连接后端服务器的失败重连次数，连接失败次数超过此值后将会将对应后端服务器标记为
   #不可用
   option httplog
   # 启用日志记录HTTP请求，默认haproxy日志记录是不记录HTTP请求的，只记录“时间[Jan 5 13
   #:23:46] 日志服务器[127.0.0.1] 实例名已经pid[haproxy[25218]] 信息[Proxy http_80_in s
   #topped.]”，日志格式很简单。
   option redispatch
   # 当使用了cookie时，haproxy将会将其请求的后端服务器的serverID插入到cookie中，以保证
   #会话的SESSION持久性；而此时，如果后端的服务器宕掉了，但是客户端的cookie是不会刷新的
   #，如果设置此参数，将会将客户的请求强制定向到另外一个后端server上，以保证服务的正常
   option abortonclose
   # 当服务器负载很高的时候，自动结束掉当前队列处理比较久的链接
   option dontlognull
   # 启用该项，日志中将不会记录空连接。所谓空连接就是在上游的负载均衡器或者监控系统为了
   #探测该服务是否存活可用时，需要定期的连接或者获取某一固定的组件或页面，或者探测扫描
   #端口是否在监听或开放等动作被称为空连接；官方文档中标注，如果该服务上游没有其他的负
   #载均衡器的话，建议不要使用该参数，因为互联网上的恶意扫描或其他动作就不会被记录下来
   option httpclose
   # 这个参数我是这样理解的：使用该参数，每处理完一个request时，haproxy都会去检查http头
   #中的Connection的值，如果该值不是close，haproxy将会将其***，如果该值为空将会添加为：
   #Connection: close。使每个客户端和服务器端在完成一次传输后都会主动关闭TCP连接。与该
   #参数类似的另外一个参数是“option forceclose”，该参数的作用是强制关闭对外的服务通道
   #，因为有的服务器端收到Connection: close时，也不会自动关闭TCP连接，如果客户端也不关
   #闭，连接就会一直处于打开，直到超时。
   contimeout 5000
   # 设置成功连接到一台服务器的最长等待时间，默认单位是毫秒，新版本的haproxy使用timeout
   #connect替代，该参数向后兼容
   clitimeout 3000
   # 设置连接客户端发送数据时的成功连接最长等待时间，默认单位是毫秒，新版本haproxy使用
   #timeout client替代。该参数向后兼容
   srvtimeout 3000
   # 设置服务器端回应客户度数据发送的最长等待时间，默认单位是毫秒，新版本haproxy使用
   #timeout server替代。该参数向后兼容

listen status
   # 定义一个名为status的部分，可以在listen指令指定的区域中定义匹配规则和后端服务器ip，
   #相当于需要在其中配置frontend，backend的功能。一般做tcp转发比较合适，不用太多的规则
   #匹配。
   bind 0.0.0.0:1080
   # 定义监听的套接字
   mode http
   # 定义为HTTP模式
   log global
   # 继承global中log的定义
   stats refresh 30s
   # stats是haproxy的一个统计页面的套接字，该参数设置统计页面的刷新间隔为30s
   stats uri /admin?stats
   # 设置统计页面的uri为/admin?stats
   stats realm Private lands
   # 设置统计页面认证时的提示内容
   stats auth admin:password
   # 设置统计页面认证的用户和密码，如果要设置多个，另起一行写入即可
   stats hide-version
   # 隐藏统计页面上的haproxy版本信息


frontend http_80_in # 定义一个名为http_80_in的前端部分，haproxy会监听bind的端口
   bind 0.0.0.0:80
   # http_80_in定义前端部分监听的套接字
   mode http
   # 定义为HTTP模式
   log global
   # 继承global中log的定义
   option forwardfor
   # 启用X-Forwarded-For，在requests头部插入客户端IP发送给后端的server，使后端server获
   #取到客户端的真实IP
   acl static_down nbsrv(static_server) lt 1
   # 定义一个名叫static_down的acl，当backend static_sever中存活机器数小于1时会被匹配到
   acl php_web url_reg /*.php$
   #acl php_web path_end .php
   # 定义一个名叫php_web的acl，当请求的url末尾是以.php结尾的，将会被匹配到，上面两种写
   #法任选其一
   acl static_web url_reg /*.(css|jpg|png|jpeg|js|gif)$
   #acl static_web path_end .gif .png .jpg .css .js .jpeg
   # 定义一个名叫static_web的acl，当请求的url末尾是以.css、.jpg、.png、.jpeg、.js、.gif
   结尾的，将会被匹配到，上面两种写法任选其一
   use_backend php_server if static_down
   # 如果满足策略static_down时，就将请求交予backend php_server
   use_backend php_server if php_web
   # 如果满足策略php_web时，就将请求交予backend php_server
   use_backend static_server if static_web
   # 如果满足策略static_web时，就将请求交予backend static_server


backend php_server #定义一个名为php_server的后端部分，frontend定义的请求会到到这里处理
   mode http
   # 设置为http模式
   balance source
   # 设置haproxy的调度算法为源地址hash
   cookie SERVERID
   # 允许向cookie插入SERVERID，每台服务器的SERVERID可在下面使用cookie关键字定义
   option httpchk GET /test/index.php
   # 开启对后端服务器的健康检测，通过GET /test/index.php来判断后端服务器的健康情况
   server php_server_1 10.12.25.68:80 cookie 1 check inter 2000 rise 3 fall 3 weight 2
   server php_server_2 10.12.25.72:80 cookie 2 check inter 2000 rise 3 fall 3 weight 1
   server php_server_bak 10.12.25.79:80 cookie 3 check inter 1500 rise 3 fall 3 backup
   # server语法：server [:port] [param*]
   # 使用server关键字来设置后端服务器；为后端服务器所设置的内部名称[php_server_1]，该名
   #称将会呈现在日志或警报中、后端服务器的IP地址，支持端口映射[10.12.25.68:80]、指定该
   #服务器的SERVERID为1[cookie 1]、接受健康监测[check]、监测的间隔时长，单位毫秒[inter
   #2000]、监测正常多少次后被认为后端服务器是可用的[rise 3]、监测失败多少次后被认为后端
   #服务器是不可用的[fall 3]、分发的权重[weight 2]、最为备份用的后端服务器，当正常的服
   #务器全部都宕机后，才会启用备份服务器[backup]


backend static_server
   mode http
   option httpchk GET /test/index.html
   server static_server_1 10.12.25.83:80 cookie 3 check inter 2000 rise 3 fall 3


官方配置：
http://haproxy.1wt.eu/download/1.4/doc/configuration.txt

三，虚拟主机核心配置

如下配置中忽略了global，defaults等配置，案例如下：

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

frontend lvs2-lvs3
bind *:8080
acl is_lvs2 hdr_end(host) -i lvs2.test.net:8080
#使用hdr_end指令取request header中的host，如果host是lvs2.test.net:8080，则匹配请求，
#然后把请求打到对应use_backend指定的后端server上
acl is_lvs3 hdr_end(host) -i lvs3.test.net:8080
use_backend lvs2 if is_lvs2
#如果规则if指定的acl匹配，则打到use_backend指定的后端server上
use_backend lvs3 if is_lvs3


backend lvs2
#定义后端server
balance roundrobin
#采用轮询的负载均衡方法，网后端server转发请求
server  free172 10.253.3.14:80 weight 10
server  free173 10.253.3.15:80 weight 10


backend lvs3
balance roundrobin
server  free174 10.253.3.16:80 weight 10
server  free173 10.253.3.15:80 weight 10



官方配置：
http://haproxy.1wt.eu/download/1.4/doc/configuration.txt

四、健康监测
1、通过监听端口进行健康检测
这种检测方式，haproxy只会去检查后端server的端口，并不能保证服务的真正可用。
listen http_proxy 0.0.0.0:80
      mode http
      cookie SERVERID
      balance roundrobin
      option httpchk
      server web1 192.168.1.1:80 cookie server01 check
      server web2 192.168.1.2:80 cookie server02 check inter 500 rise 1 fall 2

2、通过URI获取进行健康检测
这种检测方式，是用过去GET后端server的的web页面，基本上可以代表后端服务的可用性。
listen http_proxy 0.0.0.0:80
      mode http
      cookie SERVERID
      balance roundrobin
      option httpchk GET /index.html
      server web1 192.168.1.1:80 cookie server01 check
      server web2 192.168.1.2:80 cookie server02 check inter 500 rise 1 fall 2

3、通过request获取的头部信息进行匹配进行健康检测
这种检测方式，则是基于高级，精细的一些监测需求。通过对后端服务访问的头部信息进行匹配检测。
listen http_proxy 0.0.0.0:80
      mode http
      cookie SERVERID
      balance roundrobin
      option httpchk HEAD /index.jsp HTTP/1.1 Host: www.xxx.com
      server web1 192.168.1.1:80 cookie server01 check
      server web2 192.168.1.2:80 cookie server02 check inter 500 rise 1 fall 2

五、haproxy实现持久连接
1 调度算法source
haroxy 将用户IP经过hash计算后指定到固定的真实服务器上（类似于nginx 的IP hash 指令）
配置指令       balance source
2 cookie 识别
haproxy 将WEB服务端发送给客户端的cookie中插入(或添加加前缀)haproxy定义的后端的服务器COOKIE ID。
配置指令例举  cookie  SESSION_COOKIE  insert indirect nocache
3 session 识别
haproxy 将后端服务器产生的session和后端服务器标识存在haproxy中的一张表里。客户端请求时先查询这张表。然后根据session分配后端server。
配置指令：appsession <cookie> len <length> timeout <holdtime>

六，haproxy高可用方案
haproxy是本身是一个负载均衡器，可以通过haproxy+keepalived的方案来时现实负载均衡

相关阅读:
UML序列图
 接口初探
 Discuz初探
 Vim指令学习
 UCenter Home代码研读之space.php
建站须知
 linux指令之文件的创建、查询、修改
 InitPHP初探
 php环境搭建
 Zend Framework学习之Zend_Db 数据库操作
原文地址：https://www.cnblogs.com/puremans/p/6427973.html