关于数据切分的原理能够參见博客:
http://blog.csdn.net/jhq0113/article/details/44226789
关于Atlas的介绍能够參见博客:
http://blog.csdn.net/jhq0113/article/details/44239823
Atlas源码用C语言编写。它对于Web Server相当于是DB,相对于DB相当于是Client,假设把Atlas的逻辑放到Web Server程序里去处理,这样会大大添加Web Server程序的复杂度,同一时候Web Server和DB之间的耦合度也相当高,由于仅仅要DB添加/降低服务。Web Server就有可能要发生代码改变,若代码不改变,就得通过中间关系表与心跳机制来维护Server之间的关系。这样会带来性能的损耗,而Atlas是架设在Web Server与DB之间的一个中间件,Web Server与DB之间的耦合关系放到了Atlas来处理,既做到了灵活也保留了性能,这也是Atlas存在的价值。
Atlas支持表的水平切分。支持读写分离,对数据实时性要求较高的项目能够在select语句前添加/*master*/强制读主库,主从MySql数据库之间数据的同步须要自己配置,主从MySql数据库数据主从复制的配置方法參见博客:
http://blog.csdn.net/jhq0113/article/details/44263367
1.安装
注意:仅仅能安装在64位的Linux操作系统上,CentOS官方建议rpm安装方式
获取地址:https://github.com/Qihoo360/Atlas/releases
眼下最新的版本号为:
Atlas-2.2.1.el5.x86_64.rpm CentOS 5.* 版本号
Atlas-2.2.1.el6.x86_64.rpm CentOS 6.* 版本号
我的环境是CentOS 6.6 Basic Server x86_64
安装命令:
[root@jhq0229 src]# rpm -i Atlas-2.2.1.el6.x86_64.rpm
安装位置:
/usr/local/mysql-proxy
配置文件:
/usr/local/mysql-proxy/conf/test.cnf
重要配置文件具体解释:
(1)线程数
event-threads项设置,过小无法充分发挥多核CPU的性能,过大造成不必要的线程切换开销。推荐设置为CPU的核数。
(2)最小空暇连接数(2.x以上版本号不须要该项,1.x版本号须要)
min-idle-connections项设置,过小则在高并发下会有报错。过大尽管不报错但在測试时不easy看出读写分离效果。推荐设置为比client的并发峰值稍大,详见《配置參数具体解释》。上面的配置范例是针对Atlas 2.X版本号。没有该选项。
对于Atlas 1.X版本号的配置文件,须要增加该配置选项
(3)Atlas的工作port
proxy-address项配置。比如proxy-address = 0.0.0.0:1234代表client应该使用1234这个port连接Atlas来发送SQL请求。
(4)Atlas的管理port
admin-address项配置,比如admin-address = 0.0.0.0:2345代表DBA应该使用2345这个port连接Atlas来运行运维管理操作。
(5)管理接口的username和password
admin-username项和admin-password项设置。这两项是用来进入Atlas的管理界面的,与后端连接的MySQL没有关系,所以能够随意设置,不须要MySQL在配置上做不论什么修改。
(6)日志级别
以log-level项配置。分为message、warning、critical、error、debug五个级别。
(7)日志路径
以log-path项配置。如log-path = /usr/local/mysql-proxy/log。
(8)主库的IP和port
proxy-backend-addresses = 192.168.0.12:3306
(9)从库的IP和port,@后面的数字代表权重。用来作负载均衡,若省略则默觉得1。可设置多项,用逗号分隔。假设想让主库也能分担读请求的话,仅仅须要将主库信息增加到以下的配置项中。
proxy-read-only-backend-addresses = 192.168.0.13:3306,192.168.0.14:3306
(10)username与其相应的加密过的MySQLpassword,password使用PREFIX/bin文件夹下的加密程序encrypt加密,username与password之间用冒号分隔。
主从数据库上须要先创建该用户并设置password(username和password在主从数据库上要一致)。比方username为myuser。password为mypwd,运行./encrypt mypwd结果为HJBoxfRsjeI=。假设有多个用户用逗号分隔就可以。则设置例如以下行所看到的:
pwds = myuser: HJBoxfRsjeI=,myuser2:HJBoxfRsjeI=
(11)分表设置,此例中person为库名,mt为表名,id为分表字段。3为子表数量,可设置多项。以逗号分隔。若不分表则不须要设置该项,子表须要事先建好,子表名称为表名_数字,数字范围为[0,子表数-1]。如本例里。子表名称为mt_0、mt_1、mt_2tables = person.mt.id.3
我的配置:
[mysql-proxy] #管理接口的username admin-username = user #管理接口的password admin-password = pwd #Atlas后端连接的MySQL主库的IP和port,可设置多项,用逗号分隔 proxy-backend-addresses = 192.168.1.18:3306 #从库 proxy-read-only-backend-addresses = 192.168.1.16:3306@1 #username和password配置项,须要和主从复制配置的username和password配置一样 #pwds = user1:+jKsgB3YAG8=, user2:GS+tr4TPgqc= pwds = mastt:/iZxz+0GRoA= #后台运行 daemon = true keepalive = true #工作线程数,对Atlas的性能有非常大影响,可依据情况适当设置 event-threads = 8 #日志级别,分为message、warning、critical、error、debug五个级别 log-level = message #日志存放的路径 log-path = /usr/local/mysql-proxy/log #SQL日志的开关,可设置为OFF、ON、REALTIME,OFF代表不记录SQL日志,ON代表记录SQL日志,REALTIME代表记录SQL日>志且实时写入磁盘,默觉得OFF #sql-log = OFF #慢日志输出设置。当设置了该參数时。则日志仅仅输出运行时间超过sql-log-slow(单位:ms)的日志记录。不设置该參数 则输出所有日志。
#sql-log-slow = 10 #实例名称,用于同一台机器上多个Atlas实例间的区分 #instance = test #Atlas监听的工作接口IP和port proxy-address = 192.168.1.18:8060 #Atlas监听的管理接口IP和port admin-address = 192.168.1.18:2345 #分表设置。此例中person为库名,mt为表名,id为分表字段,3为子表数量,可设置多项,以逗号分隔。若不分表则不需 要设置该项 #tables = person.mt.id.3 tables=orders.my_orders.year.2015 #默认字符集。设置该项后客户端不再须要运行SET NAMES语句 charset = utf8 #同意连接Atlas的客户端的IP,能够是精确IP,也能够是IP段。以逗号分隔,若不设置该项则同意所有IP连接,否则仅仅允 许列表中的IP连接 #client-ips = 127.0.0.1, 192.168.1 #Atlas前面挂接的LVS的物理网卡的IP(注意不是虚IP),若有LVS且设置了client-ips则此项必须设置。否则能够不设置 #lvs-ips = 192.168.1.1
从以上配置能够清楚看到:
主库:192.168.1.18:3306
从库:192.168.1.16:3306 权重为1
注意:主从复制须要自行配置。
Atlas Proxy的ip和port为:192.168.1.18:8060
主从复制的用户和password为:mastt 123456,以上的pwds的password是经过加密处理的
若用Navicat登陆,就用Atlas Proxy的ip和port。username和password用主从复制的,主从复制的账户须要设置能够在Navicat上登陆。
分表配置项:
tables=orders.my_orders.year.2015
我的主从库名称是orders,里有三张表。各自是my_orders_0,my_orders_1,my_orders_2,按year字段进行分表,尽管分了2015张表,可是你的数据库里不一定有这么多张表。这里的2015仅仅是取模的一个基数,依照此规律去找到对应的表,比如year=2015,数据请求会发送到my_orders_0表。
编写简单Atlas的启动脚本:
[root@jhq0229 ~]# vim /etc/init.d/atlas
内容例如以下:
#!/bin/sh # #atlas: Atlas Daemon # # chkconfig: - 90 25 # description: Atlas Daemon # # Source function library. start() { echo -n $"Starting atlas: " /usr/local/mysql-proxy/bin/mysql-proxyd test start echo } stop() { echo -n $"Shutting down atlas: " /usr/local/mysql-proxy/bin/mysql-proxyd test stop echo } ATLAS="/usr/local/mysql-proxy/bin/mysql-proxyd" [ -f $ATLAS ] || exit 1 # See how we were called. case "$1" in start) start ;; stop) stop ;; restart) stop sleep 3 start ;; *) echo $"Usage: $0 {start|stop|restart}" exit 1 esac exit 0
授权并增加开机启动[root@jhq0229 ~]# chmod +x /etc/init.d/atlas
[root@jhq0229 ~]# chkconfig atlas on
启动atlas服务
[root@jhq0229 ~]# service atlas start
2.功能測试:
1).利用mastt用户123456passwordNavicat登陆到192.168.1.18:8060查看数据库表,開始数据库中没有数据。
表结构例如以下:
CREATE TABLE `my_orders_0` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '表主键', `pid` int(10) unsigned NOT NULL COMMENT '产品ID', `price` decimal(15,2) NOT NULL COMMENT '单位价格', `num` int(11) NOT NULL COMMENT '购买数量', `person` varchar(255) NOT NULL COMMENT '客户姓名', `atime` int(10) unsigned NOT NULL COMMENT '下单时间', `utime` int(10) unsigned NOT NULL COMMENT '改动时间', `isdel` tinyint(4) NOT NULL DEFAULT '0' COMMENT '软删除标识', `year` smallint(5) unsigned NOT NULL COMMENT '年', PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
插入数据
INSERT INTO `my_orders`(`pid`,`price`,`num`,`person`,`atime`,`utime`,`year`) VALUES ('1', '123.54', '1', '周润发', '1426335606', '1426335606','2015'); INSERT INTO `my_orders`(`pid`,`price`,`num`,`person`,`atime`,`utime`,`year`) VALUES ('3', '13.67', '4', '周迅', '1426338765', '1426338765', '2016'); INSERT INTO `my_orders`(`pid`,`price`,`num`,`person`,`atime`,`utime`,`year`) VALUES ('4', '44.44', '4', '郭敬明', '1426754324', '1426754324','2017');
此时我们会看到my_orders_0,1。2表中分别有一条数据。15年的在0表,16年在1表,17年的在2表。
查询測试,假设不指定表的全名,查询时须要year字段作为where条件,否则不会通过,測试结果例如以下图:
读写分离測试,为了达到測试效果,我们在从库的my_orders_0表手动加入一条数据,语句例如以下:
INSERT INTO `my_orders_0`(`pid`,`price`,`num`,`person`,`atime`,`utime`,`year`) VALUES ('2', '212.54', '1', '梁朝伟', '1426335606', '1426335606','2015');
此时,主库的0表仅仅有一条数据。从表里有两条数据,假设我们运行查询语句SELECT * FROM my_orders WHERE `year`=2015出现一条结果,则都的是主库,若出现两条则为从库。结果例如以下图:
证明已经读的是从库。
測试强制读主库,若运行语句/*master*/ SELECT * FROM my_orders WHERE `year`=2015有两条记录则读的是从库,假设是一条记录都的是主库,測试结果仅仅有周润发一条记录。
至此,Atlas的配置完成。假设将Atlas与Mysql表的分区联合使用能够大大提高大数据的处理能力,希望能够帮助到你。