MyCat-schema.xml详解

一、概念与图示

schema.xml配置的几个术语与其关系图示：

二、schema 标签

schema 标签用于定义 MyCat 实例中的逻辑库，如：

1. name属性

配置逻辑库的名字（即数据库实例名）；

2. dataNode属性

用于配置该逻辑库默认的分片。没有通过table标签配置的表，就会走到默认的分片上。这里注意没有配置在table标签的表，用工具查看是无法显示的，但是可以正常使用。

如果没有配置dataNode属性，则没有配置在table标签的表，是无法使用的。注意，dual表在mycat中，也被视为一个表。

查询：select sysdate() from dual LIMIT 0, 1000

错误代码： 1064

can't find table define in schema DUAL schema:USERDB

另外，通过mycat建表，而该表并没有提前配置table标签，则mycat会找到默认的dataNode，并把表建在默认的dataNode上。如果没有配置默认dataNode，则mycat会报错。

查询：create table test(id varchar(10))

错误代码： 1064

op table not in schema----TEST

而如果该表有配置table标签，则表会分别在table标签指定的dataNode上建表。

3. checkSQLschema属性

boolean类型。

当前端执行【select *from USERDB.tf_user;】时（表名前指定了mycat逻辑库名），两种取值：

true：mycat会把语句转换为【select * from tf_user;】

false：会报错

查询：SELECT * FROM USERDB.tf_user LIMIT 0, 1000

错误代码： 1064

find no Route:SELECT * FROM USERDB.tf_user LIMIT 0, 1000

4. sqlMaxLimit属性

相当于sql的结果集中，加上【limit N】。如果sql本身已经指定limit，则以sql指定的为准。

mysql> explain select * from tf_user;

+-----------+---------------------------------+

| DATA_NODE | SQL |

+-----------+---------------------------------+

| dn1 | SELECT * FROM tf_user LIMIT 100 |

| dn2 | SELECT * FROM tf_user LIMIT 100 |

+-----------+---------------------------------+

2 rows in set (0.00 sec)

mysql> explain select * from tf_user limit 50;

+-----------+--------------------------------+

| DATA_NODE | SQL |

+-----------+--------------------------------+

| dn1 | SELECT * FROM tf_user LIMIT 50 |

| dn2 | SELECT * FROM tf_user LIMIT 50 |

+-----------+--------------------------------+

2 rows in set (0.00 sec)

注意，如果table标签的表，needAddLimit属性配置为false，则该表的sql禁止自动加上limit

三、table 标签

table标签为schema标签的子标签。

table标签用于定义Mycat的逻辑表，以及逻辑表的分片规则。如：

1. name属性

逻辑表的表名，同一个schema表名必须唯一。

2. dataNode属性

定义这个逻辑表所属的 dataNode，用英文逗号间隔，如：dataNode="dn1,dn2"

如果dataNode过多，可以使用如下的方法减少配置：

db$0-99为mysql的数据库，即从db0至db99的数据库（100个）。

3. rule属性

该属性用于指定逻辑表要使用的规则名字，规则名字在 rule.xml 中定义，必须与 tableRule 标签中 name 属性属性值一一对应。

4. ruleRequired属性

该属性用于指定表是否绑定分片规则，如果配置为 true，但没有配置具体 rule 的话，程序会报错

5. primaryKey属性

指定该逻辑表对应真实表的主键。MyCat会缓存主键（通过primaryKey属性配置）与具体 dataNode的信息。当分片规则使用非主键进行分片时，那么在使用主键进行查询时，MyCat就会通过缓存先确定记录在哪个dataNode上，然后再在该dataNode上执行查询。

如果缓存并没有命中的话，还是会发送语句给所有的dataNode。

mysql> explain select * from employee where id=101;

+-----------+-------------------------------------+

| DATA_NODE | SQL |

+-----------+-------------------------------------+

| dn1 | select * from employee where id=101 |

| dn2 | select * from employee where id=101 |

+-----------+-------------------------------------+

2 rows in set (0.00 sec)

mysql> select * from employee where id=101;

+-----+------+-------------+

| id | name | sharding_id |

+-----+------+-------------+

| 101 | A | 10000 |

+-----+------+-------------+

1 row in set (0.01 sec)

mysql> explain select * from employee where id=101;

+-----------+-------------------------------------+

| DATA_NODE | SQL |

+-----------+-------------------------------------+

| dn1 | select * from employee where id=101 |

+-----------+-------------------------------------+

1 row in set (0.00 sec)

关于Mycat的主键缓存，其机制是：当根据主键查询的SQL语句第一次执行时，Mycat会对其结果进行分析，确定该主键在哪个分片上，并进行该主键到分片ID的缓存。通过连接MyCAT的9066管理端口，执行show@@cache，可以显示当前缓存的使用情况。可在sql执行前后的2个时间点执行show @@cache，通过结果信息中的LAST_PUT和LAST_ACCESS列，判断相应表的缓存是否有被更新过。

6. type属性

该属性定义了逻辑表的类型，目前逻辑表只有“全局表”和”普通表”两种类型。对应的配置：

全局表：global。

普通表：不指定该值为 global 的所有表。

7. autoIncrement属性

8. subTables属性

分表配置，mycat1.6之后开始支持，但dataNode 在分表条件下只能配置一个。

9. needAddLimit属性

与schema标签的sqlMaxLimit配合使用，如果needAddLimit值为false，则语句不会加上limit

四、childTable 标签

childTable 标签用于定义 E-R 分片的子表。通过标签上的属性与父表进行关联。

1. name属性

定义子表的表名

2. joinKey属性

插入子表的时候会使用这个列的值查找父表存储的数据节点。

3. parentKey属性

该属性指定的值一般为与父表建立关联关系的列名。Mycat首先获取 joinkey 的值，再通过 parentKey 属性指定的列名产生查询语句，通过执行该语句得到父表存储在哪个分片上。从而确定子表存储的位置。

4. primaryKey属性

同table标签描述。

5. needAddLimit 属性

同table标签描述。

五、dataNode 标签

1. name 属性

指定分片的名字

2. dataHost 属性

定义该分片属于哪个数据库实例

3. database 属性

定义该分片属于哪个具体数据库实例上的具体库（即对应mysql中实际的DB）

六、dataHost标签

定义后端的数据库主机

1. name 属性

指定dataHost的名字

2. maxCon

指定每个读写实例连接池的最大连接。也就是说，标签内嵌套的writeHost、 readHost 标签都会使用这个属

性的值来实例化出连接池的最大连接数。

3. minCon 属性

指定每个读写实例连接池的最小连接，初始化连接池的大小。

4. balance 属性

负载均衡类型：

（1）balance="0", 不开启读写分离机制，所有读操作都发送到当前可用的writeHost 上。

（2）balance="1"，全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡，简单的说，当双主双从模式(M1->S1，M2->S2，并且 M1 与 M2 互为主备)，正常情况下，M2,S1,S2 都参与 select 语句的负载均衡。

（3）balance="2"，所有读操作都随机的在 writeHost、 readhost 上分发。

（4）balance="3"，所有读请求随机的分发到 wiriterHost 对应的 readhost 执行，writerHost 不负担读压力，注意 balance=3 只在 1.4 及其以后版本有，1.3 没有。

5. writeType 属性

（1）writeType="0", 所有写操作发送到配置的第一个 writeHost，第一个挂了切到还生存的第二个riteHost，重新启动后已切换后的为准，切换记录在配置文件中:dnindex.properties.

（2）writeType="1"，所有写操作都随机的发送到配置的 writeHost，1.5 以后废弃不推荐。

6. dbType 属性

指定后端连接的数据库类型，目前支持二进制的 mysql 协议，还有其他使用 JDBC 连接的数据库。例如：mongodb、 oracle、 spark 等。

7. dbDriver 属性

指定连接后端数据库使用的 Driver，目前可选的值有 native 和 JDBC。使用native 的话，因为这个值执行的是二进制的 mysql 协议，所以可以使用 mysql 和 maridb。其他类型的数据库则需要使用 JDBC 驱动来支持。

8. switchType 属性

-1 表示不自动切换

1 默认值，自动切换

2 基于 MySQL 主从同步的状态决定是否切换

心跳语句为 show slave status

3 基于 MySQL galary cluster 的切换机制（适合集群）（1.4.1）

心跳语句为 show status like ‘wsrep%’.

9. tempReadHostAvailable 属性

如果配置了这个属性 writeHost 下面的 readHost 仍旧可用，默认 0 可配置（0、 1）。

七、writeHost 标签、 readHost 标签

1. host 属性

用于标识不同实例，一般 writeHost 我们使用*M1，readHost 我们用*S1。

2. url 属性

后端实例连接地址，如果是使用 native 的 dbDriver，则一般为 address:port 这种形式。用 JDBC 或其他的dbDriver，则需要特殊指定。当使用 JDBC 时则可以这么写：jdbc:mysql://localhost:3306/。

3. user 属性

后端存储实例需要的用户名字

4. password 属性

后端存储实例需要的密码

5. weight 属性

权重配置在 readhost 中作为读节点的权重（1.4 以后）

6. usingDecrypt 属性

是否对密码加密默认 0 否如需要开启配置 1，同时使用加密程序对密码加密

相关阅读:
为什么GNU grep如此之快？
在百度nlp实习一个月时间里用到的shell操作
 InfoPi简介、试用链接、资料索引
 自定义worker的方法，及一例
 2017.1.9版给信息源新增：max_len、max_db字段
 手把手写一个html_json信息源
 定义信息源的一些示例（xml文件）
启用https协议的方法
 安装第三方Python模块，增加InfoPi的健壮性
 更新日志(建议升级到2017.1.18a) && 更新程序的方法
原文地址：https://www.cnblogs.com/icebutterfly/p/9505624.html