oralce索引和分区索引的使用

oralce索引和分区索引的使用

oracle分区表和分区索引的本质就是将数据分段存储，包括表和索引（索引从本质上来讲也是表），表分区会将表分成多个段分别存储。由此数据查询过程改变为先根据查询条件定位分区表，然后从该表中查询数据，从而提高性能。这些操作对用户是透明的，用户只需要使用普通的存取操作即可。

1. 分区表

分区表一般有如下几种：

range分区方式：

最常用的分区方式，通过某个字段或者某几个字段组合的值，从小到大，按照指定的范围进行分区，在insert数据时就会把数据插入到指定分区中去。

List分区方式：

通常作为二级分区，是一种列举方式的分区，一般某些地区，规则等可以枚举的数据可以采用此种方法分区。

Hash分区方式：

由oracle自身管理的分区方式，用于只需要insert即可。

2. 分区索引

一般一张表超过2G，就推荐使用分区表，分区一般都需要创建索引。索引也就是目录，通过索引能够快速定位到记录。索引可以分为全局索引、分区索引；也即global索引和local索引。global为默认的索引创建方式，并不对索引进行分区（索引也可以分区）。

a. 分区表的不分区索引：

CREATE INDEX <index_name> ON <partition_table_name>(<column_name>);

b. 分区表的分区索引：

CREATE [url=]INDEX[/url] INX_TAB_PARTITION_COL1 ON TABLE_PARTITION(COL1)
GLOBAL PARTITION BY RANGE(COL1)
         PARTITION IDX_P1 values less than (1000000),
         PARTITION IDX_P2 values less than (2000000),
         PARTITION IDX_P3 values less than (MAXVALUE)
)

c. Local索引

CREATE INDEX INX_TAB_PARTITION_COL1 ON TABLE_PARTITION(COL1) LOCAL;

d. 对比使用方式

一般使用local索引比较方便，管理简单，可以自动维护。

3. 常用SQL

a、查询当前用户下有哪些是分区表：

SELECT * FROM USER_PART_TABLES;

b、查询当前用户下有哪些分区索引：

SELECT * FROM USER_PART_INDEXES;

c、查询当前用户下分区索引的分区信息：

SELECT * FROM USER_IND_PARTITIONS T WHERE T.INDEX_NAME=?

d、查询当前用户下分区表的分区信息：

SELECT * FROM USER_TAB_PARTITIONS T WHERE T.TABLE_NAME=?;

e、查询某分区下的数据量：

SELECT COUNT(*) FROM TABLE_PARTITION PARTITION(TAB_PARTOTION_01);

f、查询索引、表上在那些列上创建了分区：

SELECT * FROM USER_PART_KEY_COLUMNS;

g、查询某用户下二级分区的信息（只有创建了二级分区才有数据）：

SELECT * FROM USER_TAB_SUBPARTITIONS;

4. 维护操作

4.1、删除分区
    ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_03;
    如果是全局索引，因为全局索引的分区结构和表可以不一致，若不一致的情况下，会导致整个全局索引失效，在删除分区的时候，语句修改为：
    ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_03 UPDATE GLOBAL INDEXES;

4.2、分区合并（从中间删除掉一个分区，或者两个分区需要合并后减少分区数量）
合并分区和删除中间的RANGE有点像，但是合并分区是不会删除数据的，对于LIST、HASH分区也是和RANGE分区不一样的，其语法为：
ALTER TABLE TABLE_PARTITION MERGE PARTITIONS    TAB_PARTOTION_01,TAB_PARTOTION_02 INTO PARTITION MERGED_PARTITION;

4.3、分隔分区（一般分区从扩展分区从分隔）
ALTER TABLE TABLE_PARTITION SPLIT PARTITION TAB_PARTOTION_OTHERE AT(2500000)
INTO (PARTITION TAB_PARTOTION_05,PARTITION TAB_PARTOTION_OTHERE);

4.4、创建新的分区（分区数据若不能提供范围，则插入时会报错，需要增加分区来扩大范围）
一般有扩展分区的是都是用分隔的方式，若上述创建表时没有创建TAB_PARTOTION_OTHER分区时，在插入数据较大时（按照上述建立规则，超过1800000就应该创建新的分区来存储），就可以创建新的分区，如：
为了试验，我们将扩展分区先删除掉再创建新的分区（因为ORACLE要求，分区的数据不允许重叠，即按照分区字段同样的数据不能同时存储在不同的分区中）：
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_OTHER;
ALTER TABLE TABLE_PARTITION ADD PARTITION TAB_PARTOTION_06 VALUES LESS THAN(2500000);
在分区下创建新的子分区大致如下（RANGE分区，若为LIST或HASH分区，将创建方式修改为对应的方式即可）：
ALTER TABLE <table_name> MODIFY PARTITION <partition_name> ADD SUBPARTITION <user_define_subpartition_name> VALUES LESS THAN(....);

4.5、修改分区名称（修改相关的属性信息）:
ALTER TABLE TABLE_PARTITION RENAME PARTITION MERGED_PARTITION TO MERGED_PARTITION02;

4.6、交换分区（快速交换数据，其实是交换段名称指针）
首先创建一个交换表，和原表结构相同，如果有数据，必须符合所交换对应分区的条件：
CREATE TABLE TABLE_PARTITION_2
AS SELECT * FROM TABLE_PARTITION WHERE 1=2;
然后将第一个分区的数据交换出去
ALTER TABLE TABLE_PARTITION EXCHANGE PARTITION TAB_PARTOTION_01
WITH TABLE TABLE_PARTITION_2 INCLUDING INDEXES;
此时会发现第一个分区的数据和表TABLE_PARTITION_2做了瞬间交换，比TRUNCATE还要快，因为这个过程没有进行数据转存，只是段名称的修改过程，和实际的数据量没有关系。
如果是子分区也可以与外部的表进行交换，只需要将关键字修改为：SUBPARTITION 即可。

4.7、清空分区数据
   ALTER TABLE <table_name> TRUNCATE PARTITION <partition_name>;
   ALTER TABLE <table_name> TRUNCATE subpartition <subpartition_name>;

4.8、磁盘碎片压缩
   对分区表的某分区进行磁盘压缩，当对分区内部数据进行了大量的UPDATE、DELETE操作后，一定时间需要进行磁盘压缩，否则在查询时，若通过FULL SCAN扫描数据，将会把空块也会扫描到，对表进行磁盘压缩需要进行行迁移操作，所以首先需要操作：
ALTER TABLE <table_name> ENABLE ROW MOVEMENT ;
    对分区表的某分区压缩语法为：
ALTER TABLE <table_name>
modify partition <partition_name> shrink space;
   对普通表压缩：
ALTER TABLE <table_name> shrink space;
对于索引也需要进行压缩，索引也是表：
ALTER INDEX <index_name> shrink space;

4.9、分区表重新分析以及索引重新分析
对表进行压缩后，需要对表和索引进行重新分析，对表进行重新分析，一般有两种方式：
在ORACLE 10G以前，使用：
BEGIN
     dbms_stats.gather_table_stats(USER,UPPER('<table_name>'));
END;
ORACLE 10G后，可以使用：
ANALYZE TABLE <table_name> COMPUTE STATISTICS;
索引重新分析，将上述两种方式分别修改一下，如第一种可以使用：gather_index_stats，而第二种修改为：ANALYZE INDEX即可，不过一般比较常用的是重新编译：
对于分区表并进行了索引分区的情况，需要对每个分区的索引进行重新编译,这里以LOCAL索引为例子（其每个索引的分区和表分区结构相同，默认分区名称和表分区名称相同）：
ALTER INDEX <index_name> REBUILD PARTITION <partition_name>;
对于全局索引，根据全局索引锁定义的分区名称修改即可，若没有分区，和普通单表索引重新编译方式相同：
ALTER INDEX <index_name> REBUILD;

4.10、关联对象重新编译,
上述对表、索引进行重新编译，尤其对表进行了压缩后会产生行迁移，这个过程可能会导致一些视图、过程对象的失效，此时要将其重新编译一次。

4.11、扩展：HASH分区中，如果创建了新的分区，可以将其进行重新HASH分布：
ALTER TABLE <table_name> COALESCA PARTITION%

5. 总结

全局索引是独立的，需要更多人工维护；对于本地索引，引起依赖于本地分区，其可以自动维护，也就是说当add/drop/split/truncate时，Local索引可以自动维护。

一般来说一张表最好不要存储超过40W条数据

如果想要对某张表做分区，必须是在创建表时即创建分区，不能将一个未分区的表修改成分区表。
相关阅读:
分布式文件系统：HDFS
MapReduce处理流程
 Maven之pom知识点
 Junit单元测试
 Mybatis中@param注解
 kafka在Maven项目中的使用
 无线/安卓安全课堂内容
 C中经常忘记的一些东西
 基于七牛API开发的前端JavaScript SDK
常见名词解释
原文地址：https://www.cnblogs.com/jiyuqi/p/3714273.html