我们一直在告诉开发人员一定要使用绑定变量,而你是否真正了解绑定变量的有缺点呢?绑定变量可以减少SQL分析,节约共享池的空间。但是在某些情况下,使用绑定变量也是有缺点的。比如说,如果使用绑定变量,那么优化器就会忽略直方图的信息,在生成执行计划的时候可能不够优化。 另外一个有趣的问题是,如果一张表有几十万条记录,而某个字段有2个值,那么如果在这个字段上建一个索引,那么这个索引可能起作用吗?不能?你能确定吗?如果说某个字段的取值有2个,VALID和INVALID,其中有10条记录是INVALID,其他都是VALID,那么这个索引是否有用呢?从这上面看,这个索引应该是有用的,如果访问的是INVALID的行,这个索引是十分高效的。而这种情况在我们的应用环境中大量存在。比如有一条记录,刚刚插入的时候状态为1,处理后为2,归档后为3。那么可能只有少量的为1的行,其次是为2的,最多的是3的。在这种字段上建立索引是有效的。我们来做个实验: 首先从DBA_OBJECT中生成一张TEST表,最好多搞点数据,然后把其中几行记录的STATUS字段修改为INVALID: update test set status='INVALID' 这样,在一张有10万多条记录的表里面有了4条INVALID的记录,其他都是VALID。然后创建索引: create index test_idx on test(status); 然后对表进行分析 EXEC DBMS_STATS.GATHER_TABLE_STATS('SCOTT','TEST',CASCADE=>'TRUE'); 下面我们看看索引是否被使用了: SQL> EXEC DBMS_STATS.GATHER_TABLE_STATS('SCOTT','TEST'); PL/SQL 过程已成功完成。 SQL> select owner from scott.test where status='INVALID';
已选择108664行。
SQL> EXEC DBMS_STATS.GATHER_TABLE_STATS('SCOTT','TEST',method_opt => 'FOR ALL INDEXED COLUMNS PL/SQL 过程已成功完成。 SQL> select owner from scott.test where status='INVALID';
SQL> select owner from scott.test where status='VALID'; 已选择108664行。
很好,一切都是完美的。如果使用绑定变量,是不是更加完美呢? SQL> begin :a:='INVALID';END; SQL> select owner from test where status=:a; Execution Plan 查一下直方图的使用限制,下列场合直方图是无法使用的: 由于在使用绑定变量的时候,9i开始使用bind peeking技术,通过这个技术,在SQL进行硬分析的时候,如果存在直方图,会探测绑定变量,根据绑定变量产生执行计划。8i不具备bind peeking技术,如果柱状图存在,会使用缺省的选择性参数来计算COST。但是上述实验第一次执行的时候代入了INVALID,为什么执行计划不走索引呢,通过分析,原来是autotrace的一个BUG,在这个情况下,只能通过v$sql_plan或者使用sql_trace(10046)。通过分析发现:
1、对于倾斜性的列,可以通过使用直方图来优化索引 2、对于倾斜性的列,从查询性能考虑,不要使用绑定变量(如果列上有可用索引) |
如果知道其中的原理,就不难决定了。实际上很简单,除非访问的索引字段倾斜性很严重,类似上面的例子,需要使用直方图的,其他情况,都可以使用绑定变量。如果需要使用直方图,建议还是别用绑定变量了。
直方图是Oracle