2017年8月14日,一地市oracle相关的调度程序ETL抽取速度奇慢,sql语句每次执行平均时间要9秒左右,如果所示:
该调度过程涉及的sql语句如下:
select count(*) from (SELECT
rtrim(a.pid) PID,
a.item_type PTYPE,
'' FEETYPE,
'' HISDID,
a.item_date ITEM_DATE,
nvl(a.wjw_id,a.item_id) ITEM_ID,
a.item_name ITEM_NAME,
nvl(a.numbers, 0) NUMBERS,
nvl(a.price, 0) PRICE,
nvl(a.costs, 0) COSTS,
a.physician_id PHYSICIAN_ID,
a.physician_name PHYSICIAN_NAME,
a.dept_id DEPT_ID,
a.deptname DEPTNAME,
'0' USAGE,
'' FREQUENCY_INTERVAL,
a.specification USE_METHOD,
nvl(a.usage_days, 0) DAYS_OF_SUPPLY,
nvl(a.costs, 0) ELIGIBLE_AMOUNT,
'' SELF_AMOUNT,
'' PHYSICIAN_LEVEL,
'' PHYSICIAN_AP,
'' ApprovalNumber,
a.id PrescriptionNo,
'' CostCategory,
'' ITEM_NAME_HOSPITAL,
'' ForLeave
from CLAIMDETAILHOSPITAL_temp a
where trim(a.pid)='42900500007915202');
sqlplus登录业务用户,执行并查看该sql的执行计划如下:
由sql执行计划发现,该sql语句执行了全表扫描,谓词是: 2 - filter(TRIM("A"."PID")='42900500007915202')
查看表CLAIMDETAILHOSPITAL_TEMP上的索引情况:
由此,可知表CLAIMDETAILHOSPITAL_TEMP上有针对pid的索引PID_INDEX,但是索引PID_INDEX的DDL语句是:
create index pid_index on claimdetailhospital_temp(pid);
到此,可以判断sql语句执行全表扫描的原因是:sql的where条件where trim(a.pid)='42900500007915202')对查询条件字段pid使用trim函数导致了参数转换,
使得索引pid_index无法使用而执行了全表扫描。处理方法很简单,删除索引PID_INDEX,创建基于trim的函数索引:
create index ind_pid on CLAIMDETAILHOSPITAL_TEMP(trim(pid));
函数索引创建成功后,SQL的执行速度有了质的提高,执行速度从9秒降低至100毫秒:
有一个问题值得思考:开发或测试为什么不在应用的前端对pid执行前后去空格的函数trim,反而非要放在数据库端执行,这样不但加重了数据库服务器的工作负担,
还很容易导致这种因函数使用不当引起大表的全表扫描而降低sql的执行速度;虽然,对pid字段创建基于trim的函数索引能提升sql的执行效率,但是相比普通的索引
基于trim的函数索引,一定会大大降低dml语句的执行效率;如果trim这种去空格的函数放在web前端进行,数据库则可免去这种不必要的性能损失。