2017年8月14日,一地市oracle相关的调度程序ETL抽取速度奇慢,sql语句每次执行平均时间要9秒左右,如果所示:


该调度过程涉及的sql语句如下:

select count(*) from (SELECT 
      rtrim(a.pid) PID,
      a.item_type PTYPE,
       '' FEETYPE,
       '' HISDID,
       a.item_date ITEM_DATE,
       nvl(a.wjw_id,a.item_id) ITEM_ID,
       a.item_name ITEM_NAME,
       nvl(a.numbers, 0) NUMBERS,
       nvl(a.price, 0) PRICE,
       nvl(a.costs, 0) COSTS,
       a.physician_id PHYSICIAN_ID,
       a.physician_name PHYSICIAN_NAME,
       a.dept_id DEPT_ID,
       a.deptname DEPTNAME,
       '0' USAGE,
       '' FREQUENCY_INTERVAL,
      a.specification USE_METHOD,
      nvl(a.usage_days, 0) DAYS_OF_SUPPLY,
      nvl(a.costs, 0) ELIGIBLE_AMOUNT,
       '' SELF_AMOUNT,
       '' PHYSICIAN_LEVEL,
       '' PHYSICIAN_AP,
       '' ApprovalNumber,
       a.id PrescriptionNo,
       '' CostCategory,
       '' ITEM_NAME_HOSPITAL,
       '' ForLeave  
       from CLAIMDETAILHOSPITAL_temp a
      where trim(a.pid)='42900500007915202');

    sqlplus登录业务用户,执行并查看该sql的执行计划如下:


由sql执行计划发现,该sql语句执行了全表扫描,谓词是: 2 - filter(TRIM("A"."PID")='42900500007915202') 

    查看表CLAIMDETAILHOSPITAL_TEMP上的索引情况:



由此,可知表CLAIMDETAILHOSPITAL_TEMP上有针对pid的索引PID_INDEX,但是索引PID_INDEX的DDL语句是:

create index pid_index on claimdetailhospital_temp(pid);

到此,可以判断sql语句执行全表扫描的原因是:sql的where条件where trim(a.pid)='42900500007915202')对查询条件字段pid使用trim函数导致了参数转换,

使得索引pid_index无法使用而执行了全表扫描。处理方法很简单,删除索引PID_INDEX,创建基于trim的函数索引:

 create index ind_pid on CLAIMDETAILHOSPITAL_TEMP(trim(pid));

    函数索引创建成功后,SQL的执行速度有了质的提高,执行速度从9秒降低至100毫秒:

 

有一个问题值得思考:开发或测试为什么不在应用的前端对pid执行前后去空格的函数trim,反而非要放在数据库端执行,这样不但加重了数据库服务器的工作负担,

还很容易导致这种因函数使用不当引起大表的全表扫描而降低sql的执行速度;虽然,对pid字段创建基于trim的函数索引能提升sql的执行效率,但是相比普通的索引

基于trim的函数索引,一定会大大降低dml语句的执行效率;如果trim这种去空格的函数放在web前端进行,数据库则可免去这种不必要的性能损失。