该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中,使用此命令必须同时指定UPDATE 和INSERT 关键词,ORACLE 10g 做了如下改动。
1,insert 和update是可选的 2,UPDATE 和INSERT 后面可以跟WHERE 子句 3,在ON条件中可以使用常量来insert 所有的行到目标表中,不需要连接到源表和目标表 4,UPDATE 子句后面可以跟delete 来去除一些不需要的行。
举例:
使用表newproducts中的product_name 和category字段来更新表products 中相同product_id的product_name 和category.
2,当条件不满足的时候把newproducts表中的数据INSERT 到表products中。
3,带条件的insert 和update
insert 和update 都带有where 字句
4,无条件的insert
5,delete 子句
1 merge into products p
2 using newproducts np
3 on(p.product_id = np.product_id)
4 when matched then
5 update
6 set p.product_name = np.product_name
7 delete where category = 'macle1_cate';
select *
from products;
PRODUCT_ID PRODUCT_NAME CATEGORY
--------------------------------------- -------------------- --------------------
1502 macle22 macle2_cate
1503 macle3 macle2_cate
1504 macle macle1_cate
1505 macle5 macle5_cate
1504 中的macle1_cate 满足delete where,但是不满足 on 中的条件,所以没有被删除。!!!!!!重点
-----------------------------------------------
动机:
想在Oracle中用一条SQL语句直接进行Insert/Update的操作。
说明:
在进行SQL语句编写时,我们经常会遇到大量的同时进行Insert/Update的语句 ,也就是说当存在记录时,就更新(Update),不存在数据时,就插入(Insert)。
实战:
接下来我们有一个任务,有一个表T,有两个字段a,b,我们想在表T中做Insert/Update,如果存在,则更新T中b的值,如果不存在,则插入一条记录。在Microsoft的SQL语法中,很简单的一句判断就可以了,SQL Server中的语法如下:
if exists(select 1 from T where T.a='1001' ) update T set T.b=2 Where T.a='1001' else insert into T(a,b) values('1001',2);
以上语句表明当T表中如果存在a='1001' 的记录的话,就把b的值设为2,否则就Insert一条a='100',b=2的记录到T中。
但是接下来在Oracle中就遇到麻烦了,记得在Oracle 9i之后就有一条Merge into 的语句可以同时进行Insert 和Update的吗,Merge的语法如下:
上面的语法大家应该都容易懂吧,那我们按照以上的逻辑再写一次。
以上的语句貌似很对是吧,实际上,该语句只能进行更新,而无法进行Insert,错误在哪里呢?
其实在Oracle中Merge语句原先是用来进行整表的更新用的,也就是ETL工具比较常用的语法,重点是在Using上。
用中文来解释Merge语法,就是:
在alias2中Select出来的数据,每一条都跟alias1进行 ON (join condition)的比较,如果匹配,就进行更新的操作(Update),如果不匹配,就进行插入操作(Insert)。
因此,严格意义上讲,”在一个同时存在Insert和Update语法的Merge语句中,总共Insert/Update的记录数,就是Using语句中alias2的记录数。”
以上这句话也就很好的解释了在上面写的语句为何只能进行Update,而不能进行Insert了,因为都Select不到数据,如何能进行Insert呢:)
接下来要改成正确的语句就容易多了,如下:
查询结果,OK!
注意:
如果不懂Merge语句的原理,Merge语句是一条比较危险的语句,特别是在您只想更新一条记录的时候,因为不经意间,你可能就把整表的数据都Update了一遍.....汗!!!
我曾经犯过的一个错误如下所示,大家看出来是什么问题了吗?
merge into,hash join后直接update
update关联更新,hash join选择要更新的数据,然后每行要更新的数据,都会执行关联更新的子查询,相当于有个循环的过程,如果执行这个子查询的次数多,那么效率可想而知
红色部分就是关联where exists选出的要更新的数据,每一行都会驱动执行蓝色部分(除非被更新的关联键重复值少,会降低驱动次数,也就是会有缓存效果),所以蓝色部分可能会执行多次。。。
可以通过查看执行计划statistics的starts看出来。。。
Execution Plan
----------------------------------------------------------
Plan hash value: 310163415
------------------------------------------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes |TempSpc| Cost (%CPU)| Time |
------------------------------------------------------------------------------------------------------------
| 0 | UPDATE STATEMENT | | 138K| 6361K| | 1466K (10)| 04:53:14 |
| 1 | UPDATE | ARC_TICKET_TEST | | | | | |
|* 2 | HASH JOIN SEMI | | 138K| 6361K| 72M| 634K (1)| 02:06:54 |
|* 3 | TABLE ACCESS FULL | ARC_TICKET_TEST | 1999K| 49M| | 19960 (1)| 00:04:00 |
| 4 | TABLE ACCESS FULL | TEMP_ZY_20140422ARC | 226M| 4539M| | 255K (1)| 00:51:11 |
| 5 | TABLE ACCESS BY INDEX ROWID | TEMP_ZY_20140422ARC | 1 | 24 | | 5 (0)| 00:00:01 |
|* 6 | INDEX RANGE SCAN | IND_TEMP_OLD_ID | 1 | | | 4 (0)| 00:00:01 |
------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
2 - access("ARC"."OLD_ID"="A"."OLD_ID" AND "ARC"."TDNR_CDGT"=TO_NUMBER("A"."TDNR_CDGT"))
3 - filter("ARC"."BSP_CODE"='CN')
6 - access("A"."OLD_ID"=:B1)
filter(TO_NUMBER("A"."TDNR_CDGT")=:B1)