INSERT INTO … ON DUPLICATE KEY UPDATE
根据表的主键或唯一索引进行, 存在更新(真的更新),不存在则插入。当数据与更新数据一致时,不发生数据更新,时间戳也不发生变化。
INSERT INTO test_support (province_id,city_id,support1,support2) VALUES(3,72,0,0) ON DUPLICATE KEY UPDATE support1 =0
但是,该语句应避免表中存在多个唯一索引。如下:
有表
CREATE TABLE `test_support` (
`id` int(10) NOT NULL AUTO_INCREMENT COMMENT '主键',
`province_id` int(10) NOT NULL DEFAULT '0' COMMENT '省ID',
`city_id` int(10) NOT NULL DEFAULT '0' COMMENT '城市ID',
`support1` int(10) NOT NULL DEFAULT '0' COMMENT '支持1',
`support2` int(10) NOT NULL DEFAULT '0' COMMENT '支持2',
PRIMARY KEY (`id`),
UNIQUE KEY `idx_pro` (`province_id`) USING BTREE,
UNIQUE KEY `idx_cit` (`city_id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=10 DEFAULT CHARSET=utf8;
有数据如下:
再执行该语句
INSERT INTO test_support (province_id,city_id,support1,support2) VALUES(3,72,0,0) ON DUPLICATE KEY UPDATE support1 =0
***此时有id=1 和 id=3 两条数据均符合唯一索引存在即更新的条件,但是实际上只更新了id=3的数据。
更换唯一索引顺序,发现更新的数据变成idx_cit命中的数据,
由此可以推测,
INSERT INTO … ON DUPLICATE KEY UPDATE 该语句命中多条唯一索引的时候,实际上只更新了第一个唯一索引的数据,所以,应避免多个唯一索引存在。
另外,此时虽然只更新一条数据,但是显示受影响行数为2,因为此语句先尝试插入,再更新,执行了两次语句,所以是2
批量处理语句为
INSERT INTO test_support (province_id,city_id,support1,support2) VALUES(1,72,2,3),(2,2800,2,5) ON DUPLICATE KEY UPDATE support1 =VALUES(support1),support2 =VALUES(support2);
REPLACE INTO
当插入一条数据时,如果主键或者唯一索引不重复,则与insert into功能一样,但是如果主键或唯一索引重复,则会先删除原来的数据,再插入新的数据。
因为先删除后插入,如果某些字段再新数据中未赋值,则按默认值处理
REPLACE INTO 可以将DELETE 和 INSERT 合二为一,成为一个原子性操作。
REPLACE INTO 三种形式
1) replace into tbl_name(col_name, ...) values(...)
2) replace into tbl_name(col_name, ...) select ...
3) replace into tbl_name set col_name=value, ...
- replace into tbl_name(col_name, ...) values(...)
--- 主键冲突
删除冲突主键的数据,插入新数据
--- 唯一索引冲突
删除所有唯一索引冲突的数据,插入新数据
对于自增主键,因为replace into是先删除,再插入,数据对应的主键会变化,所以对于强依赖主键的业务不建议使用
即使更新的数据一致时,也会先删除插入。
2) replace into tbl_name(col_name, ...) select ...
replace select 类似于insert select
replace into tb1( name, title, mood) select rname, rtitle, rmood from tb2;
- replace into tbl_name set col_name=value, ...
REPLACE INTO test_support SET province_id =1 ,city_id =2 , support1 =9,support=10;
总结:
INSERT INTO … ON DUPLICATE KEY UPDATE
1)唯一索引或主键,不存在则插入,存在则更新,插入影响行数1,更新影响行数2
2)命中多个唯一索引,只有最靠前的唯一索引更新生效,其他命中的索引数据不更新
3)如果更新的数据与原数据一致,则默认不更新数据,时间戳也不变化。
REPLACE INTO
1)唯一索引或主键,不存在则插入(影响行数1),存在则先删除再插入(影响行数2)
2)命中多条唯一索引或主键,将删除所有命中的数据,在插入新增的数据
3)如果更新数据与原数据一直,同样会先删除再更新。
注意:
尽量避免多个唯一索引存在
效率问题:
场景描述:存在更新,不存在插入
1.select 判断是否存在,存在update,不存在insert
此种需要大量的查询判断,然后才能更新或插入,效率肯定是最慢的
2.REPLACE INTO
此种,因为每次更新都会先删除后插入数据,需要重新维护相关索引,但不会有大量的查询,所以效率会比1有所提高
3.INSERT INTO … ON DUPLICATE KEY UPDATE
此种,只是更新,不会破坏相关的唯一索引,也不重新设定主键,所以相对于REPLACE INTO 减少了维护索引的消耗,所以性能应该是3种中最高的