REPLACE INTO // INSERT INTO … ON DUPLICATE KEY UPDATE

INSERT INTO … ON DUPLICATE KEY UPDATE

根据表的主键或唯一索引进行，存在更新（真的更新），不存在则插入。当数据与更新数据一致时，不发生数据更新，时间戳也不发生变化。

INSERT INTO test_support (province_id,city_id,support1,support2) VALUES(3,72,0,0) ON DUPLICATE KEY UPDATE support1 =0

但是，该语句应避免表中存在多个唯一索引。如下：

有表

CREATE TABLE `test_support` (
  `id` int(10) NOT NULL AUTO_INCREMENT COMMENT '主键',
  `province_id` int(10) NOT NULL DEFAULT '0' COMMENT '省ID',
  `city_id` int(10) NOT NULL DEFAULT '0' COMMENT '城市ID',
  `support1` int(10) NOT NULL DEFAULT '0' COMMENT '支持1',
  `support2` int(10) NOT NULL DEFAULT '0' COMMENT '支持2',
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_pro` (`province_id`) USING BTREE,
  UNIQUE KEY `idx_cit` (`city_id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=10 DEFAULT CHARSET=utf8;

有数据如下：

REPLACE INTO // INSERT INTO … ON DUPLICATE KEY UPDATE_第1张图片

image.png

再执行该语句

INSERT INTO test_support (province_id,city_id,support1,support2) VALUES(3,72,0,0) ON DUPLICATE KEY UPDATE support1 =0

***此时有id=1 和 id=3 两条数据均符合唯一索引存在即更新的条件，但是实际上只更新了id=3的数据。
更换唯一索引顺序，发现更新的数据变成idx_cit命中的数据，
由此可以推测，
INSERT INTO … ON DUPLICATE KEY UPDATE 该语句命中多条唯一索引的时候，实际上只更新了第一个唯一索引的数据，所以，应避免多个唯一索引存在。

另外，此时虽然只更新一条数据，但是显示受影响行数为2，因为此语句先尝试插入，再更新，执行了两次语句，所以是2

批量处理语句为

INSERT INTO test_support (province_id,city_id,support1,support2) VALUES(1,72,2,3),(2,2800,2,5) ON DUPLICATE KEY UPDATE support1 =VALUES(support1),support2 =VALUES(support2);

REPLACE INTO

当插入一条数据时，如果主键或者唯一索引不重复，则与insert into功能一样，但是如果主键或唯一索引重复，则会先删除原来的数据，再插入新的数据。

因为先删除后插入，如果某些字段再新数据中未赋值，则按默认值处理

REPLACE INTO 可以将DELETE 和 INSERT 合二为一，成为一个原子性操作。

REPLACE INTO 三种形式

1） replace into tbl_name(col_name, ...) values(...)
2） replace into tbl_name(col_name, ...) select ...
3） replace into tbl_name set col_name=value, ...

replace into tbl_name(col_name, ...) values(...)
--- 主键冲突
删除冲突主键的数据，插入新数据
--- 唯一索引冲突
删除所有唯一索引冲突的数据，插入新数据
对于自增主键，因为replace into是先删除，再插入，数据对应的主键会变化，所以对于强依赖主键的业务不建议使用
即使更新的数据一致时，也会先删除插入。

2） replace into tbl_name(col_name, ...) select ...
replace select 类似于insert select
replace into tb1( name, title, mood) select rname, rtitle, rmood from tb2;

replace into tbl_name set col_name=value, ...
REPLACE INTO test_support SET province_id =1 ,city_id =2 , support1 =9,support=10;

总结：
INSERT INTO … ON DUPLICATE KEY UPDATE
1）唯一索引或主键，不存在则插入，存在则更新，插入影响行数1，更新影响行数2
2）命中多个唯一索引，只有最靠前的唯一索引更新生效，其他命中的索引数据不更新
3）如果更新的数据与原数据一致，则默认不更新数据，时间戳也不变化。

REPLACE INTO
1）唯一索引或主键，不存在则插入（影响行数1），存在则先删除再插入（影响行数2）
2）命中多条唯一索引或主键，将删除所有命中的数据，在插入新增的数据
3）如果更新数据与原数据一直，同样会先删除再更新。

注意：
尽量避免多个唯一索引存在

效率问题：

场景描述：存在更新，不存在插入

1.select 判断是否存在，存在update，不存在insert
此种需要大量的查询判断，然后才能更新或插入，效率肯定是最慢的

2.REPLACE INTO
此种，因为每次更新都会先删除后插入数据，需要重新维护相关索引，但不会有大量的查询，所以效率会比1有所提高
3.INSERT INTO … ON DUPLICATE KEY UPDATE
此种，只是更新，不会破坏相关的唯一索引，也不重新设定主键，所以相对于REPLACE INTO 减少了维护索引的消耗，所以性能应该是3种中最高的

REPLACE INTO // INSERT INTO … ON DUPLICATE KEY UPDATE

你可能感兴趣的:(REPLACE INTO // INSERT INTO … ON DUPLICATE KEY UPDATE)