背景: 在数据库操作中,有这样一个场景:我们对一批数据进行存储,假如这批数据中有部分数据是重复的,可能是全部重复也可能是部分重复,存储的时候我们要把重复的数据合并或者跳过。
实例:
create table store(
ID int(8) auto_increment primary key,
store_name varchar(255),
store_href varchar(255) unique,
credit_count int(4),
albums_url varchar(120),
phone varchar(40),
address varchar(255),
product varchar(255),
);
解决方法:
前提: 在实现之前,必须要注意一个点,就是先找到实例表中的你自己认为能唯一区分所有数据的一个字段,并给他设置唯一索引unique,且不能是ID因为ID设置了就没有意义了,也可以是主键看情况。唯一索引的作用是被设置的字段对应的列之后的数据都不能出现重复。像我上面的商店表中的store_href字段,因为网上的商店连接都只有一个连接地址,而其他的可能被多个商店使用
一、 存在就更新
on duplicate key update:
插入数据的索引unique或者primary key发生冲突,则会执行更新操作。假如store数据表中已经有了实例表中,假如没有的话就把前面的数据插入实例表。如下面的语句:
insert into store (store_name,store_href,credit_count,albums_url,phone,address,product) values ("三只松鼠","http://x.yupoo.com/photos/?k=三只松鼠","4星","http://x.yupoo.com/photos/2986934341/albums/11531437?uid=1","10086","火星","零食") on duplicate key update store_name="三只松鼠",store_href="http://x.yupoo.com/photos/?k=三只松鼠",credit_count="5星",albums_url="http://www.baidu.com",phone="10000",address="火星",product="零食";
语法:
insert into 表名 (字段1,字段2,字段3 ...) values (值1,值2,值3 ...) on duplicate key update store_name 值1="新值1",值2="新值2",值3="新值3" ...;
执行的结果是:如果插入数据的时候没有冲突,说明数据库中没有这条数据,则一条结果受到影响;如果插入数据的时候发生了冲突,说明数据库中有这条数据,则两条数据受到影响。这里的ID不会发生改变,因为他是执行的更新。
replace into:
replace into 和 on duplicate key update 唯一的区别是,replace into 他不是更新冲突的那条数据,而是删除后再插入:如下面的语句:
replace into store (store_name,store_href,credit_count,albums_url,phone,address,product) values ("三只松鼠","http://x.yupoo.com/photos/?k=三只松鼠","5星","http://www.baidu.com","10000","火星","零食");
语法:
replace into 表名 (字段1,字段2,字段3 ... ) values ("值1","值2","值3" ... );
执行的结果:如果插入数据的时候没有冲突,说明数据库中没有这条数据,则一条结果受到影响;如果插入数据的时候发生了冲突,说明数据库中有这条数据,则两条数据受到影响。这里的ID会发生改变,因为他是先执行删除后执行插入。
二、存在就忽略
insert ignore into:
插入数据的索引unique或者primary key发生冲突,则会忽略此次操作。如下面的语句:
insert ignore into store (store_name,store_href,credit_count,albums_url,phone,address,product) values ("三只松鼠","http://x.yupoo.com/photos/?k=三只松鼠","5星","http://www.baidu.com","10000","火星","零食");
语法:
insert ignore into 表名 (字段1,字段2,字段3 ... ) values ("值1","值2","值3" ... );
执行的结果:如果插入数据的时候没有冲突,说明数据库中没有这条数据,则一条结果受到影响;如果插入数据的时候发生了冲突,说明数据库中有这条数据,则零条数据受到影响。这里的表数据不会发生改变。