这里需要强调的是b表中关联字段的值是唯一的这种情况,并且b表尽量是列举类型的,意味着表比较小。
====================
准备数据:
1. 建两个类似表,test1,test2,只有id和val两个字段。
CREATE TABLE `test1` (
`id` int(8) unsigned NOT NULL AUTO_INCREMENT,
`val` varchar(20) DEFAULT NULL,
PRIMARY KEY (`id`)
) ;
2. 插入数据
1)test1表
这里顺便说下,有些童鞋可能觉得插入语句例如插入多条,需要写多个sql语句,实际可以只写一个。
如下一条sql,可以实现插入三条记录(insert关键字后边可以省略into;values利用逗号分隔)
insert test1(val) values ('a'),('b'),('c');
插入3条记录,各个查询方式效果不太明显,这里还有个插入技巧,成倍数对该表原数据进行多次插入。
如 insert test1(val) (select val from test1); #这里注意没有values关键字
多次执行该语句,很快总记录数达到十万条以上。
2)test2表
该表数据有3条,有一条的val在test1表存在
insert test2(val) values ('a'),('x'),('y');
3. 查询
查询在test1表中存在,且test2表中没有的记录
这里实现方法有很多,我主要介绍3种:
1)利用not in
SELECT a.* from test1 a where a.val not in (select b.val from test2 b);
2)not exists
SELECT a.* from test1 a where not exists (SELECT 1 from test2 b where a.val = b.val); #执行耗时相对较长
3)left join
select a.* from test1 a left join test2 b on a.val = b.val where b.val is null; # 先执行left join,再执行where
=============================
当b表中,val的值唯一的情况下且b表较小,以上查询是可取的。否则,left join这种使用可能会很灾难,内存溢出,死掉都可能发生。
可根据实际情况,选择自己的方式。