oracle笔记（6）----exists 和not exists、in、not in

2019-11-09 13:30:25

字体：大中小

来源：转载

供稿：网友

1、exitsts、not exists 解释

exists （sql 返回结果集为真）

not exists (sql 不返回结果集为真）如下：表A ID NAME 1 A12 A23 A3表B ID AID NAME 1 1 B12 2 B23 2 B3表A和表B是１对多的关系 A.ID => B.AIDSELECT ID,NAMEFROM A WHERE EXIST (SELECT* FROM BWHERE A.ID=B.AID)执行结果为 1 A1

2 A2

select * from EB where exists (select * from BB where Code=EB.Code) 这句的流程是这样的首先外面的EB表传进去第一条记录进子查询。（EB.Code）接着EB.Code 就和子查询里的BB表进行对比如果有那么一条符合EB.CODE=BB.CODE 就返回真。。。那么就在外面显示出来 EB.Code这个值依次类推

原因可以按照如下分析

SELECT ID,NAME FROM A WHEREEXISTS (SELECT* FROM BWHERE B.AID=１)--->SELECT * FROM B WHERE B.AID=１有值返回真所以有数据SELECT ID,NAMEFROM A WHERE EXISTS (SELECT* FROM BWHERE B.AID=2)--->SELECT * FROM B WHERE B.AID=２有值返回真所以有数据SELECT ID,NAMEFROM A WHERE EXISTS (SELECT* FROM BWHERE B.AID=3)--->SELECT * FROM B WHERE B.AID=３无值返回真所以没有数据NOT EXISTS 就是反过来 SELECT ID,NAMEFROM A WHERE　NOT EXIST (SELECT* FROM BWHERE A.ID=B.AID)执行结果为

3 A3

2、“exists”和“in”的效率问题

1) select * from T1 where exists(select 1 from T2 whereT1.a=T2.a) ;

T1数据量小而T2数据量非常大时，T1<<T2 时，1)的查询效率高。

2) select * from T1 where T1.a in (select T2.a from T2) ;

T1数据量非常大而T2数据量小时，T1>>T2 时，2)的查询效率高。

exists 用法：

请注意 1）句中的有颜色字体的部分，理解其含义；

其中 “select 1 from T2 where T1.a=T2.a” 相当于一个关联表查询，相当于

“select 1 fromT1,T2 where T1.a=T2.a”

但是，如果你当当执行 1）句括号里的语句，是会报语法错误的，这也是使用exists需要注意的地方。

“exists（xxx）”就表示括号里的语句能不能查出记录，它要查的记录是否存在。

因此“select 1”这里的“1”其实是无关紧要的，换成“*”也没问题，它只在乎括号里的数据能不能查找出来，是否存在这样的记录，如果存在，这 1）句的where条件成立。

in 的用法：

继续引用上面的例子

“2) select * from T1 where T1.a in (select T2.a from T2) ”

这里的“in”后面括号里的语句搜索出来的字段的内容一定要相对应，一般来说，T1和T2这两个表的a字段表达的意义应该是一样的，否则这样查没什么意义。

打个比方：T1，T2表都有一个字段，表示工单号，但是T1表示工单号的字段名叫“ticketid”，T2则为“id”，但是其表达的意义是一样的，而且数据格式也是一样的。这时，用2）的写法就可以这样：

“select * from T1 where T1.ticketid in (select T2.id from T2)”

Select name from employee where name not in (select name fromstudent);

Select name from employee where not exists (select name fromstudent);

第一句SQL语句的执行效率不如第二句。

通过使用EXISTS，Oracle会首先检查主查询，然后运行子查询直到它找到第一个匹配项，这就节省了时间。Oracle在执行IN子查询时，首先执行子查询，并将获得的结果列表存放在一个加了索引的临时表中。在执行子查询之前，系统先将主查询挂起，待子查询执行完毕，存放在临时表中以后再执行主查询。这也就是使用EXISTS比使用IN通常查询速度快的原因

select * from Awhere id in(select id from B)

以上查询使用了in语句,in()只执行一次,它查出B表中的所有id字段并缓存起来.之后,检查A表的id是否与B表中的id相等,如果相等则将A表的记录加入结果集中,直到遍历完A表的所有记录.

可以看出,当B表数据较大时不适合使用in(),因为它会B表数据全部遍历一次.如:A表有10000条记录,B表有1000000条记录,那么最多有可能遍历10000*1000000次,效率很差.再如:A表有10000条记录,B表有100条记录,那么最多有可能遍历10000*100次,遍历次数大大减少,效率大大提升.

结论:in()适合B表比A表数据小的情况

select a.* from A awhere exists(select 1 from B b where a.id=b.id)

以上查询使用了exists语句,exists()会执行A.length次,它并不缓存exists()结果集,因为exists()结果集的内容并不重要,重要的是结果集中是否有记录,如果有则返回true,没有则返回false.

当B表比A表数据大时适合使用exists(),因为它没有那么遍历操作,只需要再执行一次查询就行.如:A表有10000条记录,B表有1000000条记录,那么exists()会执行10000次去判断A表中的id是否与B表中的id相等.如:A表有10000条记录,B表有100000000条记录,那么exists()还是执行10000次,因为它只执行A.length次,可见B表数据越多,越适合exists()发挥效果.再如:A表有10000条记录,B表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历比较,而exists()需要查询数据库,我们都知道查询数据库所消耗的性能更高,而内存比较很快.

结论:exists()适合B表比A表数据大的情况

当A表数据与B表数据一样大时,in与exists效率差不多,可任选一个使用.

上一篇：PowerDesigner将物理数据模型图生成图片

下一篇：PG数据库工具