首页 > 学院 > 开发设计 > 正文

oracle笔记(6)----exists 和not exists、in、not in

2019-11-09 13:30:25
字体:
来源:转载
供稿:网友

1、exitsts、not exists 解释

exists (sql 返回结果集为真)

not exists (sql 不返回结果集为真)如下: 表A ID NAME 1    A12    A23  A3表B ID AID NAME 1   1 B12   2 B23   2 B3表A和表B是1对多的关系 A.ID => B.AIDSELECT ID,NAMEFROM A WHERE EXIST (SELECT* FROM BWHERE A.ID=B.AID)执行结果为 1 A1

2 A2

select * from EB where exists (select * from BB where Code=EB.Code) 这句的流程是这样的 首先 外面的EB表传进去第一条记录 进子查询 。(EB.Code) 接着EB.Code 就和子查询里的BB表进行对比 如果有那么一条符合EB.CODE=BB.CODE  就返回真 。。。 那么就在外面显示出来 EB.Code这个值 依次类推

原因可以按照如下分析

SELECT ID,NAME FROM A WHEREEXISTS (SELECT* FROM BWHERE B.AID=1)--->SELECT * FROM B WHERE B.AID=1有值返回真所以有数据SELECT ID,NAMEFROM A WHERE EXISTS (SELECT* FROM BWHERE B.AID=2)--->SELECT * FROM B WHERE B.AID=2有值返回真所以有数据SELECT ID,NAMEFROM A WHERE EXISTS (SELECT* FROM BWHERE B.AID=3)--->SELECT * FROM B WHERE B.AID=3无值返回真所以没有数据NOT EXISTS 就是反过来 SELECT ID,NAMEFROM A WHERE NOT EXIST (SELECT* FROM BWHERE A.ID=B.AID)执行结果为

3 A3

2、“exists”和“in”的效率问题

1) select * from T1 where exists(select 1 from T2 whereT1.a=T2.a) ;

   T1数据量小而T2数据量非常大时,T1<<T2 时,1)的查询效率高。

2) select * from T1 where T1.a in (select T2.a from T2) ;

    T1数据量非常大而T2数据量小时,T1>>T2 时,2)的查询效率高。

exists 用法:

请注意 1)句中的有颜色字体的部分 ,理解其含义;

其中 “select 1 from T2 where T1.a=T2.a” 相当于一个关联表查询,相当于

“select 1 fromT1,T2    where T1.a=T2.a”

但是,如果你当当执行 1) 句括号里的语句,是会报语法错误的,这也是使用exists需要注意的地方。

“exists(xxx)”就表示括号里的语句能不能查出记录,它要查的记录是否存在。

因此“select 1”这里的“1”其实是无关紧要的,换成“*”也没问题,它只在乎括号里的数据能不能查找出来,是否存在这样的记录,如果存在,这 1) 句的where条件成立。

 

in 的用法:

继续引用上面的例子

“2) select * from T1 where T1.a in (select T2.a from T2) ”

这里的“in”后面括号里的语句搜索出来的字段的内容一定要相对应,一般来说,T1和T2这两个表的a字段表达的意义应该是一样的,否则这样查没什么意义。

打个比方:T1,T2表都有一个字段,表示工单号,但是T1表示工单号的字段名叫“ticketid”,T2则为“id”,但是其表达的意义是一样的,而且数据格式也是一样的。这时,用2)的写法就可以这样:

“select * from T1 where T1.ticketid in (select T2.id from T2)”

Select name from employee where name not in (select name fromstudent);

Select name from employee where not exists (select name fromstudent);

第一句SQL语句的执行效率不如第二句。

通过使用EXISTS,Oracle会首先检查主查询,然后运行子查询直到它找到第一个匹配项,这就节省了时间。Oracle在执行IN子查询时,首先执行子查询,并将获得的结果列表存放在一个加了索引的临时表中。在执行子查询之前,系统先将主查询挂起,待子查询执行完毕,存放在临时表中以后再执行主查询。这也就是使用EXISTS比使用IN通常查询速度快的原因

select * from Awhere id in(select id from B)

以上查询使用了in语句,in()只执行一次,它查出B表中的所有id字段并缓存起来.之后,检查A表的id是否与B表中的id相等,如果相等则将A表的记录加入结果集中,直到遍历完A表的所有记录.

可以看出,当B表数据较大时不适合使用in(),因为它会B表数据全部遍历一次.如:A表有10000条记录,B表有1000000条记录,那么最多有可能遍历10000*1000000次,效率很差.再如:A表有10000条记录,B表有100条记录,那么最多有可能遍历10000*100次,遍历次数大大减少,效率大大提升.

结论:in()适合B表比A表数据小的情况

select a.* from A awhere exists(select 1 from B b where a.id=b.id)

以上查询使用了exists语句,exists()会执行A.length次,它并不缓存exists()结果集,因为exists()结果集的内容并不重要,重要的是结果集中是否有记录,如果有则返回true,没有则返回false.

当B表比A表数据大时适合使用exists(),因为它没有那么遍历操作,只需要再执行一次查询就行.如:A表有10000条记录,B表有1000000条记录,那么exists()会执行10000次去判断A表中的id是否与B表中的id相等.如:A表有10000条记录,B表有100000000条记录,那么exists()还是执行10000次,因为它只执行A.length次,可见B表数据越多,越适合exists()发挥效果.再如:A表有10000条记录,B表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历比较,而exists()需要查询数据库,我们都知道查询数据库所消耗的性能更高,而内存比较很快.

结论:exists()适合B表比A表数据大的情况

当A表数据与B表数据一样大时,in与exists效率差不多,可任选一个使用.


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表