首页 > 数据库 > MySQL > 正文

MySQL中无GROUP BY情况下直接使用HAVING语句的问题探究

2024-07-24 13:07:27
字体:
来源:转载
供稿:网友

这篇文章主要介绍了MySQL中无GROUP BY情况下直接使用HAVING语句的问题探究,同时探究了该情况下MAX与MIN功能的使用情况,需要的朋友可以参考下

今天有同学给我反应,有一张表,id是主键,这样的写法可以返回一条记录:

 

 
  1. SELECT * FROM t HAVING id=MIN(id);” 

但是只是把MIN换成MAX,这样返回就是空了:

 

 
  1. SELECT * FROM t HAVING id=MAX(id);” 

这是为什么呢?

我们先来做个试验,验证这种情况。

这是表结构,初始化两条记录,然后试验:

 

 
  1. root@localhost : plx 10:25:10> show create table t2G 
  2. *************************** 1. row *************************** 
  3. Table: t2 
  4. Create TableCREATE TABLE `t2` ( 
  5. `a` int(11) DEFAULT NULL
  6. `id` int(10) unsigned NOT NULL AUTO_INCREMENT, 
  7. PRIMARY KEY (`id`) 
  8. ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8 
  9.  
  10. root@localhost : plx 10:25:15> select * from t2; 
  11. +------+----+ 
  12. | a | id | 
  13. +------+----+ 
  14. | 1 | 1 | 
  15. | 1 | 3 | 
  16. +------+----+ 
  17. rows in set (0.00 sec) 
  18.  
  19. root@localhost : plx 10:25:20> SELECT * FROM t2 HAVING id=MIN(id); 
  20. +------+----+ 
  21. | a | id | 
  22. +------+----+ 
  23. | 1 | 1 | 
  24. +------+----+ 
  25. 1 row in set (0.00 sec) 
  26.  
  27. root@localhost : plx 10:25:30> SELECT * FROM t2 HAVING id=MAX(id); 
  28. Empty set (0.00 sec) 

初看之下,好像真的是这样哎,怎么会这样呢?

我再试一下,把a字段改一个为10,然后试下a字段:

 

 
  1. root@localhost : plx 10:26:58> select * from t2; 
  2. +------+----+ 
  3. | a | id | 
  4. +------+----+ 
  5. | 10 | 1 | 
  6. | 1 | 3 | 
  7. +------+----+ 
  8. rows in set (0.00 sec) 
  9.  
  10. root@localhost : plx 10:28:20> SELECT * FROM t2 HAVING a=MAX(a); 
  11. +------+----+ 
  12. | a | id | 
  13. +------+----+ 
  14. | 10 | 1 | 
  15. +------+----+ 
  16. 1 row in set (0.00 sec) 
  17.  
  18. root@localhost : plx 10:28:28> SELECT * FROM t2 HAVING a=MIN(a); 
  19. Empty set (0.00 sec) 

我擦,这回MAX能返回,MIN不能了,这又是为啥呢?

旁白

一般来说,HAVING子句是配合GROUP BY使用的,单独使用HAVING本身是不符合规范的,

但是MySQL会做一个重写,加上一个GROUP BY NULL,”SELECT * FROM t HAVING id=MIN(id)”会被重写为”SELECT * FROM t GROUP BY NULL HAVING id=MIN(id)”,这样语法就符合规范了。

继续……

但是,这个 GROUP BY NULL 会产生什么结果呢?经过查看代码和试验,可以证明,GROUP BY NULL 等价于 LIMIT 1:

 

 
  1. root@localhost : plx 10:25:48> SELECT * FROM t2 GROUP BY NULL
  2. +------+----+ 
  3. | a | id | 
  4. +------+----+ 
  5. | 10 | 1 | 
  6. +------+----+ 
  7. 1 row in set (0.00 sec) 

也就是说,GROUP BY NULL 以后,只会有一个分组,里面就是第一行数据。

但是如果这样,MIN、MAX结果应该是一致的,那也不应该MAX和MIN一个有结果,一个没结果啊,这是为什么呢,再做一个测试。

修改一下数据,然后直接查看MIN/MAX的值:

 

 
  1. root@localhost : plx 10:26:58> select * from t2; 
  2. +------+----+ 
  3. | a | id | 
  4. +------+----+ 
  5. | 10 | 1 | 
  6. | 1 | 3 | 
  7. +------+----+ 
  8. rows in set (0.00 sec) 
  9.  
  10. root@localhost : plx 10:27:04> SELECT * FROM t2 GROUP BY NULL
  11. +------+----+ 
  12. | a | id | 
  13. +------+----+ 
  14. | 10 | 1 | 
  15. +------+----+ 
  16. 1 row in set (0.00 sec) 
  17.  
  18. root@localhost : plx 10:30:21> SELECT MAX(a),MIN(a),MAX(id),MIN(id) FROM t2 GROUP BY NULL
  19. +--------+--------+---------+---------+ 
  20. MAX(a) | MIN(a) | MAX(id) | MIN(id) | 
  21. +--------+--------+---------+---------+ 
  22. | 10 | 1 | 3 | 1 | 
  23. +--------+--------+---------+---------+ 
  24. 1 row in set (0.00 sec) 

是不是发现问题了?

MAX/MIN函数取值是全局的,而不是LIMIT 1这个分组内的。

因此,当GROUP BY NULL的时候,MAX/MIN函数是取所有数据里的最大和最小值!

所以啊,”SELECT * FROM t HAVING id=MIN(id)”本质上是”SELECT * FROM t HAVING id=1″, 就能返回一条记录,而”SELECT * FROM t HAVING id=MAX(id)”本质上是”SELECT * FROM t HAVING id=3″,当然没有返回记录,这就是问题的根源。

测试一下GROUP BY a,这样就对了,每个分组内只有一行,所以MAX/MIN一样大,这回是取得组内最大和最小值。

 

 
  1. root@localhost : plx 11:29:49> SELECT MAX(a),MIN(a),MAX(id),MIN(id) FROM t2 GROUP BY a; 
  2. +--------+--------+---------+---------+ 
  3. MAX(a) | MIN(a) | MAX(id) | MIN(id) | 
  4. +--------+--------+---------+---------+ 
  5. | 1 | 1 | 3 | 3 | 
  6. | 10 | 10 | 5 | 5 | 
  7. +--------+--------+---------+---------+ 
  8. rows in set (0.00 sec) 

GROUP BY NULL时MAX/MIN的行为,是这个问题的本质,所以啊,尽量使用标准语法,玩花样SQL之前,一定要搞清楚它的行为是否与理解的一致。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表