select tp.oid, tp.posts_name, tc.msg_content, tc.create_time from t_posts tp left join t_comment tc on tp.oid = tc.posts_id group by tp.oid having create_time = max(create_time) 假设现在有两个文章A, B (回复的记录在数据库的顺序与下述一致)
mysql的 having 是在 group by 之后再执行, 也就是说, 先分组, 在过滤, 但是因为存在两条以上的留言记录, 所以分组之后的结果集只会取每条留言的第一条作为分组之后的记录信息, 这时如果使用having create_time = max(create_time) 那么, max(create_time) 为当前分组的最大时间
为: 2019-09-10 和 2019-09-09
所以上述sql会丢失结果集
4.改造SQL
因为知道分组之后合并的重复结果集为rownum最小的那条, 那么可不可以改造sql如下??
select tp.oid, tp.posts_name, tc.msg_content, tc.create_time from t_posts tp left join t_comment tc on tp.oid = tc.posts_id group by tp.oid having create_time = max(create_time) -- 下面的是新增的sql order by tc.create_time desc 运行之后发现依旧不好使, 证明order by 在group by & having 之后
后来想想可不可以 不用having, 直接用order by来优化分组后的结果呢?
having create_time = max(create_time)
select tp.oid, tp.posts_name, tc.msg_content, tc.create_time from t_posts tp left join t_comment tc on tp.oid = tc.posts_id group by tp.oid order by tc.create_time desc 结果集错误, 并不能影响分组结果, 依旧是按照rownum最小分组合并重复结果集, 然后在排序
5.终极改造版本
因为order by 只能后影响group by, 那么是不是可以在group by 之前先把结果集排序一下, 然后再分组呢?
select * from ( select tp.oid, tp.posts_name, tc.msg_content, tc.create_time from t_posts tp left join t_comment tc on tp.oid = tc.posts_id order by tc.create_time desc ) t group by t.oid 发现还是不好使, 但是子查询确实先排序了
经查询(explain), 发现子查询的order by被优化没了, 解决办法:
在子查询里使用limit 99999 在子查询里使用where条件, create_time = (select max(create_time) from t_comment group by oid) select * from ( select tp.oid, tp.posts_name, tc.msg_content, tc.create_time from t_posts tp left join t_comment tc on tp.oid = tc.posts_id order by tc.create_time desc limit 9999 ) t group by t.oid 大功告成
附加知识点:
mysql5.5 与 mysql 5.7 版本差异: 5.7+ 版本, 如果不使用 limit, group by 会把 order by 优化掉