首页 > 开发 > 综合 > 正文

使用子查询可提升 COUNT DISTINCT 速度 50 倍

2024-07-21 02:50:39
字体:
来源:转载
供稿:网友
使用子查询可提升 COUNT DISTINCT 速度 50 倍

注:这些技术是通用的,只不过我们选择使用Postgres的语法。使用独特的pgAdminIII生成解释图形。

  很有用,但太慢

  Count distinct是SQL分析时的祸根,因此它是我第一篇博客的不二选择。

  首先:如果你有一个大的且能够容忍不精确的数据集,那像HyperLogLog这样的概率计数器应该是你最好的选择。(我们会在以后的博客中谈到HyperLogLog。)但对于需要快速、精准答案的查询,一些简单的子查询可以节省你很多时间。

  让我们以我们一直使用的一个简单查询开始:哪个图表的用户访问量最大?

1234567select

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表