关于分页查询和性能问题

2019-11-18 16:39:36

字体：大中小

来源：转载

供稿：网友

分页查询是经常能够遇到的问题，我们首先看看分页查询存在的理由:

方便用户：用户不可能一次察看所有数据，所以一页一页的翻看比较好。
提高性能：一次从数据库中提取所有数据会比较慢。
那么现在我来尝试反驳上述理由：

真的方便吗？我们考虑下面的情况
如果数据只有20条。
如果数据超过1000条。
第一种显然不必分页查询。奇怪的是第二种也不必，因为没有哪个用户愿意一页一页的翻到最后，如果用户查询到的数据超过了他所关心的数据范围，我认为应该让他重新输入查询条件，就像我们使用google一样。
但是作为一个友好的应用界面，我们总是希望用户可以全面的了解他的查询结果，所以有必要告诉用户：“你查到了多少数据，但是，目前只能显示前1000条，如果您希望察看所有数据，那么应该如何如何... ”
性能会提高吗？
如果数据量很小，显然性能不会有明显的提升，相反，性能会大大下降。因为数据库执行了不必要的查询和查询条件。
如果数据量很大，性能也不见得有明显提升，因为你总是要执行一个额外的count查询，并且，组合SQL的时候极有可能造成全表扫描。当然这要看数据库的实现原理了。
可以想像，分页查询对于性能的影响和数据量之间的关系应该是一个曲线，数据量小的时候会降低性能，数据量大的时候可能（根据不同的数据库）会提升性能。关键是通过测试，找到曲线的拐点。性能不是根据经验和感觉得到的，而是通过测试得到的
另外，如果一次全部取出数据，的确会造成空间性能的影响，但是，现在内存很便宜...
负面影响
对于一个架构良好的web应用，将pageNo和PageSize在各个类之间传递实在是不爽，这两个数据明显属于表现层。当然，如果你使用RoR算俺没说。
明显提高编程复杂度，尤其是在考虑数据库无关性的时候。
奇怪的现象：为什么没有一个大型数据库直接提供分页查询？Oracle的RowNo不是用于分页的，SQLServer的Top更不是。
结论
ExtremeTable、DisplayTag、JSF DataTable都提供了简单的分页方式，那就是在结果集合中分页。使用非常方便，而且使得逻辑清晰，大大提高了工作效率。绝大多数情况下，可以直接使用这种方式。
如果通过测试，发现上述方式影响了性能，那么考虑使用分页查询。
对于用户量很大的应用，因为内存的原因，也可以考虑分页查询。但是，我个人更推荐缓存方式：同样的查询放在一个缓存中...
采用合理的设计，屏蔽开发人员处理分页逻辑。比如，将分页逻辑和count查询放在父类，开发人员负责组合查询条件。具体看设计模式吧。
欢迎大家讨论！！！