首页 > 数据库 > SQL Server > 正文

通过 SQL Server 2005 索引视图提高性能

2024-08-31 00:50:12
字体:
来源:转载
供稿:网友

  本文介绍了 sql server 2005 enterprise edition 中经过改进的索引视图功能。文中对索引视图进行了说明介绍,并讨论了可通过该功能改善性能的一些具体情况

  一、索引视图

  多年以来,microsoft® sql server™ 一直支持创建称为视图的虚拟表。通常,这些视图的主要作用是:

  提供一种安全机制,将用户限制到一个或多个基表的某个数据子集中。

  提供一种机制,允许开发人员自定义用户通过逻辑方式查看存储在基表中的数据的方式。

  通过 sql server 2000,sql server 视图的功能得到了扩展,实现了系统性能方面的收益。可在视图上创建唯一的聚集索引及非聚集索引,来提高最复杂的查询的数据访问性能。在 sql server 2000 和 2005 中,具有唯一的聚集索引的视图即为索引视图。本文所讨论的内容适用于 sql server 2005,其中有许多内容也适用于 sql server 2000。

  从数据库管理系统 (dbms) 的角度看来,视图是对数据(一种元数据类型)的一种描述。当创建了一个典型视图时,通过封装一个 select 语句(定义一个结果集来表示为虚拟表)来定义元数据。当在另一个查询的 from 子句中引用视图时,将从系统目录检索该元数据,并替代该视图的引用扩展元数据。视图扩展之后,sql server 查询优化器会为执行查询编译一个执行计划。查询优化器会搜索针对某个查询的一组可能的执行计划,并根据对执行每个查询计划所需的实际时间的估计,选择所能找到的成本最低的计划。

  对于非索引视图,解析查询所必需的视图部分会在运行时被具体化。任何计算(比如:联接或聚合)都在每个引用视图的查询执行时完成1。在视图上创建了唯一的聚集索引后,该视图的结果集随即被具体化,并保存在数据库的物理存储中,从而在执行时节省了执行这一高成本操作的开销。

  在查询执行中,可通过两种方式使用索引视图。查询可直接引用索引视图,或者更重要的是,如果查询优化器确定该视图可替换成本最低的查询计划中的部分或全部查询,那么就可以选定它。在第二种情况中,使用索引视图替代基础表及其一般索引。不必在查询中引用视图以使查询优化器在查询执行时使用该视图。这使得现有的应用程序可以从新创建的索引视图中受益,而不必进行更改。

  注意 索引视图是 sql server 2000 和 2005 各版本的一个功能。在 sql server 2000 和 2005 的 developer 和 enterprise 版本中,查询处理器可使用索引视图来解析结构上与该视图相匹配的查询,即便不按名称来引用视图。在其他版本中,必须按名称来引用视图,并对视图引用使用 noexpand 提示来查询索引视图的内容。

通过索引视图改善性能

  运用索引提高查询性能不算是一个新概念;但是,索引视图提供了一些借助标准索引无法取得的性能收益。索引视图可通过以下方式提高查询性能:

  可预先计算聚合并将其保存在索引中,从而在查询执行时,最小化高成本的计算。

  可预先联接各个表并保存最终获得的数据集。

  可保存联接或聚合的组合。

  该图说明了当查询优化器使用索引视图时,通常所能取得的性能改进。所列举的查询在复杂性上有所不同(比如:聚合计算的数量、所用表的数量或谓词的数量)并包含来自真实的生产环境的具有数百万行的表。

  

在视图上使用非聚集索引

  其次,视图上的非聚集索引可提供更好的查询性能。与表上的非聚集索引类似,视图上的非聚集索引可提供更多选项,供查询优化器在编译过程中选择。例如,如果查询包含聚集索引所未涉及的列,那么优化器可在计划中选择一个或多个辅助索引,避免对索引视图或基表进行费时的完全扫描。

  对架构添加索引会增加数据库的开销,因为索引需要持续的维护。在索引数量和维护开销间寻求适当的平衡点时,应谨慎权衡。

  二、应用索引视图的优点

  在实施索引视图前,分析数据库工作负荷。运用查询及各种相关工具(比如:sql profiler)方面的知识来确定可从索引视图获益的查询。频繁发生聚合和联接的情况最适合使用索引视图。无论是否频繁发生,只要某个查询需要很长的响应时间,同时快速获得响应的开销很高,那么就适合使用索引视图。例如,一些开发人员发现为高级主管们在月末运行的报告,创建预先计算和存储查询的应答的索引视图很有用。

  不是所有的查询都能从索引视图中获益。与一般索引类似,如果未使用索引视图,就无法从中受益。在这种情况下,不仅无法实现性能改善,而且会在磁盘空间、维护和优化方面产生额外的成本。然而,当使用索引视图时,可大大改善(在数量级上)数据访问。这是因为查询优化器使用存储在索引视图(大幅降低了查询执行的成本)中预先计算的结果。

  查询优化器仅考虑对具有高成本的查询使用索引视图。从而避免出现这样的情况:在查询优化成本高于使用索引视图所节约的成本时尝试匹配各种索引视图。在成本少于 1 的查询中很好使用索引视图。

  从实施索引视图中获益的应用程序包括:

  决策支持工作负荷

  数据集市

  数据仓库

  联机分析处理 (olap) 存储和源

  数据挖掘工作负荷

  从查询类型和模式方面来看,获益的应用程序一般包含:

  大型表的联接和聚合

  查询的重复模式

  几组相同或重叠的列上的重复聚合

  相同键上相同表的重复联接

  以上各项的组合

  相反,执行许多写入操作的联机事务处理 (oltp) 系统或者频繁更新的数据库应用程序可能无法运用索引视图,因为同时更新视图和底层基表会带来更高的维护成本。

查询优化器如何使用索引视图

  sql server 查询优化器自动决定何时对给定的查询执行使用索引视图。不必在查询中直接引用视图以供优化器在查询执行计划中使用。所以,现有的应用程序可运用索引视图,而不用更改应用程序本身;只是必须创建索引视图。

优化器考虑事项

  查询优化器通过考虑几个条件来决定索引视图能否涵盖整个或部分查询。这些条件对应查询中的一个 from 子句并由下列这几个部分组成:

  查询 from 子句中的表必须是索引视图 from 子句中的表的超集。

  查询中的联接条件必须是视图中的联接条件的超集。

  查询中的聚合列必须可从视图中的聚合列的子集派生。

  查询选择列表中的所有表达式必须可从视图选择列表或未包含在视图定义中的表派生。

  如果与其他谓词所匹配的行的超集相匹配,那么该谓词将归入另一个谓词。例如,“t.a=10”归入“t.a=10 and t.b=20”。任何谓词都可归入其自身。视图中限制表值的那部分谓词必须归入查询中限制相同表的那部分谓词。此外,必须以 sql server 可验证的方式实现这一点。

  属于视图定义中的表的查询搜索条件谓词的所有列必须出现在下列视图定义的一项或多项中:

  1.

  一个 group by 列表。

  2.

  视图选择列表(如不存在 group by)。

  3.

  视图定义中相同或等价的谓词。

  情况 (1) 和 (2) 允许 sql server 对视图的列应用查询谓词,以便进一步限制视图的列。情况 (3) 比较特殊。在这种情况下,不需要对列进行筛选,因此该列不必出现在视图中。

  如果查询不止包含一个 from 子句(子查询、派生表、union),优化器可能选择几个索引视图来处理查询,并将它们应用到不同 from 子句。2

  本文档的末尾提供了涉及这些情况的具体查询。推荐的最佳实务是让查询优化器决定在查询执行计划中使用哪些索引(如果有的话)。

使用 noexpand 视图提示

  当 sql server 处理按名称引用视图的查询时,视图的定义只有在仅引用基表时才会被正常扩展。这个过程称为视图扩展。其属于一种宏扩展形式。

  noexpand 视图提示可强制查询优化器将视图视为带有聚集索引的普通表。其可防止视图扩展。只有在 from 子句中直接引用索引视图,才会应用 noexpand 提示。例如,

select column1, column2, ...from table1, view1 with (noexpand) where ...

  如要确保让 sql server 通过自己读取视图而不是从基表读取数据来处理查询,那么可使用 noexpand。如果出于某种原因,sql server 选择了一个查询计划来对基表处理查询,而您想让其使用视图,那么可以考虑使用 noexpand。必须在除 developer 和 enterprise 版本外的 sql server 的所有版本中使用 noexpand 来让 sql server 直接对索引视图处理查询。可以看到 sql server 为计划的图形表达式选择了一个使用 sql server management studio 工具的显示预计的执行计划功能的语句。或者,可以看到使用 showplan_all、showplan_text 或 showplan_xml 的不同的非图形表达式。参阅 sql sever 联机丛书中有关 showplan 的不同版本的相关讨论。

使用 expand views 查询提示

  处理按名称引用视图的查询时,除非对视图引用添加 noexpand 提示,否则 sql server 总会扩展视图。该提示会尝试匹配索引视图和扩展查询,除非在查询末尾的一个 option 子句中指定 expand views 查询提示。例如,假设数据库中有一个索引视图 view1。在下方的查询中,根据其逻辑定义(其 create view 语句)对 view1 进行了扩展,然后 expand views 选项会阻止在计划中使用 view1 的索引视图来解析该查询。

select column1, column2, ... from table1, view1 where ...
option (expand views)

  如要确保让 sql server 通过从查询所引用的基表直接访问数据来处理该查询,而不必访问索引视图,那么可使用 expand views。在某些情况下,expand 视图有助于消除因使用索引视图而导致的锁争用。在测试应用程序时,noexpand 和 expand views 都可帮助用户在使用和不使用索引视图的情况下进行性能评估。

  三、sql server 2005 的索引视图的新增功能

  与 sql server 2000 相比,sql server 2005 包含了许多索引视图的改进功能。可索引的视图组已扩展至包含基于下列各项的视图:

  • 标量聚合,包括 sum 和不带 group by 的 count_big。
• 标量表达式和用户定义的功能 (udfs)。例如,给定一个表 t(a int, b int, c int) 和一个标量 udf dbo.myudf(@x int),t 上定义的索引视图可包含一个计算列(比如:a+b 或 dbo.myudf(a))。
• 不精确的永久性列。不精确的列是一种浮型或实型的列,或者是一种派生自浮型或实型列的计算列。在 sql server 2000 中,如果不属于索引键的一部分,不精确的列就可用于索引视图的选择列表。不精确的列不能用于视图定义中的其他地方(比如:where 或 from 子句)。如果不精确的列永久保存在基表中,那么 sql server 2005 允许其加入键或视图定义。永久性列包含常规列和标记为 persisted 的计算列。
• 不精确的非永久性列无法加入索引或索引视图的根本原因是:必须使数据库脱离原计算机,然后再附加到另一台计算机。完成转移之后,保存在索引或索引视图中的所有计算列值在新硬件上的派生方式必须与旧硬件完全相同,精确到每个位。否则,这些索引视图在新硬件上会遭到逻辑破坏。由于这种破坏,在新硬件上,针对索引视图的查询会根据计划是否使用了索引视图或基表来派生视图数据,返回不同的应答。此外,无法在新计算机上正常维护索引视图。可惜,不同计算机上的浮点硬件(即便采用相同制造商的相同处理器体系结构)在处理器的版本上并不总是完全相同。对于某些浮点值 a 和 b,固件升级可能导致新硬件上的 (a*b) 不同于旧硬件上的 (a*b)。例如,结果可能非常相近,但仍存在细微差别。在进行索引之前一直保留不精确的计算值可解决这种分离/附加的不一致性问题,因为在进行索引和索引视图的数据库更新和维护期间,在相同的计算机上评估了所有表达式。
• 通用语言运行时 (clr) 类型。sql server 2005 的一个主要的新功能是支持基于 clr 的用户定义的类型 (udt) 和 udf。假如列或表达式具有确定性或是永久且精确的,或者二者兼具,那么就可在 clr udt 列或从这些列派生而来的表达式上定义索引视图。不能在索引视图上使用 clr 用户定义的聚合。

  优化器匹配查询和索引视图(使之可在查询计划中使用)的功能经扩展包含:

  • 新的表达式类型,位于查询或视图的 select 列表或条件中,涉及:

  • 标量表达式(比如 (a+b)/2)。
• 标量聚合。
• 标量 udf。
• 间隔归入。优化器可检测索引视图定义中的间隔条件是否覆盖或“归入”查询中的间隔条件。例如,优化器可确定“a>10 and a<20”覆盖“a>12 and a<18”。
• 表达式等价。某些表达式虽然在语法上有所不同,但最终的结果却相同,那么可以将其视为等价。例如,“a=b and c<>10”与“10<>c and b=a”等价。

  另外,如果数据库中存在大量索引视图,那么对比在其上定义视图的表的编译性能,sql server 2005 通常要比 sql server 2000 快很多。.

  四、设计注意事项
对数据库系统确定一组适当的索引可能很复杂。如果在设计一般索引时需要考虑众多可能性,那么对架构添加索引视图会大幅提高设计和潜在结果的复杂性。例如,索引视图可用于:

  • 查询中引用的表的任何子集。
• 该表子集的查询中的条件的任何子集。
• 组合的列。
• 聚合函数(比如:sum)。

  应同时设计表和索引视图上的索引,以便从每个构造中获得最佳结果。由于索引和索引视图对给定查询可能都很有用,因此分开设计会导致多余的建议,从而产生较高的存储和维护开销。优化数据库的物理设计时,必须权衡一组不同的查询和数据库系统必须支持的更新的性能要求。所以,对索引视图确定一项适当的物理设计是一种富有挑战性的任务,应尽可能使用数据库优化顾问 (database tuning advisor)。

  如果为建立一个特殊的查询,查询优化器考虑了许多索引视图,那么查询优化成本就会显著增加。查询优化器可能会考虑在查询中的表的任何子集上定义的所有索引视图。在拒绝视图之前,必须调查每个视图以便进行替换。这可能要花一些时间,尤其当给定查询存在数百个这类视图时。

  在其上创建一个唯一的聚集索引之前,视图必须满足几项要求。在设计阶段,考虑这些要求:

  • 视图以及视图中引用的所有表必须在相同的数据库中,并具有相同的所有者。
• 索引视图不必包含查询中引用的供优化器使用的所有表。
• 在视图上创建任何其他的索引之前,必须先创建一个唯一的聚集索引。
• 在创建基表、视图和索引时,以及基表和视图中的数据被修改时,必须正确设置某些 set 选项(在本文档后面所有详述)。此外,除非这些 set 选项正确无误,否则查询优化器不会考虑索引视图。
• 必须使用架构绑定创建视图,并且还必须通过 schemabinding 选项创建该视图中引用的任何用户定义的函数。
• 需要额外的磁盘空间来保存索引视图所定义的数据。

  设计方针

  设计索引视图时考虑这些指导方针:

  设计可供几个查询或多项操作使用的索引视图。

  例如,包含列的 sum 和 count_big 的索引视图可供包含函数 sum、count、count_big 或 avg 的查询使用。查询的速度会更快,因为只需对视图中少量的行进行检索,而不必检索基表中所有的行,而且执行 avg 函数所需的一部分计算已经完成。

  使索引键保持简洁。

  通过在索引键中尽可能使用最少的列和字节,可对索引视图的列实现更高效的访问,因为索引视图的列更窄,键比较的速度较更宽的键快一些。另外,在索引视图上定义的每个非聚集索引中,聚集索引键都被用作行定位器。较大的索引键的成本随视图上非聚集索引的数量成比例增长。

  考虑最终索引视图的大小。

  对于纯聚合,如果索引视图的大小与原始表的大小不相上下,可能就不会实现巨大的性能改善。

  设计多个较小的索引视图来局部加速过程。

  可能无法总对整个查询设计一个索引视图。如要怎么做,考虑创建若干个索引视图,各执行部分查询。

  考虑这几个例子:

  经常执行的查询会在一个数据库中聚合数据,并在另一个数据库中聚合数据,然后再联接结果。因为索引视图无法从多个数据库引用表,所以用户不能设计一个视图来执行整个过程。但是,可以在每个数据库中创建一个索引视图来进行各个数据库的聚合操作。如果优化器可匹配索引视图和现有的查询,那么至少聚合处理的速度会更快,同时不必对现有的查询进行重新编码。虽然联接处理不会加快,但整个查询将变快,因为其使用存储在索引视图中的聚合。

  经常执行的查询聚合来自几个表的数据,然后使用 union 合并结果。索引视图不支持 union。可设计若干个视图来执行每个聚合操作。而后,优化器可选择索引视图来加快查询,而不必对查询进行重新编码。虽然未改进 union 处理,但改善了各个聚合过程。

有能帮助选择索引视图的工具吗?

  数据库优化顾问 (dta3) 是 sql server 2005 的一项功能,可帮助管理员优化物理数据库设计。除了建议使用基表上的索引以及表和索引分区策略外,dta 还推荐使用索引视图。使用 dta 可加强管理员确定索引、索引视图和分区策略(可优化对数据库执行的查询的典型组合的性能)的组合的能力。dta 会向用户推荐广泛的索引视图。其中包括运用 sql server 2005 的索引视图的新功能(在“sql server 2005 的索引视图有哪些新增功能?”一节有所描述)的索引视图。dta 并没有排除让数据库管理在设计物理存储结构时做出恰当判断的需要。但是,它可以简化物理数据库的设计过程。dta 通过推荐一组假定的索引,索引视图和分区结果,与基于成本的查询优化器协同工作。dta 使用优化器来估计当使用和不使用这些结构时的工作负荷成本,并推荐可提供较低的总成本的结构。

  因为数据库优化顾问强制执行所有必须的 set 选项(确保结果集正确无误),所以将成功完成索引视图的创建。然而,如果未能按要求设置选项,用户的应用程序可能无法运用这些视图。如果未按要求指定 set 选项,对加入索引视图定义的表执行的插入、更新或删除操作就有可能失败。

更新数据时索引视图会有什么变化?

  与其他任何索引一样,当基表数据变化时,sql server 会自动维护索引视图。对于一般索引,每个索引都直接与一个表相关联。随着在基础表上执行每一项 insert、update 或 delete 操作,索引将被相应地更新,从而使保存在索引中的值总是与表保持一致。

  索引视图也得到相同的维护;但是,如果视图引用了若干个表,那么更新任何一个表都需要更新索引视图。不同于一般索引,在任何参与的表中插入一行都可能导致索引视图中发生多行更改。这是因为所插入的行可能与另一个表的多个行相联接。更新和删除行的情况也一样。因此,索引视图的维护成本可能比维护表上的索引更高。相反,维护具有高选择性条件的索引视图的成本可能要比维护表上的索引低得多,因为多数对视图所引用的基表的插入、删除和更新操作不会影响视图。不用访问其他数据库数据就可为索引视图筛选掉这些操作。

  在 sql server 中,可更新某些视图。当某个视图可更新时,将使用 insert、update 和 delete 语句通过视图直接修改底层基表。在视图上创建索引不会阻止视图的更新。索引视图的更新确实会导致视图下基表的更新。这些更新会作为索引视图维护的一部分自动传播回索引视图。有关可更新的视图的详细信息,参阅面向 sql server 2005 的 sql server 联机丛书中的“通过视图修改数据”。

维护成本注意事项

  设计索引视图时应考虑下面这几点:

  索引视图的数据库需要附加存储。索引视图的结果集在物理上通过与典型表存储相似的方式保留在数据库中。

  sql server 会自动维护视图;因此,对定义了视图的基表进行的任何更改都可能引发对索引视图进行一项或多项更改。所以,将产生额外的维护开销。

  视图所获得的净性能提升为其所实现的总查询执行成本节约与存储和维护成本的差值。

  比较容易获得接近于视图所需的存储。通过 sql server management studio 工具——显示预计的执行计划,评估视图定义所封装的 select 语句。该工具将生成查询所返回的行数和行大小的近似值。通过将这两个值相乘,就可以获得接近于可能的视图大小;但是,只是近似。只有在视图定义中执行查询或在视图上创建索引,才能确定视图上索引的实际大小。

  从 sql server 所执行的自动维护注意事项的角度来看,显示预计的执行计划功能可能会让用户在一定程度上了解这一开销的影响。如果通过 sql server management studio 评估修改视图的语句(视图上的 update、基表中的 insert),对该语句显示的执行计划将包括该语句的维护操作。如果就该操作在生产环境中所要执行的次数考虑该成本,那么可能会产生视图维护成本。

  通常建议尽可能对视图或其底下的基表成批(而非单独)执行任何修改或更新操作。这样就会降低视图维护开销。

  五、创建索引视图

  创建索引视图所需的步骤对于视图的成功执行至关重要。

  1.

  针对将在视图中引用的所有现有表,确认 ansi_nulls 的设置正确无误。

  2.

  创建任何新表之前,确认对下表所示的当前会话正确设置了 ansi_nulls。

  3.

  创建任何新表之前,确认对下表所示的当前会话正确设置了 ansi_nulls 和 quoted_identifier。

  4.

  确认视图定义具有确定性。

  5.

  使用 with schemabinding 选项创建视图。

  6.

  在视图上创建唯一的聚集索引之前,确认会话的 set 选项的设置正确无误,如下图所示。

  7.

  在视图上创建唯一的聚集索引。

  8.

  可用 objectproperty 函数检查现有表或视图上 ansi_nulls 和 quoted_identifier 的值。

使用 set 选项获得一致的结果

  如果在执行查询时对当前会话启用了不同的 set 选项,评估相同的表达式可在 sql server 2005 中产生不同的结果。例如,set 选项 concat_null_yields_null 被设为 on 后,表达式 'abc' + null 会返回值 null。但当 concat_null_yieds_null 被设为 off 后,相同的表达式会生成 'abc'。对于当前会话和视图所引用的对象,索引视图需要几个 set 选项的固定值,以确保正确维护视图并返回一致的结果。

  只要存在下列条件,就必须按下表中“必需的值”一列所示的值对当前会话设置 set 选项:

  创建了索引视图。

  在加入索引视图的任何表上执行了任何 insert、update 或 delete 操作。

  查询优化器用索引视图生成查询计划。

set 选项必需的值默认服务器值ole db 和 odbc 值db lib 值

  ansi_nulls

  on

  off

  on

  off

  ansi_padding

  on

  on

  on

  off

  ansi_warnings

  on

  off

  on

  off

  concat_null_yields_null

  on

  off

  on

  off

  numeric_roundabort

  off

  off

  off

  off

  quoted_identifier

  on

  off

  on

  off

  arithabort4 选项必需被设为 on,以便使当前会话创建索引视图,但是在 sql server 2005 中,只要 ansi_warnings 的值为 on,该选项就会自动被设为 on,所以不必对其进行设置。如果使用 ole db 或 odbc 服务器连接,只需修改 arithabort 设置的值。必须使用 sp_configure 在服务器级别或使用 set 命令从应用程序正确设置所有 db lib 值。有关 set 选项的详细信息,参阅 sql server 联机丛书中的“使用选项”。

使用具有确定性的功能

  索引视图的定义必须具有确定性。如果选择列表中的所有表达式以及 where 和 group by 子句都具有确定性,那么视图就具有确定性。具有确定性的表达式总是在通过一组特定的输入值对其进行评估时,返回相同的结果。只有具有确定性的函数才会加入具有确定性的表达式。例如,dateadd 函数具有确定性,因为对于任何给定的一组参数值,该函数总对它的三个参数返回相同的结果。getdate 不具有确定性,因为它总调用相同的参数,而其返回的值在每次执行时都会发生变化。详细信息,参阅面向 sql server 2005 的 sql server 联机丛书中的“具有和不具有确定性的函数”。

  即使某个表达式具有确定性(如果其包含浮点表达式),确切的结果可能依处理器体系结构或微码的版本而定。为了在计算机间迁移数据库时确保 sql server 2005 中数据的完整性,这种表达式只能作为索引视图的非键列加入。不含浮点表达式的具有确定性的表达式被认为是精确的。只有永久和/或精确的具有确定性的表达式才可加入键列以及索引视图的 where 或 group by 子句。永久性表达式是对已保存列的引用,包括一般列和标为 persisted 的计算列。

  用 columnproperty 函数和 isdeterministic 属性确定视图列是否具有确定性。用 columnproperty 函数和 isprecise 属性确定带有 schemabinding 的视图中的具有确定性的列是精确的。如果属性为 true,columnproperty 将返回 1;如为 false,则返回 0;而如果为 null,则表示无效输入。例如,在此脚本中

create table t(a int, b real, c as getdate(), d as a+b)
create view vt with schemabinding as select a, b, c, d from dbo.t
select object_id('vt'), columnproperty(object_id('vt'),'b','isprecise')

  select 对 isprecise 返回 0,因为 b 列为实型。可通过 columnproperty 做一些实验,确认 t 的其他列是否具有确定性并是精确的。

其他要求

  可索引的视图集合是可能的视图集合的一个子集。任何可索引的视图在有或没有索引的情况下都可存在。

  除了设计方针(“使用 set 选项获得一致的结果”和“使用具有确定性的函数”这两节)中所列的要求外,还必须满足下列要求,以便在视图上创建唯一的聚集索引。

有关基表的要求

  视图所引用的基表必须具有在创建表时所设的 set 选项 ansi_nulls 的正确的值。可用 objectproperty 函数检查现有表上的 ansi_nulls 的值。

有关函数的要求

  必须使用 with schemabinding 选项创建视图所引用的用户定义的函数。

有关视图的要求

  必须使用 with schemabinding 选项创建视图。

  必须由使用双结构名称 (schemaname.tablename) 的视图引用表。

  必须由使用双结构名称 (schemaname.functionname) 的视图引用用户定义的函数。

  必须正确设置 set 选项 ansi_nulls 和 quoted_identifier。

视图限制

  如要在 sql server 2005 中的视图上创建一个索引,相应的视图定义必须包含:

  any、not any

  openrowset、openquery、opendatasource

  不精确的(浮型、实型)值上的算术

  openxml

  compute、compute by

  order by

  convert 生成一个不精确的结果

  outer 联接

  count(*)

  引用带有一个已禁用的聚集索引的基表

  group by all

  引用不同数据库中的表或函数

  派生的表(from 列表中的子查询)

  引用另一个视图

  distinct

  rowset 函数

  exists、not exists

  自联接

  聚合结果(比如:sum(x)+sum(x))上的表达式

  stdev、stdevp、var、varp、avg

  全文谓词 (contains、freetext、containstable、freetexttable)

  子查询

  不精确的常量(比如:2.34e5)

  可为空的表达式上的 sum

  内嵌或表值函数

  表提示(比如:nolock)

  min、max

  text、ntext、image、filestream 或 xml 列

  不具有确定性的表达式

  top

  非 unicode 排序

  union

  sql server 2005 可检测到的矛盾情况表示视图将为空(比如,当 0=1 及 ...)

  注意 索引视图可能包含浮型和实型列;但是,如果这类列为非永久性的计算列,则不能包含在聚集索引键中。

group by 限制

  如果存在 group by,view 定义为:

  一定包含 count_big(*)。

  一定不包含 having、cube、rollup 或 grouping()。

  这些限制仅适用于索引视图定义。即便不能满足上述 group by 限制,查询也可以在其执行计划中使用索引视图。

有关索引的要求

  执行 create index 语句的用户必须是视图所有者。

  如果视图定义包含 group by 子句,唯一的聚集索引的键只能引用 group by 子句所指定的列。

  一定不能在启用 ignore_dup_key 选项的情况下创建索引。

  六、示例

  本节中的例子阐述了如何结合两类主要的查询使用索引视图:聚合和联接。同时,说明了查询优化器在确定某个索引视图是否适用时所用的条件。有关完整的条件列表的信息,参阅“查询优化器如何使用索引视图”。

  这些查询基于 adventureworks 中的表。adventureworks 是 sql server 2005 所提供的示例数据库,并可作为写入方式来执行。在创建视图前后,用户可能想用 sql server management studio 中显示预计的执行计划工具,来查看查询优化器所选择的计划。虽然这些例子说明了优化器选择低成本执行计划的方式,但是 adventureworks 示例由于太小而无法显示出性能方面的提升。

  在开始运用这些示例之前,确保通过运行下列命令对会话设置正确的选项:

  设置

set ansi_nulls on
set ansi_padding on
set ansi_warnings on
set concat_null_yields_null on
set numeric_roundabort off
set quoted_identifier on
set arithabort on

  下列查询显示了两种方法用于从 sales.salesorderdetail 表返回具有最大总折扣的五个产品。

  查询 1

select top 5 productid, sum(unitprice*orderqty) -
   sum(unitprice*orderqty*(1.00-unitpricediscount)) as rebate
from sales.salesorderdetail
group by productid
order by rebate desc

  查询 2

select top 5 productid,
sum(unitprice*orderqty*unitpricediscount) as rebate
from sales.salesorderdetail
group by productid
order by rebate desc

  查询优化器所选的执行计划包含:

  一个聚集索引扫描,位于估计行数为 121,317 的 sales.salesorderdetail 表上。

  一个哈希匹配/聚合操作符,用于将所选的行放入基于 group by 列的哈希表,并计算每行的 sum 聚合。

  一个 top 5 分类操作符,基于 order by 子句。

  视图 1

  添加包含 rebate 列所需聚合的索引视图将更改“查询 1”的查询执行计划。在大型表(含数百万行)上,查询的性能也会得到大幅提升。

create view vdiscount1 with schemabinding as
select sum(unitprice*orderqty) as sumprice,
sum(unitprice*orderqty*(1.00-unitpricediscount)) as sumdiscountprice,
count_big(*) as count, productid
from sales.salesorderdetail
group by productid
go
create unique clustered index vdiscountind on vdiscount1 (productid)

  第一个查询的执行计划显示 vdiscount1 视图被优化器所用。然而,该视图将不被第二个查询所用,因为其不包含 sum(unitprice*orderqty*unitpricediscount) 聚合。可再创建一个索引视图,来同时应付这两个查询。

  视图 2

create view vdiscount2 with schemabinding as
select sum(unitprice*orderqty)as sumprice,
sum(unitprice*orderqty*(1.00-unitpricediscount))as sumdiscountprice,
sum(unitprice*orderqty*unitpricediscount)as sumdiscountprice2,
count_big(*) as count, productid
from sales.salesorderdetail
group by productid
go
create unique clustered index vdiscountind on vdiscount2 (productid)

  使用这个索引视图,在丢弃 vdiscount1 后,这两个查询的查询执行计划现在包含:

  一个聚集索引扫描,位于估计行数为 266 的 vdiscount2 视图上

  一个 top 5 分类函数,基于 order by 子句

  查询优化器选择了该视图,因为虽然没有在查询中引用该视图,但其提供了最低的执行成本。

  查询 3

  “查询 3”与上述查询类似,但 productid 被列 salesorderid (未包含在视图定义中)所替换。这违反了条件:视图定义中表上的选择列表中的所有表达式必须派生自视图选择列表,以便使用查询计划中的索引视图。

select top 3 salesorderid,
sum(unitprice*orderqty*unitpricediscount) orderrebate
from sales.salesorderdetail
group by salesorderid
order by orderrebate desc

  必须用一个单独的索引视图来应付该查询。可修改 vdiscount2 以包含 salesorderid;但是,结果视图将和原始表包含同样多的行,并不会通过使用基表提高性能。

  查询 4

  该查询可生成每个产品的平均价格。

select p.name, od.productid,
avg(od.unitprice*(1.00-od.unitpricediscount)) as avgprice,
sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p
where od.productid=p.productid
group by p.name, od.productid

  复杂的聚合(比如:stdev、variance、avg)不能包含在索引视图的定义中。然而,通过包含(经组合)执行复杂聚合的一些简单的聚合函数,索引视图可用以执行含 avg 的查询。

  视图 3

  该索引视图包含执行 avg 函数所需的简单聚合函数。在创建“视图 3”后执行“查询 4”时,执行计划将显示所用的视图。优化器可从视图的简单聚合列 price 和 count 派生 avg 表达式。

create view view3 with schemabinding as
select productid, sum(unitprice*(1.00-unitpricediscount)) as price,
count_big(*) as count, sum(orderqty) as units
from sales.salesorderdetail
group by productid
go
create unique clustered index iv3 on view3 (productid)

  查询 5

  该查询与“查询 4”相同,但包含一个附加的搜索条件。即使附加的搜索条件只从未包含在视图定义中的表引用列,“视图 3”也将作用于该查询。

select p.name, od.productid,
avg(od.unitprice*(1.00-unitpricediscount)) as avgprice,
sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p
where od.productid=p.productid and p.name like '%red%'
group by p.name, od.productid

  查询 6

  查询优化器无法对该查询使用“视图 3”。添加的搜索条件 od.unitprice>10 包含来自视图定义中表的列,但该列不显示在 group by 列表中,而搜索谓词也不显示在视图定义中。

select p.name, od.productid,
avg(od.unitprice*(1.00-unitpricediscount)) as avgprice,
sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p
where od.productid=p.productid and p.name like '%red%'
group by p.name, od.productid

  查询 7

  相反,查询优化器可对“查询 7”使用“视图 3”,因为新的搜索条件 od.productid in (1,2,13,41) 中定义的列包含在视图定义的 group by 子句中。

select p.name, od.productid,
avg(od.unitprice*(1.00-unitpricediscount)) as avgprice,
sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p
where od.productid = p.productid and od.unitprice > 10
group by p.name, od.productid
视图 4
通过包含视图定义中的 sumprice 和 count 列以便计算查询中的 avg,该视图将满足“查询 6”的条件。
create view view4 with schemabinding as
select p.name, od.productid,
sum(od.unitprice*(1.00-unitpricediscount)) as sumprice,
sum(od.orderqty) as units, count_big(*) as count
from sales.salesorderdetail as od, production.product as p
where od.productid = p.productid and od.unitprice > 10
group by p.name, od.productid
go
create unique clustered index vdiscountind on view4 (name, productid)

  查询 8

  “视图 4”上相同的索引也将用于在其中添加对表 sales.salesorderheader 的联接的查询。该查询满足条件:查询 from 子句中所列的表是索引视图的 from 子句中的表的超集。

select p.name, od.productid,
avg(od.unitprice*(1.00-unitpricediscount)) as avgprice,
sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p,
   sales.salesorderheader as o
where od.productid = p.productid and o.salesorderid = od.salesorderid
   and od.unitprice > 10
group by p.name, od.productid

  最后两个查询在“查询 8”的基础上进行了修改。每个修改后的查询都违反了优化器的条件之一,并且不同于“查询 8”,无法使用“视图 4”。

  查询 8a

  “查询 8a”(q8a) 无法使用索引视图,因为 where 子句无法将视图定义中的 unitprice > 10 与查询中的 unitprice > 25 相匹配,而且 unitprice 未出现在视图中。查询搜索条件谓词必须是视图定义中的搜索条件谓词的超集。

select p.name, od.productid, avg(od.unitprice*(1.00-unitpricediscount))
   avgprice, sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p,
   sales.salesorderheader as o
where od.productid = p.productid and o.salesorderid = od.salesorderid
   and od.unitprice > 25
group by p.name, od.productid

  查询 8b

  注意,表 sales.salesorderheader 不加入索引视图 v4 定义。尽管这样,在该表上添加一个谓词将不允许使用索引视图,因为所添加的谓词可能会更改或消除加入下方“查询 8b”所示的聚合的其他行。

select p.name, od.productid, avg(od.unitprice*(1.00-unitpricediscount))
   as avgprice, sum(od.orderqty) as units
from sales.salesorderdetail as od, production.product as p,
   sales.salesorderheader as o
where od.productid = p.productid and o.salesorderid = od.salesorderid
   and od.unitprice > 10 and o.orderdate > '20040728'
group by p.name, od.productid

  视图 4a

  “视图 4a”通过将 unitprice 列包含在选择列表和 group by 子句中,扩展了“视图 4”。“查询 8a”可使用“视图 4a”,因为将进一步筛选 unitprice 值(已知大于 10)以便只留下大于 25 的值。以下是间隔归入的一个例子。

create view view4a with schemabinding as
select p.name, od.productid, od.unitprice,
sum(od.unitprice*(1.00-unitpricediscount)) as sumprice,
sum(od.orderqty) as units, count_big(*) as count
from sales.salesorderdetail as od, production.product as p
where od.productid = p.productid and od.unitprice > 10
group by p.name, od.productid, od.unitprice
go
create unique clustered index vdiscountind
   on view4a (name, productid, unitprice)

  视图 5

  “视图 5”在其选择和 group by 列表中包含一个表达式。请注意,linetotal 是一个计算列,因此本身是一个表达式。反过来,该表达式嵌套在对 floor 函数的调用中。

create view view5 with schemabinding as
select floor(linetotal) floortotal, count_big(*) c
from sales.salesorderdetail
group by floor(linetotal)
go
create unique clustered index iview5 on view5(floortotal)

  查询 9

  “查询 9”在其选择和 group by 列表中包含表达式 floor(linetotal)。通过对 sql server 2005 中表达式的视图匹配的新扩展,该查询使用“视图 5”上的索引。

select top 5 floor(linetotal), count(*)
from sales.salesorderdetail
group by floor(linetotal)
order by count(*) desc

  视图 6

  “视图 6”存储月末三天中有关线项目的信息。这样可将这些行聚集在少量页面上,从而可以迅速应对这些天里对 sales.salesorderdetail 的查询。

create view view6 with schemabinding as
select salesorderid, salesorderdetailid, carriertrackingnumber, orderqty,
   productid, specialofferid, unitprice, unitpricediscount, rowguid,
   modifieddate
from sales.salesorderdetail
where modifieddate in ( convert(datetime, '2004-07-31', 120),
            convert(datetime, '2004-07-30', 120),
            convert(datetime, '2004-07-29', 120) )
go
create unique clustered index vendjulyo4ind
   on view6(salesorderid, salesorderdetailid)
go

  查询 10

  下面的查询可匹配“视图 6”,同时系统可生成一个计划,用于扫描视图上的 vendjuly04ind 索引,但不扫描整个 sales.salesorderdetail 表。此查询还说明了表达式等价(由于查询中日期的顺序不同于视图,而且数据格式也不同)和谓词归入(由于查询要求将结果的子集保存在视图中)。

select h.*, salesorderdetailid, carriertrackingnumber, orderqty,
  productid, specialofferid, unitprice, unitpricediscount, d.rowguid,
  d.modifieddate
from sales.salesorderheader as h, sales.salesorderdetail as d
where (d.modifieddate = '20040729' or d.modifieddate = '20040730')
and d.salesorderid=h.salesorderid

  视图 7

  开发人员有时还会发现使用索引视图强制专门的完整性约束很方便。例如,可通过索引视图强制约束:“除非列中存在多个 0 值,否则表 t 的列 a 就是唯一的”。下方索引视图“视图 7”就强制了这一约束。如果运行下面的脚本,其将成功运行直至最终的插入操作。该语句被禁止,因为其添加了一个非零重复值。

use tempdb
go
create table t(a int)
go
create view view7 with schemabinding
as select a
from dbo.t
where a <> 0
go
create unique clustered index iv on view7(a)
go
-- legal:
insert into t values(1)
insert into t values(2)
insert into t values(0)
insert into t values(0) -- duplicate 0
-- dissalowed:
insert into t values(2)
七、有关索引视图的常见问题
问:为何对可创建索引的视图类型存在限制?
答:为了确保在逻辑上可对视图进行增量维护,限制创建维护成本较高的视图,并限制 sql server 实施的复杂性。较大的视图集不具有确定性并与内容相关;其内容的“更改”独立于 dml 操作。无法对这些内容进行索引。在其定义中调用 getdate 或 suser_sname 的任何视图就属于这类视图。
问:视图上的第一个索引为何必须为 clustered 和 unique?
答:必须为 unique 以便在维护索引视图期间,轻松地按键值查找视图中的记录,并阻止创建带有重复项目的视图(要求维护特殊的逻辑)。必须为 clustered,因为只有聚集索引才能在强制唯一性的同时存储行。
问:为何查询优化器不选取我的索引视图用于查询计划?
答:优化器不选取索引视图主要有三种原因:
(1) 使用 sql server enterprise 或 developer 版本之外的其他版本。只有 enterprise 和 developer 版本才支持自动的查询对索引视图匹配。按名称引用索引视图并包含 noexpand 提示,让查询处理器使用所有其他版本中的索引视图。
(2) 使用索引视图的成本可能超出从基表获取数据的成本,或者查询过于简单,使得针对基表的查询的速度既快又容易查找。当在较小的表上定义索引视图时,经常会发生这种情况。如要强制查询处理器使用索引视图,那么可使用 noexpand 提示。如果最初不通过显式的方式引用视图,这样做就可能要求重新编写查询。您可获得带有 noexpand 的查询的实际成本,并将之与不引用该视图的查询计划的实际成本相比较。如果两者的成本相近,那么您就可以认定用不用索引视图都不重要。
(3) 查询优化器不将查询与索引视图相匹配。重新检查视图和查询的定义,确保两者在结构上可相匹配。casts、converts 以及其他在逻辑上不会更改查询结果的表达式可能会阻止匹配。另外,表达式规范化和等价以及 sql server 执行的归入测试方面存在一些限制。可能无法显示某些等价表达式是相同的,或者逻辑上被其他表达式归入的表达式被真正归入,因此可能会错失匹配。
问:我每周更新一次数据仓库。索引视图使查询速度大大提升,却降低了每周更新的速度?该怎么办呢?
答:可以考虑在每周更新前丢弃索引视图,更新完后再重新创建。
问:我的视图存在重复项目,而我确实想对其进行维护。该怎么办呢?
答:可以考虑创建一个视图,按您所要的视图中的所有列和表达式进行分组,并添加一个 count_big(*) 列,然后在组合的列上创建一个唯一的聚集索引。分组过程可确保唯一性。虽然不是完全相同的视图,但可以满足您的需要。
问:我在一个视图上定义了另一个视图。sql server 不让我索引顶级视图。该怎么办呢?
答:可以考虑手动将嵌套视图的定义扩展到顶级视图,然后对其进行索引(索引最低层的视图,或者不索引该视图)。
问:为何一定要对索引视图定义 with schemabinding?
答:为了

使用 schemaname.objectname 明确识别视图所引用的所有对象,而不管是哪个用户访问该视图,同时

不会以导致视图定义非法或强制 sql server 在该视图上重新创建索引的方式,更改视图定义中所引用的对象。

问:为何不能在索引视图中使用 outer join?
答:当将数据插入基表时,行会在逻辑上从基于 outer join 的索引视图上消失。这会使执行 outer join 视图的增量更新变得相对复杂,而执行性能将比基于标准 (inner) join 的视图慢一些。
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表