所在的位置: 数据库 >> 主要优点 >> .:索引篇

.:索引篇

你和你的团队经过不懈努力,终于使网站成功上线,刚开始时,注册用户较少,网站性能表现不错, 但随着注册用户的增多,访问速度开始变慢,一些用户开始发来邮件表示抗议,事情变得越来越糟,为了 留住用户,你开始着手调查访问变慢的原因。

经过紧张的调查,你发现问题出在数据库上,当应用程序尝试访问/更新数据时,数据库执行得相当慢 ,再次深入调查数据库后,你发现数据库表增长得很大,有些表甚至有上千万行数据,测试团队开始在生 产数据库上测试,发现订单提交过程需要花5分钟时间,但在网站上线前的测试中,提交一次订单只需要 2/3秒。

类似这种故事在世界各个角落每天都会上演,几乎每个开发人员在其开发生涯中都会遇到这种事情, 我也曾多次遇到这种情况,因此我希望将我解决这种问题的经验和大家分享。

如果你正身处这种项目,逃避不是办法,只有勇敢地去面对现实。首先,我认为你的应用程序中一定 没有写数据访问程序,我将在这个系列的文章中介绍如何编写最佳的数据访问程序,以及如何优化现有的 数据访问程序。

范围

在正式开始之前,有必要澄清一下本系列文章的写作边界,我想谈的是“事务性(OLTP)SQL Server数据库中的数据访问性能优化”,但文中介绍的这些技巧也可以用于其它数据库平台。

同时,我介绍的这些技巧主要是面向程序开发人员的,虽然DBA也是优化数据库的一支主要力量,但 DBA使用的优化方法不在我的讨论范围之内。

当一个基于数据库的应用程序运行起来很慢时,90%的可能都是由于数据访问程序的问题,要么是没有 优化,要么是没有按最佳方法编写代码,因此你需要审查和优化你的数据访问/处理程序。

我将会谈到10个步骤来优化数据访问程序,先从最基本的索引说起吧!

第一步:应用正确的索引

我之所以先从索引谈起是因为采用正确的索引会使生产系统的性能得到质的提升,另一个原因是创建 或修改索引是在数据库上进行的,不会涉及到修改程序,并可以立即见到成效。

我们还是温习一下索引的基础知识吧,我相信你已经知道什么是索引了,但我见到很多人都还不是很 明白,我先给大家将一个故事吧。

很久以前,在一个古城的的大图书馆中珍藏有成千上万本书籍,但书架上的书没有按任何顺序摆放, 因此每当有人询问某本书时,图书管理员只有挨个寻找,每一次都要花费大量的时间。

[这就好比数据表没有主键一样,搜索表中的数据时,数据库引擎必须进行全表扫描,效率极其低下。 ]

更糟的是图书馆的图书越来越多,图书管理员的工作变得异常痛苦,有一天来了一个聪明的小伙子, 他看到图书管理员的痛苦工作后,想出了一个办法,他建议将每本书都编上号,然后按编号放到书架上, 如果有人指定了图书编号,那么图书管理员很快就可以找到它的位置了。

[给图书编号就象给表创建主键一样,创建主键时,会创建聚集索引树,表中的所有行会在文件系统上 根据主键值进行物理排序,当查询表中任一行时,数据库首先使用聚集索引树找到对应的数据页(就象首 先找到书架一样),然后在数据页中根据主键键值找到目标行(就象找到书架上的书一样)。]

于是图书管理员开始给图书编号,然后根据编号将书放到书架上,为此他花了整整一天时间,但最后 经过测试,他发现找书的效率大大提高了。

[在一个表上只能创建一个聚集索引,就象书只能按一种规则摆放一样。]

但问题并未完全解决,因为很多人记不住书的编号,只记得书的名字,图书管理员无赖又只有扫描所 有的图书编号挨个寻找,但这次他只花了20分钟,以前未给图书编号时要花2-3小时,但与根据图书编号 查找图书相比,时间还是太长了,因此他向那个聪明的小伙子求助。

[这就好像你给Product表增加了主键ProductID,但除此之外没有建立其它索引,当使用Product Name 进行检索时,数据库引擎又只要进行全表扫描,逐个寻找了。]

聪明的小伙告诉图书管理员,之前已经创建好了图书编号,现在只需要再创建一个索引或目录,将图 书名称和对应的编号一起存储起来,但这一次是按图书名称进行排序,如果有人想找“Database Management System”一书,你只需要跳到“D”开头的目录,然后按照编号就可以找到 图书了。

于是图书管理员兴奋地花了几个小时创建了一个“图书名称”目录,经过测试,现在找一 本书的时间缩短到1分钟了(其中30秒用于从“图书名称”目录中查找编号,另外根据编号查找 图书用了30秒)。

图书管理员开始了新的思考,读者可能还会根据图书的其它属性来找书,如作者,于是他用同样的办 法为作者也创建了目录,现在可以根据图书编号,书名和作者在1分钟内查找任何图书了,图书管理员的 工作变得轻松了,故事也到此结束。

到此,我相信你已经完全理解了索引的真正含义。假设我们有一个Products表,创建了一个聚集索引( 根据表的主键自动创建的),我们还需要在ProductName列上创建一个非聚集索引,创建非聚集索引时,数 据库引擎会为非聚集索引自动创建一个索引树(就象故事中的“图书名称”目录一样),产品名 称会存储在索引页中,每个索引页包括一定范围的产品名称和它们对应的主键键值,当使用产品名称进行 检索时,数据库引擎首先会根据产品名称查找非聚集索引树查出主键键值,然后使用主键键值查找聚集索 引树找到最终的产品。

下图显示了一个索引树的结构

图 1 索引树结构

它叫做B+树(或平衡树),中间节点包含值的范围,指引SQL引擎应该在哪里去查找特定的索引值,叶子 节点包含真正的索引值,如果这是一个聚集索引树,叶子节点就是物理数据页,如果这是一个非聚集索引 树,叶子节点包含索引值和聚集索引键(数据库引擎使用它在聚集索引树中查找对应的行)。

通常,在索引树中查找目标值,然后跳到真实的行,这个过程是花不了什么时间的,因此索引一般会 提高数据检索速度。下面的步骤将有助于你正确应用索引。




转载请注明:http://www.xcqg58.com/zyyd/zyyd/14.html

  • 上一篇文章:
  •   
  • 下一篇文章: