当前位置:七道奇文章资讯数据防范MSSQL防范
日期:2011-05-02 15:20:00  来源:本站整理

SQL Server 索引构造及其利用(一)[MSSQL防范]

赞助商链接



  本文“SQL Server 索引构造及其利用(一)[MSSQL防范]”是由七道奇为您精心收集,来源于网络转载,文章版权归文章作者所有,本站不对其观点以及内容做任何评价,请读者自行判断,以下是其具体内容:

SQL Server索引构造及其利用(一)
SQL Server索引构造及其利用(二)
SQL Server索引构造及其利用(三)
SQL Server索引构造及其利用(四)

1、深化浅出理解索引构造

  实际上,您可以把索引理解为一种特别的目录.微软sql server供应了两种索引:堆积索引(clustered index,也称聚类索引、簇集索引)和非堆积索引(nonclustered index,也称非聚类索引、非簇集索引).下面,我们举例来阐明一下堆积索引和非堆积索引的辨别:
  其实,我们的汉语字典的正文本身就是一个堆积索引.比方,我们要查"安"字,就会很自然地翻开字典的前几页,因为"安"的拼音是"an",而按照拼音排序汉字的字典是以英文字母"a"开首并以"z"末尾的,那么"安"字就自然地排在字典的前部.假如您翻完了全部以"a"开首的部份仍旧找不到这个字,那么就阐明您的字典中没有这个字;一样的,假如查"张"字,那您也会将您的字典翻到最后部份,因为"张"的拼音是"zhang".也就是说,字典的正文部份本身就是一个目录,您不需求再去查其他目录来找到您需求找的内容.我们把这种正文内容本身就是一种按照一定法则布列的目录称为"堆积索引".
  假如您熟习某个字,您可以快速地从自动中查到这个字.但您也大概会碰到您不熟习的字,不知道它的发音,这时刻,您就不能按照方才的办法找到您要查的字,而需求去按照"偏旁部首"查到您要找的字,然后按照这个字后的页码直接翻到某页来找到您要找的字.但您结合"部首目录"和"检字表"而查到的字的排序并非真正的正文的排序办法,比方您查"张"字,我们可以看到在查部首之后的检字表中"张"的页码是672页,检字表中"张"的上面是"驰"字,但页码倒是63页,"张"的下面是"弩"字,页面是390页.很明显,这些字并非真正的辨别位于"张"字的上下方,目前您看到的持续的"驰、张、弩"三字实际上就是他们在非堆积索引中的排序,是字典正文中的字在非堆积索引中的映射.我们可以通过这种方法来找到您所需求的字,但它需求两个历程,先找到目录中的后果,然后再翻到您所需求的页码.我们把这种目录纯粹是目录,正文纯粹是正文的排序方法称为"非堆积索引".
  通过以上例子,我们可以理解到什么是"堆积索引"和"非堆积索引".进一步引伸一下,我们可以很简单的理解:每个表只能有一个堆积索引,因为目录只能按照一种办法举行排序.

2、什么时刻利用堆积索引或非堆积索引

下面的表总结了什么时刻利用堆积索引或非堆积索引(很重要):

行动描写 利用堆积索引 利用非堆积索引
列常常被分组排序 应 应
返回某范围内的数据 应 不该
一个或极少差别值 不该 不该
小数目的差别值 应 不该
大数目的差别值 不该 应
频繁更新的列 不该 应
外键列 应 应
主键列 应 应
频繁改正索引列 不该 应

  事实上,我们可以通过前面堆积索引和非堆积索引的定义的例子来理解上表.如:返回某范围内的数据一项.比方您的某个表有一个时间列,刚好您把聚合索引成立在了该列,这时您查询2004年1月1日至2004年10月1日之间的全部数据时,这个速度就将是很快的,因为您的这本字典正文是按日期举行排序的,聚类索引只需求找到要检索的全部数据中的开首和末尾数据便可;而不像非堆积索引,必须先查到目录中查到每一项数据对应的页码,然后再按照页码查到具体内容.

3、结合实际,谈索引利用的误区

  理论的目的是利用.固然我们方才列出了什么时刻应利用堆积索引或非堆积索引,但在实践中以上法则却很简单被轻忽或不能按照实际情形举行综合解析.下面我们将按照在实践中碰到的实际问题来谈一下索引利用的误区,以便于大家掌握索引成立的办法.

1、主键就是堆积索引
  这种设法笔者认为是极度错误的,是对堆积索引的一种浪费.固然SQL SERVER默许是在主键上成立堆积索引的.
  普通,我们会在每个表中都成立一个ID列,以辨别每条数据,并且这个ID列是自动增大的,步长普通为1.我们的这个办公自动化的实例中的列Gid就是如此.此时,假如我们将这个列设为主键,SQL SERVER会将此列默许为堆积索引.这样做有好处,就是可以让您的数据在数据库中按照ID举行物理排序,但笔者认为这样做意义不大.
  显而易见,堆积索引的上风是很明显的,而每个表中只能有一个堆积索引的法则,这使得堆积索引变得越发贵重.
  从我们前面谈到的堆积索引的定义我们可以看出,利用堆积索引的最大好处就是可以按照查询要求,疾速缩小查询范围,避免全表扫描.在实际利用中,因为ID号是自动生成的,我们并不知道每条记录的ID号,所以我们很难在实践顶用ID号来举行查询.这就使让ID号这个主键作为堆积索引成为一种资源浪费.其次,让每个ID号都差别的字段作为堆积索引也不符合"大数目的差别值情形下不该成立聚合索引"法则;当然,这种情形只是针对用户常常改正记录内容,分外是索引项的时刻会负作用,但关于查询速度并没有影响.
  在办公自动化系统中,无论是系统首页显示的需求用户签收的文件、会议还是用户举行文件查询等任何情形下举行数据查询都离不开字段的是"日期"还有效户本身的"用户名".
  普通,办公自动化的首页会显示每个用户还没有签收的文件或会议.固然我们的where语句可以仅仅限制当前用户还没有签收的情形,但假如您的系统已成立了很长时间,并且数据量很大,那么,每次每个用户翻开首页的时刻都举行一次全表扫描,这样做意义是不大的,绝大大都的用户1个月前的文件都已经浏览过了,这样做只能徒增数据库的开销罢了.事实上,我们完好可以让用户翻开系统首页时,数据库仅仅查询这个用户近3个月来未阅览的文件,通过"日期"这个字段来限制表扫描,提高查询速度.假如您的办公自动化系统已经成立的2年,那么您的首页显示速度理论上将是本来速度8倍,乃至更快.
  在这里之所以提到"理论上"三字,是因为假如您的堆积索引还是盲目地建在ID这个主键上时,您的查询速度是没有这么高的,即便您在"日期"这个字段上成立的索引(非聚合索引).下面我们就来看一下在1000万条数据量的情形下各种查询的速度表现(3个月内的数据为25万条):

(1)仅在主键上成立堆积索引,并且不划分时间段:

Select gid,fariqi,neibuyonghu,title from tgongwen
用时:128470毫秒(即:128秒)

(2)在主键上成立堆积索引,在fariq上成立非堆积索引:

select gid,fariqi,neibuyonghu,title from Tgongwen
where fariqi> dateadd(day,-90,getdate())
用时:53763毫秒(54秒)

(3)将聚合索引成立在日期列(fariqi)上:

select gid,fariqi,neibuyonghu,title from Tgongwen
where fariqi> dateadd(day,-90,getdate())
用时:2423毫秒(2秒)

  固然每条语句提取出来的都是25万条数据,各种情形的差别倒是宏大的,分外是将堆积索引成立在日期列时的差别.事实上,假如您的数据库真的有1000万容量的话,把主键成立在ID列上,就像以上的第1、2种情形,在网页上的表现就是超时,根本就无法显示.这也是我摒弃ID列作为堆积索引的一个最重要的因素.得出以上速度的办法是:在各个select语句前加:

declare @d datetime
set @d=getdate()
并在select语句后加:

select [语句履行耗费时间(毫秒)]=datediff(ms,@d,getdate())
2、只要成立索引就可以明显提高查询速度
  事实上,我们可以发现上面的例子中,第2、3条语句完好相同,且成立索引的字段也相同;差别的仅是前者在fariqi字段上成立的是非聚合索引,后者在此字段上成立的是聚合索引,但查询速度却有着大相径庭.所以,并非是在任何字段上简单地成立索引就可以提高查询速度.
  从建表的语句中,我们可以看到这个有着1000万数据的表中fariqi字段有5003个差别记录.在此字段上成立聚合索引是再符合不过了.在实际中,我们每天城市发几个文件,这几个文件的发文日期就相同,这完好符合成立堆积索引要求的:"既不能绝大大都都相同,又不能只有极少数相同"的法则.由此看来,我们成立"得当"的聚合索引关于我们提高查询速度是非常重要的.

3、把全部需求提高查询速度的字段都加进堆积索引,以提高查询速度
  上面已经谈到:在举行数据查询时都离不开字段的是"日期"还有效户本身的"用户名".既然这两个字段都是如此的重要,我们可以把他们归并起来,成立一个复合索引(compound index).
  很多人认为只要把任何字段加进堆积索引,就可以提高查询速度,也有人感到迷惑:假如把复合的堆积索引字段脱离查询,那么查询速度会减慢吗?带着这个问题,我们来看一下以下的查询速度(后果集都是25万条数据):(日期列fariqi首先排在复合堆积索引的起始列,用户名neibuyonghu排在后列):

(1)select gid,fariqi,neibuyonghu,title from Tgongwen where fariqi>''2004-5-5''
查询速度:2513毫秒

(2)select gid,fariqi,neibuyonghu,title from Tgongwen
            where fariqi>''2004-5-5'' and neibuyonghu=''办公室''
查询速度:2516毫秒

(3)select gid,fariqi,neibuyonghu,title from Tgongwen where neibuyonghu=''办公室''
查询速度:60280毫秒

  从以上试验中,我们可以看到假如仅用堆积索引的起始列作为查询条件和同时用到复合堆积索引的全部列的查询速度是几近一样的,乃至比用上全部的复合索引列还要略快(在查询后果集数目一样的情形下);而假如仅用复合堆积索引的非起始列作为查询条件的话,这个索引是不起任何作用的.当然,语句1、2的查询速度一样是因为查询的条目数一样,假如复合索引的全部列都用上,并且查询后果少的话,这样就会形成"索引覆盖",因而性能可以到达最优.同时,请记着:无论您能否常常利用聚合索引的其他列,但其前导列一定如果利用最频繁的列.

4、其他书上没有的索引利用经验总结

1、用聚合索引比用不是聚合索引的主键速度快
  下面是实例语句:(都是提取25万条数据)

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=''2004-9-16''
利用时间:3326毫秒

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where gid<=250000
利用时间:4470毫秒

这里,用聚合索引比用不是聚合索引的主键速度快了近1/4.

2、用聚合索引比用普通的主键作order by时速度快,分外是在小数据量情形下

select gid,fariqi,neibuyonghu,reader,title from Tgongwen order by fariqi
用时:12936

select gid,fariqi,neibuyonghu,reader,title from Tgongwen order by gid
用时:18843

  这里,用聚合索引比用普通的主键作order by时,速度快了3/10.事实上,假如数据量很小的话,用堆积索引作为排序列要比利用非堆积索引速度快得明显的多;而数据量假如很大的话,如10万以上,则二者的速度差别不明显.

3、利用聚合索引内的时间段,搜索时间会按数据占整个数据表的百分比成比例削减,而无论聚合索引利用了多少个:

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi>''2004-1-1''
用时:6343毫秒(提取100万条)

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi>''2004-6-6''
用时:3170毫秒(提取50万条)

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi=''2004-9-16''
用时:3326毫秒(和上句的后果一模一样.假如采集的数目一样,那么用大于号和等于号是一样的)

select gid,fariqi,neibuyonghu,reader,title from Tgongwen
            where fariqi>''2004-1-1'' and fariqi<''2004-6-6''
用时:3280毫秒

4、日期列不会因为有分秒的输入而减慢查询速度
  下面的例子中,共有100万条数据,2004年1月1日今后的数占据50万条,但只有两个差别的日期,日期切确到日;之前有数据50万条,有5000个差别的日期,日期切确到秒.

select gid,fariqi,neibuyonghu,reader,title from Tgongwen
          where fariqi>''2004-1-1'' order by fariqi
用时:6390毫秒

select gid,fariqi,neibuyonghu,reader,title from Tgongwen
            where fariqi<''2004-1-1'' order by fariqi
用时:6453毫秒

5、其他注意事项

  "水可载舟,亦可覆舟",索引也一样.索引有助于提高检干脆能,但过量或不当的索引也会招致系统低效.因为用户在表中每加进一个索引,数据库就要做更多的工作.过量的索引乃至会招致索引碎片.
  所以说,我们要成立一个"得当"的索引体系,分外是对聚合索引的成立,更应精益求精,以使您的数据库能得到高性能的施展.
  当然,在实践中,作为一个尽职的数据库管理员,您还要多测试一些筹划,找出哪类筹划效率最高、最为有效.

(待续...)   以上是“SQL Server 索引构造及其利用(一)[MSSQL防范]”的内容,如果你对以上该文章内容感兴趣,你可以看看七道奇为您推荐以下文章:

  • Windows 搭配 IIS7 PHP MySQL 环境
  • sqlserver索引的原理及索引成立的注意事项小结
  • SQL Join的一些总结(实例)
  • SQL的Join利用图解教程
  • SQL中JOIN和UNION辨别、用法及示例介绍
  • 关于SQL中CTE(公用表表达式)(Common Table Expression)的总结
  • mysql Out of memory (Needed 16777224 bytes)的错误办理
  • mysql提醒[Warning] Invalid (old?) table or database name问题的办理办法
  • mysql启用skip-name-resolve情势时呈现Warning的处理办法
  • mysql启用skip-name-resolve情势时呈现Warning的处理办法
  • MySQL Order By语法介绍
  • <b>MySQL ORDER BY 的实现解析</b>
  • 本文地址: 与您的QQ/BBS好友分享!
    • 好的评价 如果您觉得此文章好,就请您
        0%(0)
    • 差的评价 如果您觉得此文章差,就请您
        0%(0)

    文章评论评论内容只代表网友观点,与本站立场无关!

       评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论
    Copyright © 2020-2022 www.xiamiku.com. All Rights Reserved .