日韩欧美人妻无码精品白浆,夜夜嗨AV免费入口,国产欧美官网在线看,高校回应聋哑女生因长相完美被质疑

LOGO OA教程 ERP教程 模切知識(shí)交流 PMS教程 CRM教程 開(kāi)發(fā)文檔 其他文檔  
 
網(wǎng)站管理員

十步優(yōu)化SQL Server中的數(shù)據(jù)訪問(wèn)

admin
2011年3月15日 0:25 本文熱度 3663
故事開(kāi)篇:你和你的團(tuán)隊(duì)經(jīng)過(guò)不懈努力,終于使網(wǎng)站成功上線,剛開(kāi)始時(shí),注冊(cè)用戶較少,網(wǎng)站性能表現(xiàn)不錯(cuò),但隨著注冊(cè)用戶的增多,訪問(wèn)速度開(kāi)始變慢,一些用戶開(kāi)始發(fā)來(lái)郵件表示抗議,事情變得越來(lái)越糟,為了留住用戶,你開(kāi)始著手調(diào)查訪問(wèn)變慢的原因。

  經(jīng)過(guò)緊張的調(diào)查,你發(fā)現(xiàn)問(wèn)題出在數(shù)據(jù)庫(kù)上,當(dāng)應(yīng)用程序嘗試訪問(wèn)/更新數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)執(zhí)行得相當(dāng)慢,再次深入調(diào)查數(shù)據(jù)庫(kù)后,你發(fā)現(xiàn)數(shù)據(jù)庫(kù)表增長(zhǎng)得很大,有些表甚至有上千萬(wàn)行數(shù)據(jù),測(cè)試團(tuán)隊(duì)開(kāi)始在生產(chǎn)數(shù)據(jù)庫(kù)上測(cè)試,發(fā)現(xiàn)訂單提交過(guò)程需要花5分鐘時(shí)間,但在網(wǎng)站上線前的測(cè)試中,提交一次訂單只需要2/3秒。


  類(lèi)似這種故事在世界各個(gè)角落每天都會(huì)上演,幾乎每個(gè)開(kāi)發(fā)人員在其開(kāi)發(fā)生涯中都會(huì)遇到這種事情,我也曾多次遇到這種情況,因此我希望將我解決這種問(wèn)題的經(jīng)驗(yàn)和大家分享。


  如果你正身處這種項(xiàng)目,逃避不是辦法,只有勇敢地去面對(duì)現(xiàn)實(shí)。首先,我認(rèn)為你的應(yīng)用程序中一定沒(méi)有寫(xiě)數(shù)據(jù)訪問(wèn)程序,我將在這個(gè)系列的文章中介紹如何編寫(xiě)最佳的數(shù)據(jù)訪問(wèn)程序,以及如何優(yōu)化現(xiàn)有的數(shù)據(jù)訪問(wèn)程序。


  范圍


  在正式開(kāi)始之前,有必要澄清一下本系列文章的寫(xiě)作邊界,我想談的是“事務(wù)性(OLTP)SQL Server數(shù)據(jù)庫(kù)中的數(shù)據(jù)訪問(wèn)性能優(yōu)化”,但文中介紹的這些技巧也可以用于其它數(shù)據(jù)庫(kù)平臺(tái)。


  同時(shí),我介紹的這些技巧主要是面向程序開(kāi)發(fā)人員的,雖然DBA也是優(yōu)化數(shù)據(jù)庫(kù)的一支主要力量,但DBA使用的優(yōu)化方法不在我的討論范圍之內(nèi)。


  當(dāng)一個(gè)基于數(shù)據(jù)庫(kù)的應(yīng)用程序運(yùn)行起來(lái)很慢時(shí),90%的可能都是由于數(shù)據(jù)訪問(wèn)程序的問(wèn)題,要么是沒(méi)有優(yōu)化,要么是沒(méi)有按最佳方法編寫(xiě)代碼,因此你需要審查和優(yōu)化你的數(shù)據(jù)訪問(wèn)/處理程序。


  我將會(huì)談到10個(gè)步驟來(lái)優(yōu)化數(shù)據(jù)訪問(wèn)程序,先從最基本的索引說(shuō)起吧!


  第一步:應(yīng)用正確的索引


  我之所以先從索引談起是因?yàn)椴捎谜_的索引會(huì)使生產(chǎn)系統(tǒng)的性能得到質(zhì)的提升,另一個(gè)原因是創(chuàng)建或修改索引是在數(shù)據(jù)庫(kù)上進(jìn)行的,不會(huì)涉及到修改程序,并可以立即見(jiàn)到成效。


  我們還是溫習(xí)一下索引的基礎(chǔ)知識(shí)吧,我相信你已經(jīng)知道什么是索引了,但我見(jiàn)到很多人都還不是很明白,我先給大家將一個(gè)故事吧。


  很久以前,在一個(gè)古城的的大圖書(shū)館中珍藏有成千上萬(wàn)本書(shū)籍,但書(shū)架上的書(shū)沒(méi)有按任何順序擺放,因此每當(dāng)有人詢問(wèn)某本書(shū)時(shí),圖書(shū)管理員只有挨個(gè)尋找,每一次都要花費(fèi)大量的時(shí)間。


  [這就好比數(shù)據(jù)表沒(méi)有主鍵一樣,搜索表中的數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)引擎必須進(jìn)行全表掃描,效率極其低下。]


  更糟的是圖書(shū)館的圖書(shū)越來(lái)越多,圖書(shū)管理員的工作變得異常痛苦,有一天來(lái)了一個(gè)聰明的小伙子,他看到圖書(shū)管理員的痛苦工作后,想出了一個(gè)辦法,他建議將每本書(shū)都編上號(hào),然后按編號(hào)放到書(shū)架上,如果有人指定了圖書(shū)編號(hào),那么圖書(shū)管理員很快就可以找到它的位置了。


  [給圖書(shū)編號(hào)就象給表創(chuàng)建主鍵一樣,創(chuàng)建主鍵時(shí),會(huì)創(chuàng)建聚集索引樹(shù),表中的所有行會(huì)在文件系統(tǒng)上根據(jù)主鍵值進(jìn)行物理排序,當(dāng)查詢表中任一行時(shí),數(shù)據(jù)庫(kù)首先使用聚集索引樹(shù)找到對(duì)應(yīng)的數(shù)據(jù)頁(yè)(就象首先找到書(shū)架一樣),然后在數(shù)據(jù)頁(yè)中根據(jù)主鍵鍵值找到目標(biāo)行(就象找到書(shū)架上的書(shū)一樣)。]


  于是圖書(shū)管理員開(kāi)始給圖書(shū)編號(hào),然后根據(jù)編號(hào)將書(shū)放到書(shū)架上,為此他花了整整一天時(shí)間,但最后經(jīng)過(guò)測(cè)試,他發(fā)現(xiàn)找書(shū)的效率大大提高了。


  [在一個(gè)表上只能創(chuàng)建一個(gè)聚集索引,就象書(shū)只能按一種規(guī)則擺放一樣。]


  但問(wèn)題并未完全解決,因?yàn)楹芏嗳擞洸蛔?shū)的編號(hào),只記得書(shū)的名字,圖書(shū)管理員無(wú)賴又只有掃描所有的圖書(shū)編號(hào)挨個(gè)尋找,但這次他只花了20分鐘,以前未給圖書(shū)編號(hào)時(shí)要花2-3小時(shí),但與根據(jù)圖書(shū)編號(hào)查找圖書(shū)相比,時(shí)間還是太長(zhǎng)了,因此他向那個(gè)聰明的小伙子求助。


  [這就好像你給Product表增加了主鍵ProductID,但除此之外沒(méi)有建立其它索引,當(dāng)使用Product Name進(jìn)行檢索時(shí),數(shù)據(jù)庫(kù)引擎又只要進(jìn)行全表掃描,逐個(gè)尋找了。]


  聰明的小伙告訴圖書(shū)管理員,之前已經(jīng)創(chuàng)建好了圖書(shū)編號(hào),現(xiàn)在只需要再創(chuàng)建一個(gè)索引或目錄,將圖書(shū)名稱和對(duì)應(yīng)的編號(hào)一起存儲(chǔ)起來(lái),但這一次是按圖書(shū)名稱進(jìn)行排序,如果有人想找“Database Management System”一書(shū),你只需要跳到“D”開(kāi)頭的目錄,然后按照編號(hào)就可以找到圖書(shū)了。


  于是圖書(shū)管理員興奮地花了幾個(gè)小時(shí)創(chuàng)建了一個(gè)“圖書(shū)名稱”目錄,經(jīng)過(guò)測(cè)試,現(xiàn)在找一本書(shū)的時(shí)間縮短到1分鐘了(其中30秒用于從“圖書(shū)名稱”目錄中查找編號(hào),另外根據(jù)編號(hào)查找圖書(shū)用了30秒)。


  圖書(shū)管理員開(kāi)始了新的思考,讀者可能還會(huì)根據(jù)圖書(shū)的其它屬性來(lái)找書(shū),如作者,于是他用同樣的辦法為作者也創(chuàng)建了目錄,現(xiàn)在可以根據(jù)圖書(shū)編號(hào),書(shū)名和作者在1分鐘內(nèi)查找任何圖書(shū)了,圖書(shū)管理員的工作變得輕松了,故事也到此結(jié)束。


  到此,我相信你已經(jīng)完全理解了索引的真正含義。假設(shè)我們有一個(gè)Products表,創(chuàng)建了一個(gè)聚集索引(根據(jù)表的主鍵自動(dòng)創(chuàng)建的),我們還需要在ProductName列上創(chuàng)建一個(gè)非聚集索引,創(chuàng)建非聚集索引時(shí),數(shù)據(jù)庫(kù)引擎會(huì)為非聚集索引自動(dòng)創(chuàng)建一個(gè)索引樹(shù)(就象故事中的“圖書(shū)名稱”目錄一樣),產(chǎn)品名稱會(huì)存儲(chǔ)在索引頁(yè)中,每個(gè)索引頁(yè)包括一定范圍的產(chǎn)品名稱和它們對(duì)應(yīng)的主鍵鍵值,當(dāng)使用產(chǎn)品名稱進(jìn)行檢索時(shí),數(shù)據(jù)庫(kù)引擎首先會(huì)根據(jù)產(chǎn)品名稱查找非聚集索引樹(shù)查出主鍵鍵值,然后使用主鍵鍵值查找聚集索引樹(shù)找到最終的產(chǎn)品。


  下圖顯示了一個(gè)索引樹(shù)的結(jié)構(gòu)



  圖 1 索引樹(shù)結(jié)構(gòu)


  它叫做B+樹(shù)(或平衡樹(shù)),中間節(jié)點(diǎn)包含值的范圍,指引SQL引擎應(yīng)該在哪里去查找特定的索引值,葉子節(jié)點(diǎn)包含真正的索引值,如果這是一個(gè)聚集索引樹(shù),葉子節(jié)點(diǎn)就是物理數(shù)據(jù)頁(yè),如果這是一個(gè)非聚集索引樹(shù),葉子節(jié)點(diǎn)包含索引值和聚集索引鍵(數(shù)據(jù)庫(kù)引擎使用它在聚集索引樹(shù)中查找對(duì)應(yīng)的行)。


  通常,在索引樹(shù)中查找目標(biāo)值,然后跳到真實(shí)的行,這個(gè)過(guò)程是花不了什么時(shí)間的,因此索引一般會(huì)提高數(shù)據(jù)檢索速度。下面的步驟將有助于你正確應(yīng)用索引。


  確保每個(gè)表都有主鍵


  這樣可以確保每個(gè)表都有聚集索引(表在磁盤(pán)上的物理存儲(chǔ)是按照主鍵順序排列的),使用主鍵檢索表中的數(shù)據(jù),或在主鍵字段上進(jìn)行排序,或在where子句中指定任意范圍的主鍵鍵值時(shí),其速度都是非??斓?。


  在下面這些列上創(chuàng)建非聚集索引:


  1)搜索時(shí)經(jīng)常使用到的;


  2)用于連接其它表的;


  3)用于外鍵字段的;


  4)高選中性的;


  5)ORDER BY子句使用到的;


  6)XML類(lèi)型。


  下面是一個(gè)創(chuàng)建索引的例子: 



CREATE INDEX

  NCLIX_OrderDetails_ProductID
ON

  dbo.OrderDetails(ProductID)

  也可以使用SQL Server管理工作臺(tái)在表上創(chuàng)建索引,如圖2所示。



  圖 2 使用SQL Server管理工作臺(tái)創(chuàng)建索引
 



  第二步:創(chuàng)建適當(dāng)?shù)母采w索引


  假設(shè)你在Sales表(SelesID,SalesDate,SalesPersonID,ProductID,Qty)的外鍵列(ProductID)上創(chuàng)建了一個(gè)索引,假設(shè)ProductID列是一個(gè)高選中性列,那么任何在where子句中使用索引列(ProductID)的select查詢都會(huì)更快,如果在外鍵上沒(méi)有創(chuàng)建索引,將會(huì)發(fā)生全部掃描,但還有辦法可以進(jìn)一步提升查詢性能。


  假設(shè)Sales表有10,000行記錄,下面的SQL語(yǔ)句選中400行(總行數(shù)的4%): 



SELECT SalesDate, SalesPersonID FROM Sales WHERE ProductID = 112

  我們來(lái)看看這條SQL語(yǔ)句在SQL執(zhí)行引擎中是如何執(zhí)行的:


  1)Sales表在ProductID列上有一個(gè)非聚集索引,因此它查找非聚集索引樹(shù)找出ProductID=112的記錄;


  2)包含ProductID = 112記錄的索引頁(yè)也包括所有的聚集索引鍵(所有的主鍵鍵值,即SalesID);


  3)針對(duì)每一個(gè)主鍵(這里是400),SQL Server引擎查找聚集索引樹(shù)找出真實(shí)的行在對(duì)應(yīng)頁(yè)面中的位置;


  SQL Server引擎從對(duì)應(yīng)的行查找SalesDate和SalesPersonID列的值。


  在上面的步驟中,對(duì)ProductID = 112的每個(gè)主鍵記錄(這里是400),SQL Server引擎要搜索400次聚集索引樹(shù)以檢索查詢中指定的其它列(SalesDate,SalesPersonID)。


  如果非聚集索引頁(yè)中包括了聚集索引鍵和其它兩列(SalesDate,,SalesPersonID)的值,SQL Server引擎可能不會(huì)執(zhí)行上面的第3和4步,直接從非聚集索引樹(shù)查找ProductID列速度還會(huì)快一些,直接從索引頁(yè)讀取這三列的數(shù)值。


  幸運(yùn)的是,有一種方法實(shí)現(xiàn)了這個(gè)功能,它被稱為“覆蓋索引”,在表列上創(chuàng)建覆蓋索引時(shí),需要指定哪些額外的列值需要和聚集索引鍵值(主鍵)一起存儲(chǔ)在索引頁(yè)中。下面是在Sales 表ProductID列上創(chuàng)建覆蓋索引的例子: 



CREATE INDEX NCLIX_Sales_ProductID--Index name

  
ON dbo.Sales(ProductID)--Column on which index is to be created

  INCLUDE(SalesDate, SalesPersonID)
--Additional column values to include

  應(yīng)該在那些select查詢中常使用到的列上創(chuàng)建覆蓋索引,但覆蓋索引中包括過(guò)多的列也不行,因?yàn)楦采w索引列的值是存儲(chǔ)在內(nèi)存中的,這樣會(huì)消耗過(guò)多內(nèi)存,引發(fā)性能下降。


  創(chuàng)建覆蓋索引時(shí)使用數(shù)據(jù)庫(kù)調(diào)整顧問(wèn)


  我們知道,當(dāng)SQL出問(wèn)題時(shí),SQL Server引擎中的優(yōu)化器根據(jù)下列因素自動(dòng)生成不同的查詢計(jì)劃:


  1)數(shù)據(jù)量


  2)統(tǒng)計(jì)數(shù)據(jù)


  3)索引變化


  4)TSQL中的參數(shù)值


  5)服務(wù)器負(fù)載


  這就意味著,對(duì)于特定的SQL,即使表和索引結(jié)構(gòu)是一樣的,但在生產(chǎn)服務(wù)器和在測(cè)試服務(wù)器上產(chǎn)生的執(zhí)行計(jì)劃可能會(huì)不一樣,這也意味著在測(cè)試服務(wù)器上創(chuàng)建的索引可以提高應(yīng)用程序的性能,但在生產(chǎn)服務(wù)器上創(chuàng)建同樣的索引卻未必會(huì)提高應(yīng)用程序的性能。因?yàn)闇y(cè)試環(huán)境中的執(zhí)行計(jì)劃利用了新創(chuàng)建的索引,但在生產(chǎn)環(huán)境中執(zhí)行計(jì)劃可能不會(huì)利用新創(chuàng)建的索引(例如,一個(gè)非聚集索引列在生產(chǎn)環(huán)境中不是一個(gè)高選中性列,但在測(cè)試環(huán)境中可能就不一樣)。


  因此我們?cè)趧?chuàng)建索引時(shí),要知道執(zhí)行計(jì)劃是否會(huì)真正利用它,但我們?cè)趺床拍苤滥?答案就是在測(cè)試服務(wù)器上模擬生產(chǎn)環(huán)境負(fù)載,然后創(chuàng)建合適的索引并進(jìn)行測(cè)試,如果這樣測(cè)試發(fā)現(xiàn)索引可以提高性能,那么它在生產(chǎn)環(huán)境也就更可能提高應(yīng)用程序的性能了。


  雖然要模擬一個(gè)真實(shí)的負(fù)載比較困難,但目前已經(jīng)有很多工具可以幫助我們。


  使用SQL profiler跟蹤生產(chǎn)服務(wù)器,盡管不建議在生產(chǎn)環(huán)境中使用SQL profiler,但有時(shí)沒(méi)有辦法,要診斷性能問(wèn)題關(guān)鍵所在,必須得用,在http://msdn.microsoft.com/en-us/library/ms181091.aspx有SQL profiler的使用方法。


  使用SQL profiler創(chuàng)建的跟蹤文件,在測(cè)試服務(wù)器上利用數(shù)據(jù)庫(kù)調(diào)整顧問(wèn)創(chuàng)建一個(gè)類(lèi)似的負(fù)載,大多數(shù)時(shí)候,調(diào)整顧問(wèn)會(huì)給出一些可以立即使用的索引建議,在http://msdn.microsoft.com/en-us/library/ms166575.aspx有調(diào)整顧問(wèn)的詳細(xì)介紹。



  第三步:整理索引碎片


  你可能已經(jīng)創(chuàng)建好了索引,并且所有索引都在工作,但性能卻仍然不好,那很可能是產(chǎn)生了索引碎片,你需要進(jìn)行索引碎片整理。


  什么是索引碎片?


  由于表上有過(guò)度地插入、修改和刪除操作,索引頁(yè)被分成多塊就形成了索引碎片,如果索引碎片嚴(yán)重,那掃描索引的時(shí)間就會(huì)變長(zhǎng),甚至導(dǎo)致索引不可用,因此數(shù)據(jù)檢索操作就慢下來(lái)了。


  有兩種類(lèi)型的索引碎片:內(nèi)部碎片和外部碎片。


  內(nèi)部碎片:為了有效的利用內(nèi)存,使內(nèi)存產(chǎn)生更少的碎片,要對(duì)內(nèi)存分頁(yè),內(nèi)存以頁(yè)為單位來(lái)使用,最后一頁(yè)往往裝不滿,于是形成了內(nèi)部碎片。


  外部碎片:為了共享要分段,在段的換入換出時(shí)形成外部碎片,比如5K的段換出后,有一個(gè)4k的段進(jìn)來(lái)放到原來(lái)5k的地方,于是形成1k的外部碎片。


  如何知道是否發(fā)生了索引碎片?


  執(zhí)行下面的SQL語(yǔ)句就知道了(下面的語(yǔ)句可以在SQL Server 2005及后續(xù)版本中運(yùn)行,用你的數(shù)據(jù)庫(kù)名替換掉這里的AdventureWorks):



 SELECT object_name(dt.object_id) Tablename,si.name

  IndexName,dt.avg_fragmentation_in_percent
AS

  ExternalFragmentation,dt.avg_page_space_used_in_percent
AS

  InternalFragmentation

  
FROM

  (

  
SELECT object_id,index_id,avg_fragmentation_in_percent,avg_page_space_used_in_percent

  
FROM sys.dm_db_index_physical_stats (db_id('AdventureWorks'),null,null,null,'DETAILED'

  )

  
WHERE index_id <> 0) AS dt INNER JOIN sys.indexes si ON si.object_id=dt.object_id

  
AND si.index_id=dt.index_id AND dt.avg_fragmentation_in_percent>10

  
AND dt.avg_page_space_used_in_percent<75 ORDER BY avg_fragmentation_in_percent DESC

  執(zhí)行后顯示AdventureWorks數(shù)據(jù)庫(kù)的索引碎片信息。



  圖 3 索引碎片信息


  使用下面的規(guī)則分析結(jié)果,你就可以找出哪里發(fā)生了索引碎片:


  1)ExternalFragmentation的值>10表示對(duì)應(yīng)的索引發(fā)生了外部碎片;


  2)InternalFragmentation的值<75表示對(duì)應(yīng)的索引發(fā)生了內(nèi)部碎片。


  如何整理索引碎片?


  有兩種整理索引碎片的方法:


  1)重組有碎片的索引:執(zhí)行下面的命令


  ALTER INDEX ALL ON TableName REORGANIZE


  2)重建索引:執(zhí)行下面的命令


  ALTER INDEX ALL ON TableName REBUILD WITH (FILLFACTOR=90,ONLINE=ON)


  也可以使用索引名代替這里的“ALL”關(guān)鍵字重組或重建單個(gè)索引,也可以使用SQL Server管理工作臺(tái)進(jìn)行索引碎片的整理。



  圖 4 使用SQL Server管理工作臺(tái)整理索引碎片


  什么時(shí)候用重組,什么時(shí)候用重建呢?


  當(dāng)對(duì)應(yīng)索引的外部碎片值介于10-15之間,內(nèi)部碎片值介于60-75之間時(shí)使用重組,其它情況就應(yīng)該使用重建。


  值得注意的是重建索引時(shí),索引對(duì)應(yīng)的表會(huì)被鎖定,但重組不會(huì)鎖表,因此在生產(chǎn)系統(tǒng)中,對(duì)大表重建索引要慎重,因?yàn)樵诖蟊砩蟿?chuàng)建索引可能會(huì)花幾個(gè)小時(shí),幸運(yùn)的是,從SQL Server 2005開(kāi)始,微軟提出了一個(gè)解決辦法,在重建索引時(shí),將ONLINE選項(xiàng)設(shè)置為ON,這樣可以保證重建索引時(shí)表仍然可以正常使用。


  雖然索引可以提高查詢速度,但如果你的數(shù)據(jù)庫(kù)是一個(gè)事務(wù)型數(shù)據(jù)庫(kù),大多數(shù)時(shí)候都是更新操作,更新數(shù)據(jù)也就意味著要更新索引,這個(gè)時(shí)候就要兼顧查詢和更新操作了,因?yàn)樵贠LTP數(shù)據(jù)庫(kù)表上創(chuàng)建過(guò)多的索引會(huì)降低整體數(shù)據(jù)庫(kù)性能。


  我給大家一個(gè)建議:如果你的數(shù)據(jù)庫(kù)是事務(wù)型的,平均每個(gè)表上不能超過(guò)5個(gè)索引,如果你的數(shù)據(jù)庫(kù)是數(shù)據(jù)倉(cāng)庫(kù)型,平均每個(gè)表可以創(chuàng)建10個(gè)索引都沒(méi)問(wèn)題。



  在前面我們介紹了如何正確使用索引,調(diào)整索引是見(jiàn)效最快的性能調(diào)優(yōu)方法,但一般而言,調(diào)整索引只會(huì)提高查詢性能。除此之外,我們還可以調(diào)整數(shù)據(jù)訪問(wèn)代碼和TSQL,本文就介紹如何以最優(yōu)的方法重構(gòu)數(shù)據(jù)訪問(wèn)代碼和TSQL。


  第四步:將TSQL代碼從應(yīng)用程序遷移到數(shù)據(jù)庫(kù)中


  也許你不喜歡我的這個(gè)建議,你或你的團(tuán)隊(duì)可能已經(jīng)有一個(gè)默認(rèn)的潛規(guī)則,那就是使用ORM(Object Relational Mapping,即對(duì)象關(guān)系映射)生成所有SQL,并將SQL放在應(yīng)用程序中,但如果你要優(yōu)化數(shù)據(jù)訪問(wèn)性能,或需要調(diào)試應(yīng)用程序性能問(wèn)題,我建議你將SQL代碼移植到數(shù)據(jù)庫(kù)上(使用存儲(chǔ)過(guò)程,視圖,函數(shù)和觸發(fā)器),原因如下:


  1、使用存儲(chǔ)過(guò)程,視圖,函數(shù)和觸發(fā)器實(shí)現(xiàn)應(yīng)用程序中SQL代碼的功能有助于減少應(yīng)用程序中SQL復(fù)制的弊端,因?yàn)楝F(xiàn)在只在一個(gè)地方集中處理SQL,為以后的代碼復(fù)用打下了良好的基礎(chǔ)。


  2、使用數(shù)據(jù)庫(kù)對(duì)象實(shí)現(xiàn)所有的TSQL有助于分析TSQL的性能問(wèn)題,同時(shí)有助于你集中管理TSQL代碼。


  3、將TS QL移植到數(shù)據(jù)庫(kù)上去后,可以更好地重構(gòu)TSQL代碼,以利用數(shù)據(jù)庫(kù)的高級(jí)索引特性。此外,應(yīng)用程序中沒(méi)了SQL代碼也將更加簡(jiǎn)潔。


  雖然這一步可能不會(huì)象前三步那樣立竿見(jiàn)影,但做這一步的主要目的是為后面的優(yōu)化步驟打下基礎(chǔ)。如果在你的應(yīng)用程序中使用ORM(如NHibernate)實(shí)現(xiàn)了數(shù)據(jù)訪問(wèn)例行程序,在測(cè)試或開(kāi)發(fā)環(huán)境中你可能發(fā)現(xiàn)它們工作得很好,但在生產(chǎn)數(shù)據(jù)庫(kù)上卻可能遇到問(wèn)題,這時(shí)你可能需要反思基于ORM的數(shù)據(jù)訪問(wèn)邏輯,利用TSQL對(duì)象實(shí)現(xiàn)數(shù)據(jù)訪問(wèn)例行程序是一種好辦法,這樣做有更多的機(jī)會(huì)從數(shù)據(jù)庫(kù)角度來(lái)優(yōu)化性能。


  我向你保證,如果你花1-2人月來(lái)完成遷移,那以后肯定不止節(jié)約1-2人年的的成本。


  OK!假設(shè)你已經(jīng)照我的做的了,完全將TSQL遷移到數(shù)據(jù)庫(kù)上去了,下面就進(jìn)入正題吧!



  第五步:識(shí)別低效TSQL,采用最佳實(shí)踐重構(gòu)和應(yīng)用TSQL


  由于每個(gè)程序員的能力和習(xí)慣都不一樣,他們編寫(xiě)的TSQL可能風(fēng)格各異,部分代碼可能不是最佳實(shí)現(xiàn),對(duì)于水平一般的程序員可能首先想到的是編寫(xiě)TSQL實(shí)現(xiàn)需求,至于性能問(wèn)題日后再說(shuō),因此在開(kāi)發(fā)和測(cè)試時(shí)可能發(fā)現(xiàn)不了問(wèn)題。


  也有一些人知道最佳實(shí)踐,但在編寫(xiě)代碼時(shí)由于種種原因沒(méi)有采用最佳實(shí)踐,等到用戶發(fā)飆的那天才乖乖地重新埋頭思考最佳實(shí)踐。


  我覺(jué)得還是有必要介紹一下具有都有哪些最佳實(shí)踐。


  1、在查詢中不要使用“select *”


  (1)檢索不必要的列會(huì)帶來(lái)額外的系統(tǒng)開(kāi)銷(xiāo),有句話叫做“該省的則省”;


  (2)數(shù)據(jù)庫(kù)不能利用“覆蓋索引”的優(yōu)點(diǎn),因此查詢緩慢。


  2、在select清單中避免不必要的列,在連接條件中避免不必要的表


  (1)在select查詢中如有不必要的列,會(huì)帶來(lái)額外的系統(tǒng)開(kāi)銷(xiāo),特別是LOB類(lèi)型的列;


  (2)在連接條件中包含不必要的表會(huì)強(qiáng)制數(shù)據(jù)庫(kù)引擎檢索和匹配不需要的數(shù)據(jù),增加了查詢執(zhí)行時(shí)間。


  3、不要在子查詢中使用count()求和執(zhí)行存在性檢查


  (1)不要使用



SELECT column_list FROM table WHERE 0 < (SELECT count(*) FROM table2 WHERE ..)

  使用



SELECT column_list FROM table WHERE EXISTS (SELECT * FROM table2 WHERE ...)

  代替;


  (2)當(dāng)你使用count()時(shí),SQL Server不知道你要做的是存在性檢查,它會(huì)計(jì)算所有匹配的值,要么會(huì)執(zhí)行全表掃描,要么會(huì)掃描最小的非聚集索引;


  (3)當(dāng)你使用EXISTS時(shí),SQL Server知道你要執(zhí)行存在性檢查,當(dāng)它發(fā)現(xiàn)第一個(gè)匹配的值時(shí),就會(huì)返回TRUE,并停止查詢。類(lèi)似的應(yīng)用還有使用IN或ANY代替count()。


  4、避免使用兩個(gè)不同類(lèi)型的列進(jìn)行表的連接


  (1)當(dāng)連接兩個(gè)不同類(lèi)型的列時(shí),其中一個(gè)列必須轉(zhuǎn)換成另一個(gè)列的類(lèi)型,級(jí)別低的會(huì)被轉(zhuǎn)換成高級(jí)別的類(lèi)型,轉(zhuǎn)換操作會(huì)消耗一定的系統(tǒng)資源;


  (2)如果你使用兩個(gè)不同類(lèi)型的列來(lái)連接表,其中一個(gè)列原本可以使用索引,但經(jīng)過(guò)轉(zhuǎn)換后,優(yōu)化器就不會(huì)使用它的索引了。例如: 



SELECT column_list FROM small_table, large_table WHERE

  smalltable.float_column
= large_table.int_column

  在這個(gè)例子中,SQL Server會(huì)將int列轉(zhuǎn)換為float類(lèi)型,因?yàn)閕nt比f(wàn)loat類(lèi)型的級(jí)別低,large_table.int_column上的索引就不會(huì)被使用,但smalltable.float_column上的索引可以正常使用。


  5、避免死鎖


  (1)在你的存儲(chǔ)過(guò)程和觸發(fā)器中訪問(wèn)同一個(gè)表時(shí)總是以相同的順序;


  (2)事務(wù)應(yīng)經(jīng)可能地縮短,在一個(gè)事務(wù)中應(yīng)盡可能減少涉及到的數(shù)據(jù)量;


  (3)永遠(yuǎn)不要在事務(wù)中等待用戶輸入。


  6、使用“基于規(guī)則的方法”而不是使用“程序化方法”編寫(xiě)TSQL


  (1)數(shù)據(jù)庫(kù)引擎專(zhuān)門(mén)為基于規(guī)則的SQL進(jìn)行了優(yōu)化,因此處理大型結(jié)果集時(shí)應(yīng)盡量避免使用程序化的方法(使用游標(biāo)或UDF[User Defined Functions]處理返回的結(jié)果集) ;


  (2)如何擺脫程序化的SQL呢?有以下方法:


  - 使用內(nèi)聯(lián)子查詢替換用戶定義函數(shù);


  - 使用相關(guān)聯(lián)的子查詢替換基于游標(biāo)的代碼;


  - 如果確實(shí)需要程序化代碼,至少應(yīng)該使用表變量代替游標(biāo)導(dǎo)航和處理結(jié)果集。



  7、避免使用count(*)獲得表的記錄數(shù)


  (1)為了獲得表中的記錄數(shù),我們通常使用下面的SQL語(yǔ)句:



 SELECT COUNT(*) FROM dbo.orders

  這條語(yǔ)句會(huì)執(zhí)行全表掃描才能獲得行數(shù)。


  (2)但下面的SQL語(yǔ)句不會(huì)執(zhí)行全表掃描一樣可以獲得行數(shù):



SELECT rows FROM sysindexes

  
WHERE id = OBJECT_ID('dbo.Orders') AND indid < 2

  8、避免使用動(dòng)態(tài)SQL


  除非迫不得已,應(yīng)盡量避免使用動(dòng)態(tài)SQL,因?yàn)椋?/P>

  (1)動(dòng)態(tài)SQL難以調(diào)試和故障診斷;


  (2)如果用戶向動(dòng)態(tài)SQL提供了輸入,那么可能存在SQL注入風(fēng)險(xiǎn)。


  9、避免使用臨時(shí)表


  (1)除非卻有需要,否則應(yīng)盡量避免使用臨時(shí)表,相反,可以使用表變量代替;


  (2)大多數(shù)時(shí)候(99%),表變量駐扎在內(nèi)存中,因此速度比臨時(shí)表更快,臨時(shí)表駐扎在TempDb數(shù)據(jù)庫(kù)中,因此臨時(shí)表上的操作需要跨數(shù)據(jù)庫(kù)通信,速度自然慢。


  10、使用全文搜索搜索文本數(shù)據(jù),取代like搜索


  全文搜索始終優(yōu)于like搜索:


  (1)全文搜索讓你可以實(shí)現(xiàn)like不能完成的復(fù)雜搜索,如搜索一個(gè)單詞或一個(gè)短語(yǔ),搜索一個(gè)與另一個(gè)單詞或短語(yǔ)相近的單詞或短語(yǔ),或者是搜索同義詞;


  (2)實(shí)現(xiàn)全文搜索比實(shí)現(xiàn)like搜索更容易(特別是復(fù)雜的搜索);


  11、使用union實(shí)現(xiàn)or操作


  (1)在查詢中盡量不要使用or,使用union合并兩個(gè)不同的查詢結(jié)果集,這樣查詢性能會(huì)更好;


  (2)如果不是必須要不同的結(jié)果集,使用union all效果會(huì)更好,因?yàn)樗粫?huì)對(duì)結(jié)果集排序。


  12、為大對(duì)象使用延遲加載策略


  (1)在不同的表中存儲(chǔ)大對(duì)象(如VARCHAR(MAX),Image,Text等),然后在主表中存儲(chǔ)這些大對(duì)象的引用;


  (2)在查詢中檢索所有主表數(shù)據(jù),如果需要載入大對(duì)象,按需從大對(duì)象表中檢索大對(duì)象。


  13、使用VARCHAR(MAX),VARBINARY(MAX) 和 NVARCHAR(MAX)


  (1)在SQL Server 2000中,一行的大小不能超過(guò)800字節(jié),這是受SQL Server內(nèi)部頁(yè)面大小8KB的限制造成的,為了在單列中存儲(chǔ)更多的數(shù)據(jù),你需要使用TEXT,NTEXT或IMAGE數(shù)據(jù)類(lèi)型(BLOB);


  (2)這些和存儲(chǔ)在相同表中的其它數(shù)據(jù)不一樣,這些頁(yè)面以B-Tree結(jié)構(gòu)排列,這些數(shù)據(jù)不能作為存儲(chǔ)過(guò)程或函數(shù)中的變量,也不能用于字符串函數(shù),如REPLACE,CHARINDEX或SUBSTRING,大多數(shù)時(shí)候你必須使用READTEXT,WRITETEXT和UPDATETEXT;


  (3)為了解決這個(gè)問(wèn)題,在SQL Server 2005中增加了VARCHAR(MAX),VARBINARY(MAX) 和 NVARCHAR(MAX),這些數(shù)據(jù)類(lèi)型可以容納和BLOB相同數(shù)量的數(shù)據(jù)(2GB),和其它數(shù)據(jù)類(lèi)型使用相同的數(shù)據(jù)頁(yè);


  (4)當(dāng)MAX數(shù)據(jù)類(lèi)型中的數(shù)據(jù)超過(guò)8KB時(shí),使用溢出頁(yè)(在ROW_OVERFLOW分配單元中)指向源數(shù)據(jù)頁(yè),源數(shù)據(jù)頁(yè)仍然在IN_ROW分配單元中。


  14、在用戶定義函數(shù)中使用下列最佳實(shí)踐


  不要在你的存儲(chǔ)過(guò)程,觸發(fā)器,函數(shù)和批處理中重復(fù)調(diào)用函數(shù),例如,在許多時(shí)候,你需要獲得字符串變量的長(zhǎng)度,無(wú)論如何都不要重復(fù)調(diào)用LEN函數(shù),只調(diào)用一次即可,將結(jié)果存儲(chǔ)在一個(gè)變量中,以后就可以直接使用了。
 



  15、在存儲(chǔ)過(guò)程中使用下列最佳實(shí)踐


  (1)不要使用SP_xxx作為命名約定,它會(huì)導(dǎo)致額外的搜索,增加I/O(因?yàn)橄到y(tǒng)存儲(chǔ)過(guò)程的名字就是以SP_開(kāi)頭的),同時(shí)這么做還會(huì)增加與系統(tǒng)存儲(chǔ)過(guò)程名稱沖突的幾率;


  (2)將Nocount設(shè)置為On避免額外的網(wǎng)絡(luò)開(kāi)銷(xiāo);


  (3)當(dāng)索引結(jié)構(gòu)發(fā)生變化時(shí),在EXECUTE語(yǔ)句中(第一次)使用WITH RECOMPILE子句,以便存儲(chǔ)過(guò)程可以利用最新創(chuàng)建的索引;


  (4)使用默認(rèn)的參數(shù)值更易于調(diào)試。


  16、在觸發(fā)器中使用下列最佳實(shí)踐


  (1)最好不要使用觸發(fā)器,觸發(fā)一個(gè)觸發(fā)器,執(zhí)行一個(gè)觸發(fā)器事件本身就是一個(gè)耗費(fèi)資源的過(guò)程;


  (2)如果能夠使用約束實(shí)現(xiàn)的,盡量不要使用觸發(fā)器;


  (3)不要為不同的觸發(fā)事件(Insert,Update和Delete)使用相同的觸發(fā)器;


  (4)不要在觸發(fā)器中使用事務(wù)型代碼。


  17、在視圖中使用下列最佳實(shí)踐


  (1)為重新使用復(fù)雜的TSQL塊使用視圖,并開(kāi)啟索引視圖;


  (2)如果你不想讓用戶意外修改表結(jié)構(gòu),使用視圖時(shí)加上SCHEMABINDING選項(xiàng);


  (3)如果只從單個(gè)表中檢索數(shù)據(jù),就不需要使用視圖了,如果在這種情況下使用視圖反倒會(huì)增加系統(tǒng)開(kāi)銷(xiāo),一般視圖會(huì)涉及多個(gè)表時(shí)才有用。


  18、在事務(wù)中使用下列最佳實(shí)踐


  (1)SQL Server 2005之前,在BEGIN TRANSACTION之后,每個(gè)子查詢修改語(yǔ)句時(shí),必須檢查@@ERROR的值,如果值不等于0,那么最后的語(yǔ)句可能會(huì)導(dǎo)致一個(gè)錯(cuò)誤,如果發(fā)生任何錯(cuò)誤,事務(wù)必須回滾。從SQL Server 2005開(kāi)始,Try..Catch..代碼塊可以處理TSQL中的事務(wù),因此在事務(wù)型代碼中最好加上Try…Catch…;


  (2)避免使用嵌套事務(wù),使用@@TRANCOUNT變量檢查事務(wù)是否需要啟動(dòng)(為了避免嵌套事務(wù));


  (3)盡可能晚啟動(dòng)事務(wù),提交和回滾事務(wù)要盡可能快,以減少資源鎖定時(shí)間。


  要完全列舉最佳實(shí)踐不是本文的初衷,當(dāng)你了解了這些技巧后就應(yīng)該拿來(lái)使用,否則了解了也沒(méi)有價(jià)值。此外,你還需要評(píng)審和監(jiān)視數(shù)據(jù)訪問(wèn)代碼是否遵循下列標(biāo)準(zhǔn)和最佳實(shí)踐。


  如何分析和識(shí)別你的TSQL中改進(jìn)的范圍?


  理想情況下,大家都想預(yù)防疾病,而不是等病發(fā)了去治療。但實(shí)際上這個(gè)愿望根本無(wú)法實(shí)現(xiàn),即使你的團(tuán)隊(duì)成員全都是專(zhuān)家級(jí)人物,我也知道你有進(jìn)行評(píng)審,但代碼仍然一團(tuán)糟,因此需要知道如何治療疾病一樣重要。


  首先需要知道如何診斷性能問(wèn)題,診斷就得分析TSQL,找出瓶頸,然后重構(gòu),要找出瓶頸就得先學(xué)會(huì)分析執(zhí)行計(jì)劃。



  理解查詢執(zhí)行計(jì)劃


  當(dāng)你將SQL語(yǔ)句發(fā)給SQL Server引擎后,SQL Server首先要確定最合理的執(zhí)行方法,查詢優(yōu)化器會(huì)使用很多信息,如數(shù)據(jù)分布統(tǒng)計(jì),索引結(jié)構(gòu),元數(shù)據(jù)和其它信息,分析多種可能的執(zhí)行計(jì)劃,最后選擇一個(gè)最佳的執(zhí)行計(jì)劃。


  可以使用SQL Server Management Studio預(yù)覽和分析執(zhí)行計(jì)劃,寫(xiě)好SQL語(yǔ)句后,點(diǎn)擊SQL Server Management Studio上的評(píng)估執(zhí)行計(jì)劃按鈕查看執(zhí)行計(jì)劃,如圖1所示。



  圖 1 在Management Studio中評(píng)估執(zhí)行計(jì)劃


  在執(zhí)行計(jì)劃圖中的每個(gè)圖標(biāo)代表計(jì)劃中的一個(gè)行為(操作),應(yīng)從右到左閱讀執(zhí)行計(jì)劃,每個(gè)行為都一個(gè)相對(duì)于總體執(zhí)行成本(100%)的成本百分比。


  在上面的執(zhí)行計(jì)劃圖中,右邊的那個(gè)圖標(biāo)表示在HumanResources表上的一個(gè)“聚集索引掃描”操作(閱讀表中所有主鍵索引值),需要100%的總體查詢執(zhí)行成本,圖中左邊那個(gè)圖標(biāo)表示一個(gè)select操作,它只需要0%的總體查詢執(zhí)行成本。


  下面是一些比較重要的圖標(biāo)及其對(duì)應(yīng)的操作:



  圖 2 常見(jiàn)的重要圖標(biāo)及對(duì)應(yīng)的操作


  注意執(zhí)行計(jì)劃中的查詢成本,如果說(shuō)成本等于100%,那很可能在批處理中就只有這個(gè)查詢,如果在一個(gè)查詢窗口中有多個(gè)查詢同時(shí)執(zhí)行,那它們肯定有各自的成本百分比(小于100%)。


  如果想知道執(zhí)行計(jì)劃中每個(gè)操作詳細(xì)情況,將鼠標(biāo)指針移到對(duì)應(yīng)的圖標(biāo)上即可,你會(huì)看到類(lèi)似于下面的這樣一個(gè)窗口。



  圖 3 查看執(zhí)行計(jì)劃中行為(操作)的詳細(xì)信息


  這個(gè)窗口提供了詳細(xì)的評(píng)估信息,上圖顯示了聚集索引掃描的詳細(xì)信息,它要查找AdventureWorks數(shù)據(jù)庫(kù)HumanResources方案下Employee表中 Gender = ‘M’的行,它也顯示了評(píng)估的I/O,CPU成本。


  查看執(zhí)行計(jì)劃時(shí),我們應(yīng)該獲得什么信息


  當(dāng)你的查詢很慢時(shí),你就應(yīng)該看看預(yù)估的執(zhí)行計(jì)劃(當(dāng)然也可以查看真實(shí)的執(zhí)行計(jì)劃),找出耗時(shí)最多的操作,注意觀察以下成本通常較高的操作:


  1、表掃描(Table Scan)


  當(dāng)表沒(méi)有聚集索引時(shí)就會(huì)發(fā)生,這時(shí)只要?jiǎng)?chuàng)建聚集索引或重整索引一般都可以解決問(wèn)題。


  2、聚集索引掃描(Clustered Index Scan)


  有時(shí)可以認(rèn)為等同于表掃描,當(dāng)某列上的非聚集索引無(wú)效時(shí)會(huì)發(fā)生,這時(shí)只要?jiǎng)?chuàng)建一個(gè)非聚集索引就ok了。


  3、哈希連接(Hash Join)


  當(dāng)連接兩個(gè)表的列沒(méi)有被索引時(shí)會(huì)發(fā)生,只需在這些列上創(chuàng)建索引即可。


  4、嵌套循環(huán)(Nested Loops)


  當(dāng)非聚集索引不包括select查詢清單的列時(shí)會(huì)發(fā)生,只需要?jiǎng)?chuàng)建覆蓋索引問(wèn)題即可解決。


  5、RID查找(RID Lookup)


  當(dāng)你有一個(gè)非聚集索引,但相同的表上卻沒(méi)有聚集索引時(shí)會(huì)發(fā)生,此時(shí)數(shù)據(jù)庫(kù)引擎會(huì)使用行ID查找真實(shí)的行,這時(shí)一個(gè)代價(jià)高的操作,這時(shí)只要在該表上創(chuàng)建聚集索引即可。


  TSQL重構(gòu)真實(shí)的故事


  只有解決了實(shí)際的問(wèn)題后,知識(shí)才轉(zhuǎn)變?yōu)閮r(jià)值。當(dāng)我們檢查應(yīng)用程序性能時(shí),發(fā)現(xiàn)一個(gè)存儲(chǔ)過(guò)程比我們預(yù)期的執(zhí)行得慢得多,在生產(chǎn)數(shù)據(jù)庫(kù)中檢索一個(gè)月的銷(xiāo)售數(shù)據(jù)居然要50秒,下面就是這個(gè)存儲(chǔ)過(guò)程的執(zhí)行語(yǔ)句:


  exec uspGetSalesInfoForDateRange ‘1/1/2009’, 31/12/2009,’Cap’


  Tom受命來(lái)優(yōu)化這個(gè)存儲(chǔ)過(guò)程,下面是這個(gè)存儲(chǔ)過(guò)程的代碼:



 ALTER PROCEDURE uspGetSalesInfoForDateRange

  
@startYear DateTime,

  
@endYear DateTime,

  
@keyword nvarchar(50)

  
AS

  
BEGIN

  
SET NOCOUNT ON;

  
SELECT

  Name,

  ProductNumber,

  ProductRates.CurrentProductRate Rate,

  ProductRates.CurrentDiscount Discount,

  OrderQty Qty,

  dbo.ufnGetLineTotal(SalesOrderDetailID) Total,

  OrderDate,

  DetailedDescription

  
FROM

  Products
INNER JOIN OrderDetails

  
ON Products.ProductID = OrderDetails.ProductID

  
INNER JOIN Orders

  
ON Orders.SalesOrderID = OrderDetails.SalesOrderID

  
INNER JOIN ProductRates

  
ON

  Products.ProductID
= ProductRates.ProductID

  
WHERE

  OrderDate
between @startYear and @endYear

  
AND

  (

  ProductName
LIKE '' + @keyword + ' %' OR

  ProductName
LIKE '% ' + @keyword + ' ' + '%' OR

  ProductName
LIKE '% ' + @keyword + '%' OR

  Keyword
LIKE '' + @keyword + ' %' OR

  Keyword
LIKE '% ' + @keyword + ' ' + '%' OR

  Keyword
LIKE '% ' + @keyword + '%'

  )

  
ORDER BY

  ProductName

  
END

  
GO


  分析索引


  首先,Tom想到了審查這個(gè)存儲(chǔ)過(guò)程使用到的表的索引,很快他發(fā)現(xiàn)下面兩列的索引無(wú)故丟失了:


  OrderDetails.ProductID


  OrderDetails.SalesOrderID


  他在這兩個(gè)列上創(chuàng)建了非聚集索引,然后再執(zhí)行存儲(chǔ)過(guò)程:


  exec uspGetSalesInfoForDateRange ‘1/1/2009’, 31/12/2009 with recompile


  性能有所改變,但仍然低于預(yù)期(這次花了35秒),注意這里的with recompile子句告訴SQL Server引擎重新編譯存儲(chǔ)過(guò)程,重新生成執(zhí)行計(jì)劃,以利用新創(chuàng)建的索引。


  分析查詢執(zhí)行計(jì)劃


  Tom接下來(lái)查看了SQL Server Management Studio中的執(zhí)行計(jì)劃,通過(guò)分析,他找到了某些重要的線索:


  1、發(fā)生了一次表掃描,即使該表已經(jīng)正確設(shè)置了索引,而表掃描占據(jù)了總體查詢執(zhí)行時(shí)間的30%;


  2、發(fā)生了一個(gè)嵌套循環(huán)連接。


  Tom想知道是否有索引碎片,因?yàn)樗兴饕渲枚际钦_的,通過(guò)TSQL他知道了有兩個(gè)索引都產(chǎn)生了碎片,很快他重組了這兩個(gè)索引,于是表掃描消失了,現(xiàn)在執(zhí)行存儲(chǔ)過(guò)程的時(shí)間減少到25秒了。


  為了消除嵌套循環(huán)連接,他又在表上創(chuàng)建了覆蓋索引,時(shí)間進(jìn)一步減少到23秒。


  實(shí)施最佳實(shí)踐


  Tom發(fā)現(xiàn)有個(gè)UDF有問(wèn)題,代碼如下: 



ALTER FUNCTION [dbo].[ufnGetLineTotal]

  (

  
@SalesOrderDetailID int

  )

  
RETURNS money

  
AS

  
BEGIN

  
DECLARE @CurrentProductRate money

  
DECLARE @CurrentDiscount money

  
DECLARE @Qty int

  
SELECT

  
@CurrentProductRate = ProductRates.CurrentProductRate,

  
@CurrentDiscount = ProductRates.CurrentDiscount,

  
@Qty = OrderQty

  
FROM

  ProductRates
INNER JOIN OrderDetails ON

  OrderDetails.ProductID
= ProductRates.ProductID

  
WHERE

  OrderDetails.SalesOrderDetailID
= @SalesOrderDetailID

  
RETURN (@CurrentProductRate-@CurrentDiscount)*@Qty

  
END

  在計(jì)算訂單總金額時(shí)看起來(lái)代碼很程序化,Tom決定在UDF的SQL中使用內(nèi)聯(lián)SQL。


  dbo.ufnGetLineTotal(SalesOrderDetailID) Total -- 舊代碼


  (CurrentProductRate-CurrentDiscount)*OrderQty Total -- 新代碼


  執(zhí)行時(shí)間一下子減少到14秒了。


  在select查詢清單中放棄不必要的Text列


  為了進(jìn)一步提升性能,Tom決定檢查一下select查詢清單中使用的列,很快他發(fā)現(xiàn)有一個(gè)Products.DetailedDescription列是Text類(lèi)型,通過(guò)對(duì)應(yīng)用程序代碼的走查,Tom發(fā)現(xiàn)其實(shí)這一列的數(shù)據(jù)并不會(huì)立即用到,于是他將這一列從select查詢清單中取消掉,時(shí)間一下子從14秒減少到6秒,于是Tom決定使用一個(gè)存儲(chǔ)過(guò)程應(yīng)用延遲加載策略加載這個(gè)Text列。


  最后Tom還是不死心,認(rèn)為6秒也無(wú)法接受,于是他再次仔細(xì)檢查了SQL代碼,他發(fā)現(xiàn)了一個(gè)like子句,經(jīng)過(guò)反復(fù)研究他認(rèn)為這個(gè)like搜索完全可以用全文搜索替換,最后他用全文搜索替換了like搜索,時(shí)間一下子降低到1秒,至此Tom認(rèn)為調(diào)優(yōu)應(yīng)該暫時(shí)結(jié)束了。


  小結(jié)


  看起來(lái)我們介紹了好多種優(yōu)化數(shù)據(jù)訪問(wèn)的技巧,但大家要知道優(yōu)化數(shù)據(jù)訪問(wèn)是一個(gè)無(wú)止境的過(guò)程,同樣大家要相信一個(gè)信念,無(wú)論你的系統(tǒng)多么龐大,多么復(fù)雜,只要靈活運(yùn)用我們所介紹的這些技巧,你一樣可以馴服它們。下一篇將介紹高級(jí)索引和反范式化。



  經(jīng)過(guò)索引優(yōu)化,重構(gòu)TSQL后你的數(shù)據(jù)庫(kù)還存在性能問(wèn)題嗎?完全有可能,這時(shí)必須得找另外的方法才行。SQL Server在索引方面還提供了某些高級(jí)特性,可能你還從未使用過(guò),利用高級(jí)索引會(huì)顯著地改善系統(tǒng)性能,本文將從高級(jí)索引技術(shù)談起,另外還將介紹反范式化技術(shù)。


  第六步:應(yīng)用高級(jí)索引


  實(shí)施計(jì)算列并在這些列上創(chuàng)建索引


  你可能曾經(jīng)寫(xiě)過(guò)從數(shù)據(jù)庫(kù)查詢一個(gè)結(jié)果集的應(yīng)用程序代碼,對(duì)結(jié)果集中每一行進(jìn)行計(jì)算生成最終顯示輸出的信息。例如,你可能有一個(gè)查詢從數(shù)據(jù)庫(kù)檢索訂單信息,在應(yīng)用程序代碼中你可能已經(jīng)通過(guò)對(duì)產(chǎn)品和銷(xiāo)售量執(zhí)行算術(shù)操作計(jì)算出了總的訂單價(jià)格,但為什么你不在數(shù)據(jù)庫(kù)中執(zhí)行這些操作呢?


  請(qǐng)看下面這張圖,你可以通過(guò)指定一個(gè)公式將一個(gè)數(shù)據(jù)庫(kù)表列作為計(jì)算列,你的TSQL在查詢清單中包括這個(gè)計(jì)算列,SQL引擎將會(huì)應(yīng)用這個(gè)公式計(jì)算出這一列的值,在執(zhí)行查詢時(shí),數(shù)據(jù)庫(kù)引擎將會(huì)計(jì)算訂單總價(jià),并為計(jì)算列返回結(jié)果。



  圖 1 計(jì)算列


  使用計(jì)算列你可以將計(jì)算工作全部交給后端執(zhí)行,但如果表的行數(shù)太多可能計(jì)算性能也不高,如果計(jì)算列出現(xiàn)在Select查詢的where子句中情況會(huì)更糟,在這種情況下,為了匹配where子句指定的值,數(shù)據(jù)庫(kù)引擎不得不計(jì)算表中所有行中計(jì)算列的值,這是一個(gè)低效的過(guò)程,因?yàn)樗偸切枰頀呙杌蛉奂饕龗呙琛?/P>

  因此問(wèn)題就來(lái)了,如何提高計(jì)算列的性能呢?解決辦法是在計(jì)算列上創(chuàng)建索引,當(dāng)計(jì)算列上有索引后,SQL Server會(huì)提前計(jì)算結(jié)果,然后在結(jié)果之上構(gòu)建索引。此外,當(dāng)對(duì)應(yīng)列(計(jì)算列依賴的列)的值更新時(shí),計(jì)算列上的索引值也會(huì)更新。因此,在執(zhí)行查詢時(shí),數(shù)據(jù)庫(kù)引擎不會(huì)為結(jié)果集中的每一行都執(zhí)行一次計(jì)算公式,相反,通過(guò)索引可直接獲得計(jì)算列預(yù)先計(jì)算出的值,因此在計(jì)算列上創(chuàng)建一個(gè)索引將會(huì)加快查詢速度。


  提示:如果你想在計(jì)算列上創(chuàng)建索引,必須確保計(jì)算列上的公式不能包括任何“非確定的”函數(shù),例如getdate()就是一個(gè)非確定的函數(shù),因?yàn)槊看握{(diào)用它,它返回的值都是不一樣的。


  創(chuàng)建索引視圖


  你是否知道可以在視圖上創(chuàng)建索引?OK,不知道沒(méi)關(guān)系,看了我的介紹你就明白了。


  為什么要使用視圖?


  大家都知道,視圖本身不存儲(chǔ)任何數(shù)據(jù),只是一條編譯的select語(yǔ)句。數(shù)據(jù)庫(kù)會(huì)為視圖生成一個(gè)執(zhí)行計(jì)劃,視圖是可以重復(fù)使用的,因?yàn)閳?zhí)行計(jì)劃也可以重復(fù)使用。


  視圖本身不會(huì)帶來(lái)性能的提升,我曾經(jīng)以為它會(huì)“記住”查詢結(jié)果,但后來(lái)我才知道它除了是一個(gè)編譯了的查詢外,其它什么都不是,視圖根本記不住查詢結(jié)果,我敢打賭好多剛接觸SQL的人都會(huì)有這個(gè)錯(cuò)誤的想法。


  但是現(xiàn)在我要告訴你一個(gè)方法讓視圖記住查詢結(jié)果,其實(shí)非常簡(jiǎn)單,就是在視圖上創(chuàng)建索引就可以了。


  如果你在視圖上應(yīng)用了索引,視圖就成為索引視圖,對(duì)于一個(gè)索引視圖,數(shù)據(jù)庫(kù)引擎處理SQL,并在數(shù)據(jù)文件中存儲(chǔ)結(jié)果,和聚集表類(lèi)似,當(dāng)基礎(chǔ)表中的數(shù)據(jù)發(fā)生變化時(shí),SQL Server會(huì)自動(dòng)維護(hù)索引,因此當(dāng)你在索引視圖上查詢時(shí),數(shù)據(jù)庫(kù)引擎簡(jiǎn)單地從索引中查找值,速度當(dāng)然就很快了,因此在視圖上創(chuàng)建索引可以明顯加快查詢速度。


  但請(qǐng)注意,天下沒(méi)有免費(fèi)的午餐,創(chuàng)建索引視圖可以提升性能,當(dāng)基礎(chǔ)表中的數(shù)據(jù)發(fā)生變化時(shí),數(shù)據(jù)庫(kù)引擎也會(huì)更新索引,因此,當(dāng)視圖要處理很多行,且要求和,當(dāng)數(shù)據(jù)和基礎(chǔ)表不經(jīng)常發(fā)生變化時(shí),就應(yīng)該考慮創(chuàng)建索引視圖。


  如何創(chuàng)建索引視圖?


  1)創(chuàng)建/修改視圖時(shí)指定SCHEMABINDING選項(xiàng):



REATE VIEW dbo.vOrderDetails

  
WITH SCHEMABINDING

  
AS

  
SELECT

  2)在視圖上創(chuàng)建一個(gè)唯一的聚集索引;


  3)視需要在視圖上創(chuàng)建一個(gè)非聚集索引。


  不是所有視圖上都可以創(chuàng)建索引,在視圖上創(chuàng)建索引存在以下限制:


  1)創(chuàng)建視圖時(shí)使用了SCHEMABINDING選項(xiàng),這種情況下,數(shù)據(jù)庫(kù)引擎不允許你改變表的基礎(chǔ)結(jié)構(gòu);


  2)視圖不能包含任何非確定性函數(shù),DISTINCT子句和子查詢;


  3)視圖中的底層表必須由聚集索引(主鍵)。


  如果你發(fā)現(xiàn)你的應(yīng)用程序中使用的TSQL是用視圖實(shí)現(xiàn)的,但存在性能問(wèn)題,那此時(shí)給視圖加上索引可能會(huì)帶來(lái)性能的提升。


  為用戶定義函數(shù)(UDF)創(chuàng)建索引


  在用戶定義函數(shù)上也可以創(chuàng)建索引,但不能直接在它上面創(chuàng)建索引,需要?jiǎng)?chuàng)建一個(gè)輔助的計(jì)算列,公式就使用用戶定義函數(shù),然后在這個(gè)計(jì)算列字段上創(chuàng)建索引。具體步驟如下:


  1)首先創(chuàng)建一個(gè)確定性的函數(shù)(如果不存在的話),在函數(shù)定義中添加SCHEMABINDING選項(xiàng),如:



CREATE FUNCTION [dbo.ufnGetLineTotal]

  (

  
-- Add the parameters for the function here

  
@UnitPrice [money],

  
@UnitPriceDiscount [money],

  
@OrderQty [smallint]

  )

  
RETURNS money

  
WITH SCHEMABINDING

  
AS

  
BEGIN

  
return (((@UnitPrice*((1.0)-@UnitPriceDiscount))*@OrderQty))

  
END

  2)在目標(biāo)表上增加一個(gè)計(jì)算列,使用前面定義的函數(shù)作為該列的計(jì)算公式,如圖2所示。



CREATE FUNCTION [dbo.ufnGetLineTotal]

  (

  
-- Add the parameters for the function here

  
@UnitPrice [money],

  
@UnitPriceDiscount [money],

  
@OrderQty [smallint]

  )

  
RETURNS money

  
WITH SCHEMABINDING

  
AS

  
BEGIN

  
return (((@UnitPrice*((1.0)-@UnitPriceDiscount))*@OrderQty))

  
END
 


圖 2 指定UDF為計(jì)算列的結(jié)算公式

  3)在計(jì)算列上創(chuàng)建索引


  當(dāng)你的查詢中包括UDF時(shí),如果在該UDF上創(chuàng)建了以計(jì)算列為基礎(chǔ)的索引,特別是兩個(gè)表或視圖的連接條件中使用了UDF,性能都會(huì)有明顯的改善。


  在XML列上創(chuàng)建索引


  在SQL Server(2005和后續(xù)版本)中,XML列是以二進(jìn)制大對(duì)象(BLOB)形式存儲(chǔ)的,可以使用XQuery進(jìn)行查詢,但如果沒(méi)有索引,每次查詢XML數(shù)據(jù)類(lèi)型時(shí)都非常耗時(shí),特別是大型XML實(shí)例,因?yàn)镾QL Server在運(yùn)行時(shí)需要分隔二進(jìn)制大對(duì)象評(píng)估查詢。為了提升XML數(shù)據(jù)類(lèi)型上的查詢性能,XML列可以索引,XML索引分為兩類(lèi)。


  主XML索引


  創(chuàng)建XML列上的主索引時(shí),SQL Server會(huì)切碎XML內(nèi)容,創(chuàng)建多個(gè)數(shù)據(jù)行,包括元素,屬性名,路徑,節(jié)點(diǎn)類(lèi)型和值等,創(chuàng)建主索引讓SQL Server更輕松地支持XQuery請(qǐng)求。下面是創(chuàng)建一個(gè)主XML索引的示例語(yǔ)法?!?/P>


CREATE PRIMARY XML INDEX
index_name
ON <object> ( xml_column )

  次要XML索引


  雖然XML數(shù)據(jù)已經(jīng)被切條,但SQL Server仍然要掃描所有切條的數(shù)據(jù)才能找到想要的結(jié)果,為了進(jìn)一步提升性能,還需要在主XML索引之上創(chuàng)建次要XML索引。有三種次要XML索引。


  1)“路徑”(Path)次要XML索引:使用.exist()方法確定一個(gè)特定的路徑是否存在時(shí)它很有用;


  2)“值”(Value)次要XML索引:用于執(zhí)行基于值的查詢,但不知道完整的路徑或路徑包括通配符時(shí);


  3)“屬性”(Secondary)次要XML索引:知道路徑時(shí)檢索屬性的值。


  下面是一個(gè)創(chuàng)建次要XML索引的示例:



CREATE XML INDEX
index_name
ON <object> ( xml_column )
USING XML
INDEX primary_xml_index_name
FOR { VALUE | PATH | PROPERTY }

  請(qǐng)注意,上面講的原則是基礎(chǔ),如果盲目地在表上創(chuàng)建索引,不一定會(huì)提升性能,因?yàn)橛袝r(shí)在某些表的某些列上創(chuàng)建索引時(shí),可能會(huì)致使插入和更新操作變慢,當(dāng)這個(gè)表上有一個(gè)低選中性列時(shí)更是如此,同樣,當(dāng)表中的記錄很少(如<500)時(shí),如果在這樣的表上創(chuàng)建索引反倒會(huì)使數(shù)據(jù)檢索性能降低,因?yàn)閷?duì)于小表而言,全表掃描反而會(huì)更快,因此在創(chuàng)建索引時(shí)應(yīng)放聰明一點(diǎn)。



  第七步:應(yīng)用反范式化,使用歷史表和預(yù)計(jì)算列


  反范式化


  如果你正在為一個(gè)OLTA(在線事務(wù)分析)系統(tǒng)設(shè)計(jì)數(shù)據(jù)庫(kù),主要指為只讀查詢優(yōu)化過(guò)的數(shù)據(jù)倉(cāng)庫(kù),你可以(和應(yīng)該)在你的數(shù)據(jù)庫(kù)中應(yīng)用反范式化和索引,也就是說(shuō),某些數(shù)據(jù)可以跨多個(gè)表存儲(chǔ),但報(bào)告和數(shù)據(jù)分析查詢?cè)谶@種數(shù)據(jù)庫(kù)上可能會(huì)更快。


  但如果你正在為一個(gè)OLTP(聯(lián)機(jī)事務(wù)處理)系統(tǒng)設(shè)計(jì)數(shù)據(jù)庫(kù),這樣的數(shù)據(jù)庫(kù)主要執(zhí)行數(shù)據(jù)更新操作(包括插入/更新/刪除),我建議你至少實(shí)施第一、二、三范式,這樣數(shù)據(jù)冗余可以降到最低,數(shù)據(jù)存儲(chǔ)也可以達(dá)到最小化,可管理性也會(huì)好一點(diǎn)。


  無(wú)論我們?cè)贠LTP系統(tǒng)上是否應(yīng)用范式,在數(shù)據(jù)庫(kù)上總有大量的讀操作(即select查詢),當(dāng)應(yīng)用了所有優(yōu)化技術(shù)后,如果發(fā)現(xiàn)數(shù)據(jù)檢索操作仍然效率低下,此時(shí),你可能需要考慮應(yīng)用反范式設(shè)計(jì)了,但問(wèn)題是如何應(yīng)用反范式化,以及為什么應(yīng)用反范式化會(huì)提升性能?讓我們來(lái)看一個(gè)簡(jiǎn)單的例子,答案就在例子中。


  假設(shè)我們有兩個(gè)表OrderDetails(ID,ProductID,OrderQty) 和 Products(ID,ProductName)分別存儲(chǔ)訂單詳細(xì)信息和產(chǎn)品信息,現(xiàn)在要查詢某個(gè)客戶訂購(gòu)的產(chǎn)品名稱和它們的數(shù)量,查詢SQL語(yǔ)句如下:



SELECT Products.ProductName,OrderQty

  
FROM OrderDetails INNER JOIN Products

  
ON OrderDetails.ProductID = Products.ProductID

  
WHERE SalesOrderID = 47057

  如果這兩個(gè)都是大表,當(dāng)你應(yīng)用了所有優(yōu)化技巧后,查詢速度仍然很慢,這時(shí)可以考慮以下反范式化設(shè)計(jì):


  1)在OrderDetails表上添加一列ProductName,并填充好數(shù)據(jù);


  2)重寫(xiě)上面的SQL語(yǔ)句



 SELECT ProductName,OrderQty

  
FROM OrderDetails

  
WHERE SalesOrderID = 47057

  注意在OrderDetails表上應(yīng)用了反范式化后,不再需要連接Products表,因此在執(zhí)行SQL時(shí),SQL引擎不會(huì)執(zhí)行兩個(gè)表的連接操作,查詢速度當(dāng)然會(huì)快一些。


  為了提高select操作性能,我們不得不做出一些犧牲,需要在兩個(gè)地方(OrderDetails 和 Products表)存儲(chǔ)相同的數(shù)據(jù)(ProductName),當(dāng)我們插入或更新Products 表中的ProductName字段時(shí),不得不同步更新OrderDetails表中的ProductName字段,此外,應(yīng)用這種反范式化設(shè)計(jì)時(shí)會(huì)增加存儲(chǔ)資源消耗。


  因此在實(shí)施反范式化設(shè)計(jì)時(shí),我們必須在數(shù)據(jù)冗余和查詢操作性能之間進(jìn)行權(quán)衡,同時(shí)在應(yīng)用反范式化后,我們不得不重構(gòu)某些插入和更新操作代碼。有一個(gè)重要的原則需要遵守,那就是只有當(dāng)你應(yīng)用了所有其它優(yōu)化技術(shù)都還不能將性能提升到理想情況時(shí)才使用反范式化。同時(shí)還需注意不能使用太多的反范式化設(shè)計(jì),那樣會(huì)使原本清晰的表結(jié)構(gòu)設(shè)計(jì)變得越來(lái)模糊。


  歷史表


  如果你的應(yīng)用程序中有定期運(yùn)行的數(shù)據(jù)檢索操作(如報(bào)表),如果涉及到大表的檢索,可以考慮定期將事務(wù)型規(guī)范化表中的數(shù)據(jù)復(fù)制到反范式化的單一的歷史表中,如利用數(shù)據(jù)庫(kù)的Job來(lái)完成這個(gè)任務(wù),并對(duì)這個(gè)歷史表建立合適的索引,那么周期性執(zhí)行的數(shù)據(jù)檢索操作可以遷移到這個(gè)歷史表上,對(duì)單個(gè)歷史表的查詢性能肯定比連接多個(gè)事務(wù)表的查詢速度要快得多。


  例如,假設(shè)有一個(gè)連鎖商店的月度報(bào)表需要3個(gè)小時(shí)才能執(zhí)行完畢,你被派去優(yōu)化這個(gè)報(bào)表,目的只有一個(gè):最小化執(zhí)行時(shí)間。那么你除了應(yīng)用其它優(yōu)化技巧外,還可以采取以下手段:


  1)使用反范式化結(jié)構(gòu)創(chuàng)建一個(gè)歷史表,并對(duì)銷(xiāo)售數(shù)據(jù)建立合適的索引;


  2)在SQL Server上創(chuàng)建一個(gè)定期執(zhí)行的操作,每隔24小時(shí)運(yùn)行一次,在半夜往歷史表中填充數(shù)據(jù);


  3)修改報(bào)表代碼,從歷史表獲取數(shù)據(jù)。


  創(chuàng)建定期執(zhí)行的操作


  按照下面的步驟在SQL Server中創(chuàng)建一個(gè)定期執(zhí)行的操作,定期從事務(wù)表中提取數(shù)據(jù)填充到歷史表中。


  1)首先確保SQL Server代理服務(wù)處于運(yùn)行狀態(tài);


  2)在SQL Server配置管理器中展開(kāi)SQL Server代理節(jié)點(diǎn),在“作業(yè)”節(jié)點(diǎn)上創(chuàng)建一個(gè)新作業(yè),在“常規(guī)”標(biāo)簽頁(yè)中,輸入作業(yè)名稱和描述文字;


  3)在“步驟”標(biāo)簽頁(yè)中,點(diǎn)擊“新建”按鈕創(chuàng)建一個(gè)新的作業(yè)步驟,輸入名字和TSQL代碼,最后保存;


  4)切換到“調(diào)度”標(biāo)簽頁(yè),點(diǎn)擊“新建”按鈕創(chuàng)建一個(gè)新調(diào)度計(jì)劃;


  5)最后保存調(diào)度計(jì)劃。


  在數(shù)據(jù)插入和更新中提前執(zhí)行耗時(shí)的計(jì)算,簡(jiǎn)化查詢


  大多數(shù)情況下,你會(huì)看到你的應(yīng)用程序是一個(gè)接一個(gè)地執(zhí)行數(shù)據(jù)插入或更新操作,一次只涉及到一條記錄,但數(shù)據(jù)檢索操作可能同時(shí)涉及到多條記錄。


  如果你的查詢中包括一個(gè)復(fù)雜的計(jì)算操作,毫無(wú)疑問(wèn)這將導(dǎo)致整體的查詢性能下降,你可以考慮下面的解決辦法:


  1)在表中創(chuàng)建額外的一列,包含計(jì)算的值;


  2)為插入和更新事件創(chuàng)建一個(gè)觸發(fā)器,使用相同的計(jì)算邏輯計(jì)算值,計(jì)算完成后更新到新建的列;


  3)使用新創(chuàng)建的列替換查詢中的計(jì)算邏輯。


  實(shí)施完上述步驟后,插入和更新操作可能會(huì)更慢一點(diǎn),因?yàn)槊看尾迦牒透聲r(shí)觸發(fā)器都會(huì)執(zhí)行一下,但數(shù)據(jù)檢索操作會(huì)比之前快得多,因?yàn)閳?zhí)行查詢時(shí),數(shù)據(jù)庫(kù)引擎不會(huì)執(zhí)行計(jì)算操作了。


  小結(jié)


  至此,我們已經(jīng)應(yīng)用了索引,重構(gòu)TSQL,應(yīng)用高級(jí)索引,反范式化,以及歷史表加速數(shù)據(jù)檢索速度,但性能優(yōu)化是一個(gè)永無(wú)終點(diǎn)的過(guò)程,最下一篇文章中我們將會(huì)介紹如何診斷數(shù)據(jù)庫(kù)性能問(wèn)題。



  診斷數(shù)據(jù)庫(kù)性能問(wèn)題就象醫(yī)生診斷病人病情一樣,既要結(jié)合自己積累的經(jīng)驗(yàn),又要依靠科學(xué)的診斷報(bào)告,才能準(zhǔn)確地判斷問(wèn)題的根源在哪里。前面三篇文章我們介紹了許多優(yōu)化數(shù)據(jù)庫(kù)性能的方法,固然掌握優(yōu)化技巧很重要,但診斷數(shù)據(jù)庫(kù)性能問(wèn)題是優(yōu)化的前提,本文就介紹一下如何診斷數(shù)據(jù)庫(kù)性能問(wèn)題。


  第八步:使用SQL事件探查器和性能監(jiān)控工具有效地診斷性能問(wèn)題


  在SQL Server應(yīng)用領(lǐng)域SQL事件探查器可能是最著名的性能故障排除工具,大多數(shù)情況下,當(dāng)?shù)玫揭粋€(gè)性能問(wèn)題報(bào)告后,一般首先啟動(dòng)它進(jìn)行診斷。


  你可能已經(jīng)知道,SQL事件探查器是一個(gè)跟蹤和監(jiān)控SQL Server實(shí)例的圖形化工具,主要用于分析和衡量在數(shù)據(jù)庫(kù)服務(wù)器上執(zhí)行的TSQL性能,你可以捕捉服務(wù)器實(shí)例上的每個(gè)事件,將其保存到文件或表中供以后分析。例如,如果生產(chǎn)數(shù)據(jù)庫(kù)速度很慢,你可以使用SQL事件探查器查看哪些存儲(chǔ)過(guò)程執(zhí)行時(shí)耗時(shí)過(guò)多。


  SQL事件探查器的基本用法


  你可能已經(jīng)知道如何使用它,那么你可以跳過(guò)這一小節(jié),但我還是要重復(fù)一下,也許有許多新手閱讀本文。


  1)啟動(dòng)SQL事件探查器,連接到目標(biāo)數(shù)據(jù)庫(kù)實(shí)例,創(chuàng)建一個(gè)新跟蹤,指定一個(gè)跟蹤模板(跟蹤模板預(yù)置了一些事件和用于跟蹤的列),如圖1所示;



  圖 1 選擇跟蹤模板


  2)作為可選的一步,你還可以選擇特定事件和列



  圖 2 選擇跟蹤過(guò)程要捕捉的事件


  3)另外你還可以點(diǎn)擊“組織列”按鈕,在彈出的窗口中指定列的顯示順序,點(diǎn)擊“列過(guò)濾器”按鈕,在彈出的窗口中設(shè)置過(guò)濾器,例如,通過(guò)設(shè)置數(shù)據(jù)庫(kù)的名稱(在like文本框中),只跟蹤特定的數(shù)據(jù)庫(kù),如果不設(shè)置過(guò)濾器,SQL事件探查器會(huì)捕捉所有的事件,跟蹤的信息會(huì)非常多,要找出有用的關(guān)鍵信息就如大海撈針。



  圖 3 過(guò)濾器設(shè)置


  4)運(yùn)行事件探查器,等待捕捉事件



  圖 4 運(yùn)行事件探查器


  5)跟蹤了足夠的信息后,停掉事件探查器,將跟蹤信息保存到一個(gè)文件中,或者保存到一個(gè)數(shù)據(jù)表中,如果保存到表中,需要指定表名,SQL Server會(huì)自動(dòng)創(chuàng)建表中的字段。



  圖 5 將探查器跟蹤數(shù)據(jù)保存到表中


  6)執(zhí)行下面的SQL查詢語(yǔ)句找出執(zhí)行代價(jià)較高的TSQL



SELECT TextData,Duration,…, FROM Table_Name ORDER BY

  Duration
DESC


  圖 6 查找成本最高的TSQL/存儲(chǔ)過(guò)程



  有效利用SQL事件探查器排除與性能相關(guān)的問(wèn)題


  SQL事件探查器除了可以用于找出執(zhí)行成本最高的那些TSQL或存儲(chǔ)過(guò)程外,還可以利用它許多強(qiáng)大的功能診斷和解決其它不同類(lèi)型的問(wèn)題。當(dāng)你收到一個(gè)性能問(wèn)題報(bào)告后,或者想提前診斷潛在的性能問(wèn)題時(shí)都可以使用SQL事件探查器。下面是一些SQL事件探查器使用技巧,或許對(duì)你有幫助。


  1)使用現(xiàn)有的模板,但需要時(shí)應(yīng)創(chuàng)建你自己的模板


  大多數(shù)時(shí)候現(xiàn)有的模板能夠滿足你的需求,但當(dāng)診斷一個(gè)特殊類(lèi)型的數(shù)據(jù)庫(kù)性能問(wèn)題時(shí)(如數(shù)據(jù)庫(kù)發(fā)生死鎖),你可能需要?jiǎng)?chuàng)建自己的模板,在這種情況下,你可以點(diǎn)擊“文件”*“模板”*“新建模板”創(chuàng)建一個(gè)新模板,需要指定模板名、事件和列。當(dāng)然也可以從現(xiàn)有的模板修改而來(lái)。



  圖 7 創(chuàng)建一個(gè)新模板



  圖 8 為新模板指定事件和列


  2)捕捉表掃描(TableScan)和死鎖(DeadLock)事件


  沒(méi)錯(cuò),你可以使用SQL事件探查器監(jiān)聽(tīng)這兩個(gè)有趣的事件。


  先假設(shè)一種情況,假設(shè)你已經(jīng)在你的測(cè)試庫(kù)上創(chuàng)建了合適的索引,經(jīng)過(guò)測(cè)試后,現(xiàn)在你已經(jīng)將索引應(yīng)用到生產(chǎn)服務(wù)器上了,但由于某些不明原因,生產(chǎn)數(shù)據(jù)庫(kù)的性能一直沒(méi)達(dá)到預(yù)期的那樣好,你推測(cè)執(zhí)行查詢時(shí)發(fā)生了表掃描,你希望有一種方法能夠檢測(cè)出是否真的發(fā)生了表掃描。


  再假設(shè)另一種情況,假設(shè)你已經(jīng)設(shè)置好了將錯(cuò)誤郵件發(fā)送到一個(gè)指定的郵件地址,這樣開(kāi)發(fā)團(tuán)隊(duì)可以第一時(shí)間獲得通知,并有足夠的信息進(jìn)行問(wèn)題診斷。某一天,你突然收到一封郵件說(shuō)數(shù)據(jù)庫(kù)發(fā)生了死鎖,并在郵件中包含了數(shù)據(jù)庫(kù)級(jí)別的錯(cuò)誤代碼,你需要找出是哪個(gè)TSQL創(chuàng)造了死鎖。


  這時(shí)你可以打開(kāi)SQL事件探查器,修改一個(gè)現(xiàn)有模板,使其可以捕捉表掃描和死鎖事件,修改好后,啟動(dòng)事件探查器,運(yùn)行你的應(yīng)用程序,當(dāng)再次發(fā)生表掃描和死鎖事件時(shí),事件探查器就可以捕捉到,利用跟蹤信息就可以找出執(zhí)行代價(jià)最高的TSQL。


  注意:從SQL Server日志文件中可能也可以找到死鎖事件記錄,在某些時(shí)候,你可能需要結(jié)合SQL Server日志和跟蹤信息才能找出引起數(shù)據(jù)庫(kù)死鎖的數(shù)據(jù)庫(kù)對(duì)象和TSQL。



  圖 9 檢測(cè)表掃描



  圖 10 檢測(cè)死鎖


  3)創(chuàng)建重放跟蹤


  某些時(shí)候,為了解決生產(chǎn)數(shù)據(jù)庫(kù)的性能問(wèn)題,你需要在測(cè)試服務(wù)器上模擬一個(gè)生產(chǎn)環(huán)境,這樣可以重演性能問(wèn)題。使用SQL事件探查器的TSQL_Replay模板捕捉生產(chǎn)庫(kù)上的事件,并將跟蹤信息保存為一個(gè).trace文件,然后在測(cè)試服務(wù)器上播放跟蹤文件就可以重現(xiàn)性能問(wèn)題是如何出現(xiàn)的了。



  圖 11 創(chuàng)建重放跟蹤


  4)創(chuàng)建優(yōu)化跟蹤


  數(shù)據(jù)庫(kù)調(diào)優(yōu)顧問(wèn)是一個(gè)偉大的工具,它可以給你提供很好的調(diào)優(yōu)建議,但要真正從它那獲得有用的建議,你需要模擬出與生產(chǎn)庫(kù)一樣的負(fù)載,也就是說(shuō),你需要在測(cè)試服務(wù)器上執(zhí)行相同的TSQL,打開(kāi)相同數(shù)量的并發(fā)連接,然后運(yùn)行調(diào)優(yōu)顧問(wèn)。SQL事件探查器的Tuning模板可以捕捉到這類(lèi)事件和列,使用Tuning模板運(yùn)行事件探查器,捕捉跟蹤信息并保存,通過(guò)調(diào)優(yōu)顧問(wèn)使用跟蹤文件在測(cè)試服務(wù)器上創(chuàng)建相同的負(fù)載。



  圖 12 創(chuàng)建Tuning事件探查器跟蹤


  5)捕捉ShowPlan在事件探查器中包括SQL執(zhí)行計(jì)劃


  有時(shí)相同的查詢?cè)跍y(cè)試服務(wù)器和生產(chǎn)服務(wù)器上的性能完全不一樣,假設(shè)你遇到這種問(wèn)題,你應(yīng)該仔細(xì)查看一下生產(chǎn)數(shù)據(jù)庫(kù)上TSQL的執(zhí)行計(jì)劃。但問(wèn)題是現(xiàn)在不能在生產(chǎn)庫(kù)上執(zhí)行這個(gè)TSQL,因?yàn)樗呀?jīng)有嚴(yán)重的性能問(wèn)題。這時(shí)SQL事件探查器可以派上用場(chǎng),在跟蹤屬性中選中ShowPlan或ShowPlan XML,這樣可以捕捉到SQL執(zhí)行計(jì)劃和TSQL文本,然后在測(cè)試服務(wù)器上執(zhí)行相同的TSQL,并比較兩者的執(zhí)行計(jì)劃。



  圖 13 指定捕捉執(zhí)行計(jì)劃



  圖 14 在事件探查器跟蹤中的執(zhí)行計(jì)劃



  使用性能監(jiān)視工具(PerfMon)診斷性能問(wèn)題


  當(dāng)你的數(shù)據(jù)庫(kù)遇到性能問(wèn)題時(shí),大多數(shù)時(shí)候使用SQL事件探查器就能夠診斷和找出引起性能問(wèn)題的背后原因了,但有時(shí)SQL事件探查器并不是萬(wàn)能的。


  例如,在生產(chǎn)庫(kù)上使用SQL事件探查器分析查詢執(zhí)行時(shí)間時(shí),對(duì)應(yīng)的TSQL執(zhí)行很慢(假設(shè)需要10秒),但同樣的TSQL在測(cè)試服務(wù)器上執(zhí)行時(shí)間卻只要200毫秒,通過(guò)分析執(zhí)行計(jì)劃和數(shù)據(jù)列,發(fā)現(xiàn)它們都沒(méi)有太大的差異,因此在生產(chǎn)庫(kù)上肯定有其它問(wèn)題,那該如何揪出這些問(wèn)題呢?


  此時(shí)性能監(jiān)視工具(著名的PerfMon)可以幫你一把,它可以定期收集硬件和軟件相關(guān)的統(tǒng)計(jì)數(shù)據(jù),還有它是內(nèi)置于Windows操作系統(tǒng)的一個(gè)免費(fèi)的工具。


  當(dāng)你向SQL Server數(shù)據(jù)庫(kù)發(fā)送一條TSQL語(yǔ)句,會(huì)產(chǎn)生許多相關(guān)的執(zhí)行參與者,包括TSQL執(zhí)行引擎,服務(wù)器緩存,SQL優(yōu)化器,輸出隊(duì)列,CPU,磁盤(pán)I/O等,只要這些參與者任何一環(huán)執(zhí)行節(jié)奏沒(méi)有跟上,最終的查詢執(zhí)行時(shí)間就會(huì)變長(zhǎng),使用性能監(jiān)視工具可以對(duì)這些參與者進(jìn)行觀察,以找出根本原因。


  使用性能監(jiān)視工具可以創(chuàng)建多個(gè)不同的性能計(jì)數(shù)器,通過(guò)圖形界面分析計(jì)數(shù)器日志,此外還可以將性能計(jì)數(shù)器日志和SQL事件探查器跟蹤信息結(jié)合起來(lái)分析。


  性能監(jiān)視器基本用法介紹


  Windows內(nèi)置了許多性能監(jiān)視計(jì)數(shù)器,安裝SQL Server時(shí)會(huì)添加一個(gè)SQL Server性能計(jì)數(shù)器,下面是創(chuàng)建一個(gè)性能計(jì)數(shù)器日志的過(guò)程。


  1)在SQL事件探查器中啟動(dòng)性能監(jiān)視工具(“工具”*“性能監(jiān)視器”);



  圖 15 啟動(dòng)性能監(jiān)視工具


  2)點(diǎn)擊“計(jì)數(shù)器日志”*“新建日志設(shè)置”創(chuàng)建一個(gè)新的性能計(jì)數(shù)器日志



  圖 16 創(chuàng)建一個(gè)性能計(jì)數(shù)器日志


  指定日志文件名,點(diǎn)擊“確定”。



  圖 17 為性能計(jì)數(shù)器日志指定名字


  3)點(diǎn)擊“添加計(jì)數(shù)器”按鈕,選擇一個(gè)需要的計(jì)數(shù)器



  圖 18 為性能計(jì)數(shù)器日志指定計(jì)數(shù)器


  4)從列表中選擇要監(jiān)視的對(duì)象和對(duì)應(yīng)的計(jì)數(shù)器,點(diǎn)擊“關(guān)閉”



  圖 19 指定對(duì)象和對(duì)應(yīng)的計(jì)數(shù)器


  5)選擇的計(jì)數(shù)器應(yīng)顯示在窗體中



  圖 20 指定計(jì)數(shù)器


  6)點(diǎn)擊“日志文件”標(biāo)簽,再點(diǎn)擊“配置”按鈕,指定日志文件保存位置,如果需要現(xiàn)在還可以修改日志文件名



  圖 21 指定性能計(jì)數(shù)器日志文件保存位置


  7)點(diǎn)擊“調(diào)度”標(biāo)簽,指定一個(gè)時(shí)間讀取計(jì)數(shù)器性能,寫(xiě)入日志文件,也可以選擇“手動(dòng)”啟動(dòng)和停止計(jì)數(shù)器日志。



  圖 22 指定性能計(jì)數(shù)器日志運(yùn)行時(shí)間


  8)點(diǎn)擊“常規(guī)”標(biāo)簽,指定收集計(jì)數(shù)器數(shù)據(jù)的間隔時(shí)間



  圖 23 設(shè)置計(jì)數(shù)器間隔采樣時(shí)間


  9)點(diǎn)擊“確定”,選擇剛剛創(chuàng)建的計(jì)數(shù)器日志,點(diǎn)擊右鍵啟動(dòng)它。



  圖 24 啟動(dòng)性能計(jì)數(shù)器日志


  10)為了查看日志數(shù)據(jù),再次打開(kāi)性能監(jiān)視工具,點(diǎn)擊查看日志圖標(biāo)(紅色),在“源”標(biāo)簽上選中“日志文件”單選按鈕,點(diǎn)擊“添加”按鈕添加一個(gè)日志文件。



  圖 25 查看性能計(jì)數(shù)器日志


  11)默認(rèn)情況下,在日志輸出中只有三個(gè)計(jì)數(shù)器被選中,點(diǎn)擊“數(shù)據(jù)”標(biāo)簽可以追加其它計(jì)數(shù)器。



  圖 26 查看日志數(shù)據(jù)時(shí)追加計(jì)數(shù)器


  12)點(diǎn)擊“確定”,返回圖形化的性能計(jì)數(shù)器日志輸出界面



  圖 27 查看性能計(jì)數(shù)器日志



  關(guān)聯(lián)性能計(jì)數(shù)器日志和SQL事件探查器跟蹤信息進(jìn)行深入的分析


  通過(guò)SQL事件探查器可以找出哪些SQL執(zhí)行時(shí)間過(guò)長(zhǎng),但它卻不能給出導(dǎo)致執(zhí)行時(shí)間過(guò)長(zhǎng)的上下文信息,但性能監(jiān)視工具可以提供獨(dú)立組件的性能統(tǒng)計(jì)數(shù)據(jù)(即上下文信息),它們正好互補(bǔ)。


  如果相同的查詢?cè)谏a(chǎn)庫(kù)和測(cè)試庫(kù)上的執(zhí)行時(shí)間差別過(guò)大,那說(shuō)明測(cè)試服務(wù)器的負(fù)載,環(huán)境和查詢執(zhí)行上下文都和生產(chǎn)服務(wù)器不一樣,因此需要一種方法來(lái)模擬生產(chǎn)服務(wù)器上的查詢執(zhí)行上下文,這時(shí)就需要結(jié)合SQL事件探查器的跟蹤信息和性能監(jiān)視工具的性能計(jì)數(shù)器日志。


  將二者結(jié)合起來(lái)分析可以更容易找出性能問(wèn)題的根本原因,例如,你可能發(fā)現(xiàn)在生產(chǎn)服務(wù)器上每次查詢都需要10秒,CPU利用率達(dá)到了100%,這時(shí)就應(yīng)該放下SQL調(diào)優(yōu),先調(diào)查一下為什么CPU利用率會(huì)上升到100%。


  關(guān)聯(lián)SQL事件探查器跟蹤信息和性能計(jì)數(shù)器日志的步驟如下:


  1)創(chuàng)建性能計(jì)數(shù)器日志,包括下列常見(jiàn)的性能計(jì)數(shù)器,指定“手動(dòng)”方式啟動(dòng)和停止計(jì)數(shù)器日志:


  --網(wǎng)絡(luò)接口\輸出隊(duì)列長(zhǎng)度


  --處理器\%處理器時(shí)間


  --SQL Server:緩沖管理器\緩沖區(qū)緩存命中率


  --SQL Server:緩沖管理器\頁(yè)面生命周期


  --SQL Server:SQL統(tǒng)計(jì)\批量請(qǐng)求數(shù)/秒


  --SQL Server:SQL統(tǒng)計(jì)\SQL 編譯


  --SQL Server:SQL統(tǒng)計(jì)\SQL 重新編譯/秒


  創(chuàng)建好性能計(jì)數(shù)器日志,但不啟動(dòng)它。


  2)使用SQL事件探查器TSQL Duration模板創(chuàng)建一個(gè)跟蹤,添加“開(kāi)始時(shí)間”和“結(jié)束時(shí)間”列跟蹤,同時(shí)啟動(dòng)事件探查器跟蹤和前一步創(chuàng)建的性能計(jì)數(shù)器日志;


  3)跟蹤到足夠信息后,同時(shí)停掉SQL事件探查器跟蹤和性能計(jì)數(shù)器日志,將SQL事件探查器跟蹤信息保存為一個(gè).trc文件;


  4)關(guān)閉SQL事件探查器跟蹤窗口,再使用事件探查器打開(kāi).trc文件,點(diǎn)擊“文件”*“導(dǎo)入性能數(shù)據(jù)”關(guān)聯(lián)性能計(jì)數(shù)器日志,此時(shí)會(huì)打開(kāi)一個(gè)文件瀏覽器窗口,選擇剛剛保存的性能計(jì)數(shù)器日志文件進(jìn)行關(guān)聯(lián);


  5)在打開(kāi)的窗口中選擇所有計(jì)數(shù)器,點(diǎn)擊“確定”,你將會(huì)看到下圖所示的界面,它同時(shí)顯示SQL事件探查器的跟蹤信息和性能計(jì)數(shù)器日志;



  圖 28 關(guān)聯(lián)SQL事件探查器和性能監(jiān)視工具輸出


  6)在事件探查器跟蹤信息輸出中選擇一條TSQL,你將會(huì)看到一個(gè)紅色豎條,這代表這條TSQL執(zhí)行時(shí)相關(guān)計(jì)數(shù)器的統(tǒng)計(jì)數(shù)據(jù)位置,同樣,點(diǎn)擊性能計(jì)數(shù)器日志輸出曲線中高于正常值的點(diǎn),你會(huì)看到對(duì)應(yīng)的TSQL在SQL事件探查器輸出中也是突出顯示的。


  我相信你學(xué)會(huì)如何關(guān)聯(lián)這兩個(gè)工具的輸出數(shù)據(jù)后,一定會(huì)覺(jué)得非常方便和有趣。


  小結(jié)


  診斷SQL Server性能問(wèn)題的工具和技術(shù)有很多,例如查看SQL Server日志文件,利用調(diào)優(yōu)顧問(wèn)(DTA)獲得調(diào)優(yōu)建議,無(wú)論使用哪種工具,你都需要深入了解內(nèi)部的細(xì)節(jié)原因,只有找出最根本的原因之后,解決性能問(wèn)題才會(huì)得心應(yīng)手。


  本系列最后一篇將介紹如何優(yōu)化數(shù)據(jù)文件和應(yīng)用分區(qū)。



  優(yōu)化技巧主要是面向DBA的,但我認(rèn)為即使是開(kāi)發(fā)人員也應(yīng)該掌握這些技巧,因?yàn)椴皇敲總€(gè)開(kāi)發(fā)團(tuán)隊(duì)都配有專(zhuān)門(mén)的DBA的。


  第九步:合理組織數(shù)據(jù)庫(kù)文件組和文件


  創(chuàng)建SQL Server數(shù)據(jù)庫(kù)時(shí),數(shù)據(jù)庫(kù)服務(wù)器會(huì)自動(dòng)在文件系統(tǒng)上創(chuàng)建一系列的文件,之后創(chuàng)建的每一個(gè)數(shù)據(jù)庫(kù)對(duì)象實(shí)際上都是存儲(chǔ)在這些文件中的。SQL Server有下面三種文件:


  1).mdf文件


  這是最主要的數(shù)據(jù)文件,每個(gè)數(shù)據(jù)庫(kù)只能有一個(gè)主數(shù)據(jù)文件,所有系統(tǒng)對(duì)象都存儲(chǔ)在主數(shù)據(jù)文件中,如果不創(chuàng)建次要數(shù)據(jù)文件,所有用戶對(duì)象(用戶創(chuàng)建的數(shù)據(jù)庫(kù)對(duì)象)也都存儲(chǔ)在主數(shù)據(jù)文件中。


  2).ndf文件


  這些都是次要數(shù)據(jù)文件,它們是可選的,它們存儲(chǔ)的都是用戶創(chuàng)建的對(duì)象。


  3).ldf文件


  這些是事務(wù)日志文件,數(shù)量從一到幾個(gè)不等,它里面存儲(chǔ)的是事務(wù)日志。


  默認(rèn)情況下,創(chuàng)建SQL Server數(shù)據(jù)庫(kù)時(shí)會(huì)自動(dòng)創(chuàng)建主數(shù)據(jù)文件和事務(wù)日志文件,當(dāng)然也可以修改這兩個(gè)文件的屬性,如保存路徑。


  文件組


  為了便于管理和獲得更好的性能,數(shù)據(jù)文件通常都進(jìn)行了合理的分組,創(chuàng)建一個(gè)新的SQL Server數(shù)據(jù)庫(kù)時(shí),會(huì)自動(dòng)創(chuàng)建主文件組,主數(shù)據(jù)文件就包含在主文件組中,主文件組也被設(shè)為默認(rèn)組,因此所有新創(chuàng)建的用戶對(duì)象都自動(dòng)存儲(chǔ)在主文件組中(具體說(shuō)就是存儲(chǔ)在主數(shù)據(jù)文件中)。


  如果你想將你的用戶對(duì)象(表、視圖、存儲(chǔ)過(guò)程和函數(shù)等)存儲(chǔ)在次要數(shù)據(jù)文件中,那需要:


  1)創(chuàng)建一個(gè)新的文件組,并將其設(shè)為默認(rèn)文件組;


  2)創(chuàng)建一個(gè)新的數(shù)據(jù)文件(.ndf),將其歸于第一步創(chuàng)建的新文件組中。


  以后創(chuàng)建的對(duì)象就會(huì)全部存儲(chǔ)在次要文件組中了。


  注意:事務(wù)日志文件不屬于任何文件組。


  文件/文件組組織最佳實(shí)踐


  如果你的數(shù)據(jù)庫(kù)不大,那么默認(rèn)的文件/文件組應(yīng)該就能滿足你的需要,但如果你的數(shù)據(jù)庫(kù)變得很大時(shí)(假設(shè)有1000MB),你可以(應(yīng)該)對(duì)文件/文件組進(jìn)行調(diào)整以獲得更好的性能,調(diào)整文件/文件組的最佳實(shí)踐內(nèi)容如下:


  1)主文件組必須完全獨(dú)立,它里面應(yīng)該只存儲(chǔ)系統(tǒng)對(duì)象,所有的用戶對(duì)象都不應(yīng)該放在主文件組中。主文件組也不應(yīng)該設(shè)為默認(rèn)組,將系統(tǒng)對(duì)象和用戶對(duì)象分開(kāi)可以獲得更好的性能;


  2)如果有多塊硬盤(pán),可以將每個(gè)文件組中的每個(gè)文件分配到每塊硬盤(pán)上,這樣可以實(shí)現(xiàn)分布式磁盤(pán)I/O,大大提高數(shù)據(jù)讀寫(xiě)速度;


  3)將訪問(wèn)頻繁的表及其索引放到一個(gè)單獨(dú)的文件組中,這樣讀取表數(shù)據(jù)和索引都會(huì)更快;


  4)將訪問(wèn)頻繁的包含Text和Image數(shù)據(jù)類(lèi)型的列的表放到一個(gè)單獨(dú)的文件組中,最好將其中的Text和Image列數(shù)據(jù)放在一個(gè)獨(dú)立的硬盤(pán)中,這樣檢索該表的非Text和Image列時(shí)速度就不會(huì)受Text和Image列的影響;


  5)將事務(wù)日志文件放在一個(gè)獨(dú)立的硬盤(pán)上,千萬(wàn)不要和數(shù)據(jù)文件共用一塊硬盤(pán),日志操作屬于寫(xiě)密集型操作,因此保證日志寫(xiě)入具有良好的I/O性能非常重要;


  6)將“只讀”表單獨(dú)放到一個(gè)獨(dú)立的文件組中,同樣,將“只寫(xiě)”表單獨(dú)放到一個(gè)文件組中,這樣只讀表的檢索速度會(huì)更快,只寫(xiě)表的更新速度也會(huì)更快;


  7)不要過(guò)度使用SQL Server的“自動(dòng)增長(zhǎng)”特性,因?yàn)樽詣?dòng)增長(zhǎng)的成本其實(shí)是很高的,設(shè)置“自動(dòng)增長(zhǎng)”值為一個(gè)合適的值,如一周,同樣,也不要過(guò)度頻繁地使用“自動(dòng)收縮”特性,最好禁用掉自動(dòng)收縮,改為手工收縮數(shù)據(jù)庫(kù)大小,或使用調(diào)度操作,設(shè)置一個(gè)合理的時(shí)間間隔,如一個(gè)月。



  第十步:在大表上應(yīng)用分區(qū)


  什么是表分區(qū)?


  表分區(qū)就是將大表拆分成多個(gè)小表,以免檢索數(shù)據(jù)時(shí)掃描的數(shù)據(jù)太多,這個(gè)思想?yún)⒖剂恕胺侄沃钡睦碚摗?/P>

  當(dāng)你的數(shù)據(jù)庫(kù)中有一個(gè)大表(假設(shè)有上百萬(wàn)行記錄),如果其它優(yōu)化技巧都用上了,但查詢速度仍然非常慢時(shí),你就應(yīng)該考慮對(duì)這個(gè)表進(jìn)行分區(qū)了。首先來(lái)看一下分區(qū)的類(lèi)型:


  水平分區(qū):假設(shè)有一個(gè)表包括千萬(wàn)行記錄,為了便于理解,假設(shè)表有一個(gè)自動(dòng)增長(zhǎng)的主鍵字段(如id),我們可以將表拆分成10個(gè)獨(dú)立的分區(qū)表,每個(gè)分區(qū)包含100萬(wàn)行記錄,分區(qū)就要依據(jù)id字段的值實(shí)施,即第一個(gè)分區(qū)包含id值從1-1000000的記錄,第二個(gè)分區(qū)包含1000001-2000000的記錄,以此類(lèi)推。這種以水平方向分割表的方式就叫做水平分區(qū)。


  垂直分區(qū):假設(shè)有一個(gè)表的列數(shù)和行數(shù)都非常多,其中某些列被經(jīng)常訪問(wèn),其余的列不是經(jīng)常訪問(wèn)。由于表非常大,所有檢索操作都很慢,因此需要基于頻繁訪問(wèn)的列進(jìn)行分區(qū),這樣我們可以將這個(gè)大表拆分成多個(gè)小表,每個(gè)小表由大表的一部分列組成,這種垂直拆分表的方法就叫做垂直分區(qū)。


  另一個(gè)垂直分區(qū)的原則是按有索引的列無(wú)索引列進(jìn)行拆分,但這種分區(qū)法需要小心,因?yàn)槿绻魏尾樵兌忌婕暗綑z索這兩個(gè)分區(qū),SQL引擎不得不連接這兩個(gè)分區(qū),那樣的話性能反而會(huì)低。


  本文主要對(duì)水平分區(qū)做一介紹。


  分區(qū)最佳實(shí)踐


  1)將大表分區(qū)后,將每個(gè)分區(qū)放在一個(gè)獨(dú)立的文件中,并將這個(gè)文件存放在獨(dú)立的硬盤(pán)上,這樣數(shù)據(jù)庫(kù)引擎可以同時(shí)并行檢索多塊硬盤(pán)上的不同數(shù)據(jù)文件,提高并發(fā)讀寫(xiě)速度;


  2)對(duì)于歷史數(shù)據(jù),可以考慮基于歷史數(shù)據(jù)的“年齡”進(jìn)行分區(qū),例如,假設(shè)表中存儲(chǔ)的是訂單數(shù)據(jù),可以使用訂單日期列作為分區(qū)的依據(jù),如將每年的訂單數(shù)據(jù)做成一個(gè)分區(qū)。


  如何分區(qū)?


  假設(shè)Order表中包含了四年(1999-2002)的訂單數(shù)據(jù),有上百萬(wàn)的記錄,那如果要對(duì)這個(gè)表進(jìn)行分區(qū),采取的步驟如下:


  1)添加文件組


  使用下面的命令創(chuàng)建一個(gè)文件組:


  ALTER DATABASE OrderDB ADD FILEGROUP [1999]


  ALTER DATABASE OrderDB ADD FILE (NAME = N'1999', FILENAME


  = N'C:\OrderDB\1999.ndf', SIZE = 5MB, MAXSIZE = 100MB, FILEGROWTH = 5MB) TO


  FILEGROUP [1999]


  通過(guò)上面的語(yǔ)句我們添加了一個(gè)文件組1999,然后增加了一個(gè)次要數(shù)據(jù)文件“C:\OrderDB\1999.ndf”到這個(gè)文件組中。


  使用上面的命令再創(chuàng)建三個(gè)文件組2000,2001和2002,每個(gè)文件組存儲(chǔ)一年的銷(xiāo)售數(shù)據(jù)。


  2)創(chuàng)建分區(qū)函數(shù)


  分區(qū)函數(shù)是定義分界點(diǎn)的一個(gè)對(duì)象,使用下面的命令創(chuàng)建分區(qū)函數(shù):


  CREATE PARTITION FUNCTION FNOrderDateRange (DateTime) AS


  RANGE LEFT FOR VALUES ('19991231', '20001231', '20011231')


  上面的分區(qū)函數(shù)指定:


  DateTime<=1999/12/31的記錄進(jìn)入第一個(gè)分區(qū);


  DateTime > 1999/12/31 且 <= 2000/12/31的記錄進(jìn)入第二個(gè)分區(qū);


  DateTime > 2000/12/31 且 <= 2001/12/31的記錄進(jìn)入第三個(gè)分區(qū);


  DateTime > 2001/12/31的記錄進(jìn)入第四個(gè)分區(qū)。


  RANGE LEFT指定應(yīng)該進(jìn)入左邊分區(qū)的邊界值,例如小于或等于1999/12/31的值都應(yīng)該進(jìn)入第一個(gè)分區(qū),下一個(gè)值就應(yīng)該進(jìn)入第二個(gè)分區(qū)了。如果使用RANGE RIGHT,邊界值以及大于邊界值的值都應(yīng)該進(jìn)入右邊的分區(qū),因此在這個(gè)例子中,邊界值2000/12/31就應(yīng)該進(jìn)入第二個(gè)分區(qū),小于這個(gè)邊界值的值就應(yīng)該進(jìn)入第一個(gè)分區(qū)。


  3)創(chuàng)建分區(qū)方案


  通過(guò)分區(qū)方案在表/索引的分區(qū)和存儲(chǔ)它們的文件組之間建立映射關(guān)系。創(chuàng)建分區(qū)方案的命令如下:


  CREATE PARTITION SCHEME OrderDatePScheme AS PARTITION FNOrderDateRange


  TO ([1999], [2000], [2001], [2002])


  在上面的命令中,我們指定了:


  第一個(gè)分區(qū)應(yīng)該進(jìn)入1999文件組;


  第二個(gè)分區(qū)就進(jìn)入2000文件組;


  第三個(gè)分區(qū)進(jìn)入2001文件組;


  第四個(gè)分區(qū)進(jìn)入2002文件組。


  4)在表上應(yīng)用分區(qū)


  至此,我們定義了必要的分區(qū)原則,現(xiàn)在需要做的就是給表分區(qū)了。首先使用DROP INDEX命令刪除表上現(xiàn)有的聚集索引,通常主鍵上有聚集索引,如果是刪除主鍵上的索引,還可以通過(guò)DROP CONSTRAINT刪除主鍵來(lái)間接刪除主鍵上的索引,如下面的命令刪除PK_Orders主鍵:


  ALTER TABLE Orders DROP CONSTRAINT PK_Orders;


  在分區(qū)方案上重新創(chuàng)建聚集索引,命令如下:


  CREATE UNIQUE CLUSTERED INDEX PK_Orders ON Orders(OrderDate) ON


  OrderDatePScheme (OrderDate)


  假設(shè)OrderDate列的數(shù)據(jù)在表中是唯一的,表將基于分區(qū)方案OrderDatePScheme被分區(qū),最終被分成四個(gè)小的部分,存放在四個(gè)文件組中。如果你對(duì)如何分區(qū)還有不清楚的地方,建議你去看看微軟的官方文章“SQL Server 2005中的分區(qū)表和索引”(地址:http://msdn.microsoft.com/en-us/library/ms345146%28SQL.90%29.aspx)。



  第十一步:使用TSQL模板更好地管理DBMS對(duì)象(額外的一步)


  為了更好地管理DBMS對(duì)象(存儲(chǔ)過(guò)程,函數(shù),視圖,觸發(fā)器等),需要遵循一致的結(jié)構(gòu),但由于某些原因(主要是時(shí)間限制),我們未能維護(hù)一個(gè)一致的結(jié)構(gòu),因此后來(lái)遇到性能問(wèn)題或其它原因需要重新調(diào)試這些代碼時(shí),那感覺(jué)就像是做噩夢(mèng)。


  為了幫助大家更好地管理DBMS對(duì)象,我創(chuàng)建了一些TSQL模板,利用這些模板你可以快速地開(kāi)發(fā)出結(jié)構(gòu)一致的DBMS對(duì)象。


  如果你的團(tuán)隊(duì)有人專(zhuān)門(mén)負(fù)責(zé)檢查團(tuán)隊(duì)成員編寫(xiě)的TSQL代碼,在這些模板中專(zhuān)門(mén)有一個(gè)“審查”段落用來(lái)描寫(xiě)審查意見(jiàn)。


  我提交幾個(gè)常見(jiàn)的DBMS對(duì)象模板,它們是:


   Template_StoredProcedure.txt:存儲(chǔ)過(guò)程模板(http://www.codeproject.com/KB/database/OrganizeFilesAndPartition/Template_StoredProcedure.txt)


   Template_View.txt:視圖模板(http://www.codeproject.com/KB/database/OrganizeFilesAndPartition/Template_Trigger.txt)


   Template_Trigger.txt:觸發(fā)器模板(http://www.codeproject.com/KB/database/OrganizeFilesAndPartition/Template_ScalarFunction.txt)


   Template_ScalarFunction.txt:標(biāo)量函數(shù)模板(http://www.codeproject.com/KB/database/OrganizeFilesAndPartition/Template_TableValuedFunction.txt)


   emplate_TableValuedFunction.txt:表值函數(shù)模板(http://www.codeproject.com/KB/database/OrganizeFilesAndPartition/Template_View.txt)


  1)如何創(chuàng)建模板?


   首先下載前面給出的模板代碼,然打開(kāi)SQL Server管理控制臺(tái),點(diǎn)擊“查看”*“模板瀏覽器”;


   點(diǎn)擊“存儲(chǔ)過(guò)程”節(jié)點(diǎn),點(diǎn)擊右鍵,在彈出的菜單中選擇“新建”*“模板”,為模板取一個(gè)易懂的名字;


   在新創(chuàng)建的模板上點(diǎn)擊右鍵,選擇“編輯”,在彈出的窗口中輸入身份驗(yàn)證信息,點(diǎn)擊“連接”;


   連接成功后,在編輯器中打開(kāi)下載的Template_StoredProcedure.txt,拷貝文件中的內(nèi)容粘貼到新建的模板中,然后點(diǎn)擊“保存”。


  上面是創(chuàng)建一個(gè)存儲(chǔ)過(guò)程模板的過(guò)程,創(chuàng)建其它DBMS對(duì)象過(guò)程類(lèi)似。


  2)如何使用模板?


  創(chuàng)建好模板后,下面就演示如何使用模板了。


   首先在模板瀏覽器中,雙擊剛剛創(chuàng)建的存儲(chǔ)過(guò)程模板,彈出身份驗(yàn)證對(duì)話框,輸入對(duì)應(yīng)的身份信息,點(diǎn)擊“連接”;


   連接成功后,模板將會(huì)在編輯器中打開(kāi),變量將會(huì)賦上適當(dāng)?shù)闹?


   按Ctrl+Shift+M為模板指定值,如下圖所示;



  圖 1 為模板參數(shù)指定值


   點(diǎn)擊“OK”,然后在SQL Server管理控制臺(tái)中選擇目標(biāo)數(shù)據(jù)庫(kù),然后點(diǎn)擊“執(zhí)行”按鈕;


  如果一切順利,存儲(chǔ)過(guò)程就創(chuàng)建成功了。你可以根據(jù)上面的步驟創(chuàng)建其它DBMS對(duì)象。


  小結(jié)


  優(yōu)化講究的是一種“心態(tài)”,在優(yōu)化數(shù)據(jù)庫(kù)性能時(shí),首先要相信性能問(wèn)題總是可以解決的,然后就是結(jié)合經(jīng)驗(yàn)和最佳實(shí)踐努力進(jìn)行優(yōu)化,最重要的是要盡量預(yù)防性能問(wèn)題的發(fā)生,在開(kāi)發(fā)和部署期間,要利用一切可利用的技術(shù)和經(jīng)驗(yàn)進(jìn)行提前評(píng)估,千萬(wàn)不要等問(wèn)題出現(xiàn)了才去想辦法解決,在開(kāi)發(fā)期間多花一個(gè)小時(shí)實(shí)施最佳實(shí)踐,最后可能會(huì)給你節(jié)約上百小時(shí)的故障診斷和排除時(shí)間,要學(xué)會(huì)聰明地工作,而不是辛苦地工作!


 


該文章在 2011/3/15 0:25:33 編輯過(guò)
關(guān)鍵字查詢
相關(guān)文章
正在查詢...
點(diǎn)晴ERP是一款針對(duì)中小制造業(yè)的專(zhuān)業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國(guó)內(nèi)大量中小企業(yè)的青睞。
點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對(duì)港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場(chǎng)、車(chē)隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報(bào)表等業(yè)務(wù)管理,結(jié)合碼頭的業(yè)務(wù)特點(diǎn),圍繞調(diào)度、堆場(chǎng)作業(yè)而開(kāi)發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體,是物流碼頭及其他港口類(lèi)企業(yè)的高效ERP管理信息系統(tǒng)。
點(diǎn)晴WMS倉(cāng)儲(chǔ)管理系統(tǒng)提供了貨物產(chǎn)品管理,銷(xiāo)售管理,采購(gòu)管理,倉(cāng)儲(chǔ)管理,倉(cāng)庫(kù)管理,保質(zhì)期管理,貨位管理,庫(kù)位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號(hào)管理軟件。
點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi),不限功能、不限時(shí)間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。
Copyright 2010-2025 ClickSun All Rights Reserved