50種方法優化SQL Server數據庫查詢

  

50種方法優化SQL Server數據庫查詢(有N多錯別字)
http://database.51cto.com/art/200612/35820.htm
查詢速度慢的原因很多,常見如下幾種:
  
  1、沒有索引或者沒有用到索引(這是查詢慢最常見的問題,是程序設計的缺陷)
  
  2、I/O吞吐量小,形成了瓶頸效應。
  
  3、沒有創建計算列導致查詢不優化。
  
  4、內存不足
  
  5、網絡速度慢
  
  6、查詢出的數據量過大(可以採用多次查詢,其他的方法降低數據量)
  
  7、鎖或者死鎖(這也是查詢慢最常見的問題,是程序設計的缺陷)
  
  8、sp_lock,sp_who,活動的用戶查看,原因是讀寫競爭資源。
  
  9、返回了不必要的行和列
  
  10、查詢語句不好,沒有優化
  可以通過如下方法來優化查詢 :
  
  1、把數據、日誌、索引放到不同的I/O設備上,增加讀取速度,以前可以將Tempdb應放在RAID0上,SQL2000不在支持。數據量(尺寸)越大,提高I/O越重要.
  
  2、縱向、橫向分割表,減少表的尺寸(sp_spaceuse)
  
  3、升級硬件
  
  4、根據查詢條件,建立索引,優化索引、優化訪問方式,限制結果集的數據量。注意填充因子要適當(最好是使用默認值0)。索引應該儘量小,使用字節數小的列建索引好(參照索引的創建),不要對有限的幾個值的字段建單一索引如性別字段
  
  5、提高網速;
  
  6、擴大服務器的內存,Windows 2000和SQL server 2000能支持4-8G的內存。配置虛擬內存:虛擬內存大小應基於計算機上併發運行的服務進行配置。運行 Microsoft SQL Server? 2000 時,可考慮將虛擬內存大小設置爲計算機中安裝的物理內存的 1.5 倍。如果另外安裝了全文檢索功能,並打算運行 Microsoft 搜索服務以便執行全文索引和查詢,可考慮:將虛擬內存大小配置爲至少是計算機中安裝的物理內存的 3 倍。將 SQL Server max server memory 服務器配置選項配置爲物理內存的 1.5 倍(虛擬內存大小設置的一半)。
  
  7、增加服務器 CPU個數;但是必須明白並行處理串行處理更需要資源例如內存。使用並行還是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務,就可以在處理器上運行。例如耽擱查詢的排序、連接、掃描和GROUP BY字句同時執行,SQL SERVER根據系統的負載情況決定最優的並行等級,複雜的需要消耗大量的CPU的查詢最適合並行處理。但是更新操作Update,Insert, Delete還不能並行處理。
  
  8、如果是使用like進行查詢的話,簡單的使用index是不行的,但是全文索引,耗空間。 like 'a%' 使用索引 like '%a' 不使用索引用 like '%a%' 查詢時,查詢耗時和字段值總長度成正比,所以不能用CHAR類型,而是VARCHAR。對於字段的值很長的建全文索引。
  
  9、DB Server 和APPLication Server 分離;OLTP和OLAP分離
  
  10、分佈式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器,但它們相互協作分擔系統的處理負荷。這種通過分區數據形成數據庫服務器聯合體的機制能夠擴大一組服務器,以支持大型的多層 Web 站點的處理需要。有關更多信息,參見設計聯合數據庫服務器。(參照SQL幫助文件'分區視圖')
  
  a、在實現分區視圖之前,必須先水平分區表
  
  b、在創建成員表後,在每個成員服務器上定義一個分佈式分區視圖,並且每個視圖具有相同的名稱。這樣,引用分佈式分區視圖名的查詢可以在任何一個成員服務器上運行。系統操作如同每個成員服務器上都有一個原始表的複本一樣,但其實每個服務器上只有一個成員表和一個分佈式分區視圖。數據的位置對應用程序是透明的。
  
  11、重建索引 DBCC REINDEX ,DBCC INDEXDEFRAG,收縮數據和日誌 DBCC SHRINKDB,DBCC SHRINKFILE. 設置自動收縮日誌.對於大的數據庫不要設置數據庫自動增長,它會降低服務器的性能。在T-sql的寫法上有很大的講究,下面列出常見的要點:首先, DBMS處理查詢計劃的過程是這樣的:
  
  1、 查詢語句的詞法、語法檢查
  
  2、 將語句提交給DBMS的查詢優化器
  
  3、 優化器做代數優化和存取路徑的優化
  
  4、 由預編譯模塊生成查詢規劃
  
  5、 然後在合適的時間提交給系統處理執行
  
  6、 最後將執行結果返回給用戶其次,看一下SQL SERVER的數據存放的結構:一個頁面的大小爲8K(8060)字節,8個頁面爲一個盤區,按照B樹存放。
  
  12、Commit和rollback的區別 Rollback:回滾所有的事物。 Commit:提交當前的事物. 沒有必要在動態SQL裏寫事物,如果要寫請寫在外面如: begin tran exec(@s) commit trans 或者將動態SQL 寫成函數或者存儲過程。
  
  13、在查詢Select語句中用Where字句限制返回的行數,避免表掃描,如果返回不必要的數據,浪費了服務器的I/O資源,加重了網絡的負擔降低性能。如果表很大,在表掃描的期間將表鎖住,禁止其他的聯接訪問表,後果嚴重。
  
  14、SQL的註釋申明對執行沒有任何影響
  15、儘可能不使用光標,它佔用大量的資源。如果需要row-by-row地執行,儘量採用非光標技術,如:在客戶端循環,用臨時表,Table變量,用子查詢,用Case語句等等。遊標可以按照它所支持的提取選項進行分類: 只進 必須按照從第一行到最後一行的順序提取行。FETCH NEXT 是唯一允許的提取操作,也是默認方式。可滾動性可以在遊標中任何地方隨機提取任意行。遊標的技術在SQL2000下變得功能很強大,他的目的是支持循環。有四個併發選項 READ_ONLY:不允許通過遊標定位更新(Update),且在組成結果集的行中沒有鎖。 OPTIMISTIC WITH valueS:樂觀併發控制是事務控制理論的一個標準部分。樂觀併發控制用於這樣的情形,即在打開遊標及更新行的間隔中,只有很小的機會讓第二個用戶更新某一行。當某個遊標以此選項打開時,沒有鎖控制其中的行,這將有助於最大化其處理能力。如果用戶試圖修改某一行,則此行的當前值會與最後一次提取此行時獲取的值進行比較。如果任何值發生改變,則服務器就會知道其他人已更新了此行,並會返回一個錯誤。如果值是一樣的,服務器就執行修改。選擇這個併發選項 ?OPTIMISTIC WITH ROW VERSIONING:此樂觀併發控制選項基於行版本控制。使用行版本控制,其中的表必須具有某種版本標識符,服務器可用它來確定該行在讀入遊標後是否有所更改。在 SQL Server 中,這個性能由 timestamp 數據類型提供,它是一個二進制數字,表示數據庫中更改的相對順序。每個數據庫都有一個全局當前時間戳值:@@DBTS。每次以任何方式更改帶有 timestamp 列的行時,SQL Server 先在時間戳列中存儲當前的 @@DBTS 值,然後增加 @@DBTS 的值。如果某 個表具有 timestamp 列,則時間戳會被記到行級。服務器就可以比較某行的當前時間戳值和上次提取時所存儲的時間戳值,從而確定該行是否已更新。服務器不必比較所有列的值,只需比較 timestamp 列即可。如果應用程序對沒有 timestamp 列的表要求基於行版本控制的樂觀併發,則遊標默認爲基於數值的樂觀併發控制。 SCROLL LOCKS 這個選項實現悲觀併發控制。在悲觀併發控制中,在把數據庫的行讀入遊標結果集時,應用程序將試圖鎖定數據庫行。在使用服務器遊標時,將行讀入遊標時會在其上放置一個更新鎖。如果在事務內打開遊標,則該事務更新鎖將一直保持到事務被提交或回滾;當提取下一行時,將除去遊標鎖。如果在事務外打開遊標,則提取下一行時,鎖就被丟棄。因此,每當用戶需要完全的悲觀併發控制時,遊標都應在事務內打開。更新鎖將阻止任何其它任務獲取更新鎖或排它鎖,從而阻止其它任務更新該行。然而,更新鎖並不阻止共享鎖,所以它不會阻止其它任務讀取行,除非第二個任務也在要求帶更新鎖的讀取。滾動鎖根據在遊標定義的 Select 語句中指定的鎖提示,這些遊標併發選項可以生成滾動鎖。滾動鎖在提取時在每行上獲取,並保持到下次提取或者遊標關閉,以先發生者爲準。下次提取時,服務器爲新提取中的行獲取滾動鎖,並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖,並可以保持到一個提交或回滾操作之後。如果提交時關閉遊標的選項爲關,則 COMMIT 語句並不關閉任何打開的遊標,而且滾動鎖被保留到提交之後,以維護對所提取數據的隔離。所獲取滾動鎖的類型取決於遊標併發選項和遊標 Select 語句中的鎖提示。鎖提示 只讀 樂觀數值 樂觀行版本控制 鎖定無提示 未鎖定 未鎖定 未鎖定 更新 NOLOCK 未鎖定未鎖定未鎖定 未鎖定 HOLDLOCK 共享 共享 共享 更新 UPDLOCK 錯誤 更新 更新 更新 TABLOCKX 錯誤 未鎖定未鎖定更新其它 未鎖定 未鎖定 未鎖定 更新 *指定 NOLOCK 提示將使指定了該提示的表在遊標內是隻讀的。
  
  16、用Profiler來跟蹤查詢,得到查詢所需的時間,找出SQL的問題所在;用索引優化器優化索引
  
  17、注意UNion和UNion all 的區別。UNION all好
  
  18、注意使用DISTINCT,在沒有必要時不要用,它同UNION一樣會使查詢變慢。重複的記錄在查詢裏是沒有問題的
  
  19、查詢時不要返回不需要的行、列
  
  20、用sp_configure 'query governor cost limit'或者SET QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時,服務器自動取消查詢,在查詢之前就扼殺掉。 SET LOCKTIME設置鎖的時間
  
  21、用select top 100 / 10 Percent 來限制用戶返回的行數或者SET ROWCOUNT來限制操作的行
  
  22、在SQL2000以前,一般不要用如下的字句: "IS NULL", "<>", "!=", "!>", "!<", "NOT", "NOT EXISTS", "NOT IN", "NOT LIKE", and "LIKE '%500'",因爲他們不走索引全是表掃描。也不要在Where字句中的列名加函數,如Convert,substring等,如果必須用函數的時候,創建計算列再創建索引來替代.還可以變通寫法:Where SUBSTRING(firstname,1,1) = 'm'改爲Where firstname like 'm%'(索引掃描),一定要將函數和列名分開。並且索引不能建得太多和太大。NOT IN會多次掃描表,使用EXISTS、NOT EXISTS ,IN , LEFT OUTER JOIN 來替代,特別是左連接,而Exists比IN更快,最慢的是NOT操作.如果列的值含有空,以前它的索引不起作用,現在2000的優化器能夠處理了。相同的是IS NULL,"NOT", "NOT EXISTS", "NOT IN"能優化她,而"<>"等還是不能優化,用不到索引。
  
  23、使用Query Analyzer,查看SQL語句的查詢計劃和評估分析是否是優化的SQL。一般的20%的代碼佔據了80%的資源,我們優化的重點是這些慢的地方。
  
  24、如果使用了IN或者OR等時發現查詢沒有走索引,使用顯示申明指定索引: Select * FROM PersonMember (INDEX = IX_Title) Where processid IN (男,'女)
  
  25、將需要查詢的結果預先計算好放在表中,查詢的時候再Select。這在SQL7.0以前是最重要的手段。例如醫院的住院費計算。
  
  26、MIN() 和 MAX()能使用到合適的索引。
  
  27、數據庫有一個原則是代碼離數據越近越好,所以優先選擇Default,依次爲Rules,Triggers, Constraint(約束如外健主健CheckUNIQUE……,數據類型的最大長度等等都是約束),Procedure.這樣不僅維護工作小,編寫程序質量高,並且執行的速度快。
  
  28、如果要插入大的二進制值到Image列,使用存儲過程,千萬不要用內嵌Insert來插入(不知JAVA是否)。因爲這樣應用程序首先將二進制值轉換成字符串(尺寸是它的兩倍),服務器受到字符後又將他轉換成二進制值.存儲過程就沒有這些動作: 方法:Create procedure p_insert as insert into table(Fimage) values (@image), 在前臺調用這個存儲過程傳入二進制參數,這樣處理速度明顯改善。
  
  29、Between在某些時候比IN 速度更快,Between能夠更快地根據索引找到範圍。用查詢優化器可見到差別。 select * from chineseresume where title in (男,女') Select * from chineseresume where between 男 and 女 是一樣的。由於in會在比較多次,所以有時會慢些。
  
  30、在必要是對全局或者局部臨時表創建索引,有時能夠提高速度,但不是一定會這樣,因爲索引也耗費大量的資源。他的創建同是實際表一樣。
  
  31、不要建沒有作用的事物例如產生報表時,浪費資源。只有在必要使用事物時使用它。
  
  32、用OR的字句可以分解成多個查詢,並且通過UNION 連接多個查詢。他們的速度只同是否使用索引有關,如果查詢需要用到聯合索引,用UNION all執行的效率更高.多個OR的字句沒有用到索引,改寫成UNION的形式再試圖與索引匹配。一個關鍵的問題是否用到索引。
  
   33、儘量少用視圖,它的效率低。對視圖操作比直接對錶操作慢,可以用stored procedure來代替她。特別的是不要用視圖嵌套,嵌套視圖增加了尋找原始資料的難度。我們看視圖的本質:它是存放在服務器上的被優化好了的已經產生了查詢規劃的SQL。對單個表檢索數據時,不要使用指向多個表的視圖,直接從表檢索或者僅僅包含這個表的視圖上讀,否則增加了不必要的開銷,查詢受到干擾.爲了加快視圖的查詢,MsSQL增加了視圖索引的功能。
  
  34、沒有必要時不要用DISTINCT和ORDER BY,這些動作可以改在客戶端執行。它們增加了額外的開銷。這同UNION 和UNION ALL一樣的道理。select top 20 ad.companyname,comid,position,ad.referenceid,worklocation, convert(varchar(10),ad.postDate,120) as postDate1,workyear,degreedescription FROM jobcn_query.dbo.COMPANYAD_query ad where referenceID in('JCNAD00329667','JCNAD132168','JCNAD00337748','JCNAD00338345',
  'JCNAD00333138','JCNAD00303570','JCNAD00303569',
  'JCNAD00303568','JCNAD00306698','JCNAD00231935','JCNAD00231933',
  'JCNAD00254567','JCNAD00254585','JCNAD00254608',
  'JCNAD00254607','JCNAD00258524','JCNAD00332133','JCNAD00268618',
  JCNAD00279196','JCNAD00268613') order by postdate desc
  
  35、在IN後面值的列表中,將出現最頻繁的值放在最前面,出現得最少的放在最後面,減少判斷的次數。
  
  36、當用Select INTO時,它會鎖住系統表(sysobjects,sysindexes等等),阻塞其他的連接的存取。創建臨時表時用顯示申明語句,而不是 select INTO. drop table t_lxh begin tran select * into t_lxh from chineseresume where name = 'XYZ' --commit 在另一個連接中Select * from sysobjects可以看到 Select INTO 會鎖住系統表,Create table 也會鎖系統表(不管是臨時表還是系統表)。所以千萬不要在事物內使用它!!!這樣的話如果是經常要用的臨時表請使用實表,或者臨時表變量。
  
  37、一般在GROUP BY 個HAVING字句之前就能剔除多餘的行,所以儘量不要用它們來做剔除行的工作。他們的執行順序應該如下最優:select 的Where字句選擇所有合適的行,Group By用來分組個統計行,Having字句用來剔除多餘的分組。這樣Group By 個Having的開銷小,查詢快.對於大的數據行進行分組和Having十分消耗資源。如果Group BY的目的不包括計算,只是分組,那麼用Distinct更快
  
  38、一次更新多條記錄比分多次更新每次一條快,就是說批處理好
  
  39、少用臨時表,儘量用結果集和Table類性的變量來代替它,Table 類型的變量比臨時表好
  
  40、在SQL2000下,計算字段是可以索引的,需要滿足的條件如下:
  
  a、計算字段的表達是確定的
  
  b、不能用在TEXT,Ntext,Image數據類型
  
  c、必須配製如下選項 ANSI_NULLS = ON, ANSI_PADDINGS = ON, …….
  
  41、儘量將數據的處理工作放在服務器上,減少網絡的開銷,如使用存儲過程。存儲過程是編譯好、優化過、並且被組織到一個執行規劃裏、且存儲在數據庫中的SQL語句,是控制流語言的集合,速度當然快。反覆執行的動態SQL,可以使用臨時存儲過程,該過程(臨時表)被放在Tempdb中。以前由於SQL SERVER對複雜的數學計算不支持,所以不得不將這個工作放在其他的層上而增加網絡的開銷。SQL2000支持UDFs,現在支持複雜的數學計算,函數的返回值不要太大,這樣的開銷很大。用戶自定義函數象光標一樣執行的消耗大量的資源,如果返回大的結果採用存儲過程
  
  42、不要在一句話裏再三的使用相同的函數,浪費資源,將結果放在變量裏再調用更快
  
  43、Select COUNT(*)的效率教低,儘量變通他的寫法,而EXISTS快.同時請注意區別: select count(Field of null) from Table 和 select count(Field of NOT null) from Table 的返回值是不同的!!!
  
  44、當服務器的內存夠多時,配製線程數量 = 最大連接數+5,這樣能發揮最大的效率;否則使用 配製線程數量<最大連接數啓用SQL SERVER的線程池來解決,如果還是數量 = 最大連接數+5,嚴重的損害服務器的性能。
  
  45、按照一定的次序來訪問你的表。如果你先鎖住表A,再鎖住表B,那麼在所有的存儲過程中都要按照這個順序來鎖定它們。如果你(不經意的)某個存儲過程中先鎖定表B,再鎖定表A,這可能就會導致一個死鎖。如果鎖定順序沒有被預先詳細的設計好,死鎖很難被發現
  
  46、通過SQL Server Performance Monitor監視相應硬件的負載 Memory: Page Faults / sec計數器如果該值偶爾走高,表明當時有線程競爭內存。如果持續很高,則內存可能是瓶頸。
  Process:
  
  1、% DPC Time 指在範例間隔期間處理器用在緩延程序調用(DPC)接收和提供服務的百分比。(DPC 正在運行的爲比標準間隔優先權低的間隔)。 由於 DPC 是以特權模式執行的,DPC 時間的百分比爲特權時間百分比的一部分。這些時間單獨計算並且不屬於間隔計算總數的一部 分。這個總數顯示了作爲實例時間百分比的平均忙時。
  
  2、%Processor Time計數器 如果該參數值持續超過95%,表明瓶頸是CPU。可以考慮增加一個處理器或換一個更快的處理器。
  
  3、% Privileged Time 指非閒置處理器時間用於特權模式的百分比。(特權模式是爲操作系統組件和操縱硬件驅動程序而設計的一種處理模式。它允許直接訪問硬件和所有內存。另一種模式爲用戶模式,它是一種爲應用程序、環境分系統和整數分系統設計的一種有限處理模式。操作系統將應用程序線程轉換成特權模式以訪問操作系統服務)。特權時間的 % 包括爲間斷和 DPC 提供服務的時間。特權時間比率高可能是由於失敗設備產生的大數量的間隔而引起的。這個計數器將平均忙時作爲樣本時間的一部分顯示。
  
  4、% User Time表示耗費CPU的數據庫操作,如排序,執行aggregate functions等。如果該值很高,可考慮增加索引,儘量使用簡單的表聯接,水平分割大表格等方法來降低該值。 Physical Disk: Curretn Disk Queue Length計數器該值應不超過磁盤數的1.5~2倍。要提高性能,可增加磁盤。 SQLServer:Cache Hit Ratio計數器該值越高越好。如果持續低於80%,應考慮增加內存。 注意該參數值是從SQL Server啓動後,就一直累加記數,所以運行經過一段時間後,該值將不能反映系統當前值。
  
  47、分析select emp_name form employee where salary > 3000 在此語句中若salary是Float類型的,則優化器對其進行優化爲Convert(float,3000),因爲3000是個整數,我們應在編程時使用3000.0而不要等運行時讓DBMS進行轉化。同樣字符和整型數據的轉換。
  
  48、查詢的關聯同寫的順序
  
  select a.personMemberID, * from chineseresume a,personmember b where personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' (A = B ,B = '號碼')
  
  select a.personMemberID, * from chineseresume a,personmember b where a.personMemberID = b.referenceid and a.personMemberID = 'JCNPRH39681' and b.referenceid = 'JCNPRH39681' (A = B ,B = '號碼', A = '號碼')
  
  select a.personMemberID, * from chineseresume a,personmember b where b.referenceid = 'JCNPRH39681' and a.personMemberID = 'JCNPRH39681' (B = '號碼', A = '號碼')
 
  
  49、
  
  (1)IF 沒有輸入負責人代碼 THEN code1=0 code2=9999 ELSE code1=code2=負責人代碼 END IF 執行SQL語句爲: Select 負責人名 FROM P2000 Where 負責人代碼>=:code1 AND負責人代碼 <=:code2
  
  (2)IF 沒有輸入負責人代碼 THEN  Select 負責人名 FROM P2000 ELSE code= 負責人代碼 Select 負責人代碼 FROM P2000 Where 負責人代碼=:code END IF 第一種方法只用了一條SQL語句,第二種方法用了兩條SQL語句。在沒有輸入負責人代碼時,第二種方法顯然比第一種方法執行效率高,因爲它沒有限制條件; 在輸入了負責人代碼時,第二種方法仍然比第一種方法效率高,不僅是少了一個限制條件,還因相等運算是最快的查詢運算。我們寫程序不要怕麻煩
  
  50、關於JOBCN現在查詢分頁的新方法(如下),用性能優化器分析性能的瓶頸,如果在I/O或者網絡的速度上,如下的方法優化切實有效,如果在CPU或者內存上,用現在的方法更好。請區分如下的方法,說明索引越小越好。
  
  
begin
  
  DECLARE @local_variable table (FID int identity(1,1),ReferenceID varchar(20))
  
  insert into @local_variable (ReferenceID)
  
  select top 100000 ReferenceID from chineseresume order by ReferenceID
  
  select * from @local_variable where Fid > 40 and fid <= 60
  
  end
 和
  
  
begin
  
  DECLARE @local_variable table (FID int identity(1,1),ReferenceID varchar(20))
  
  insert into @local_variable (ReferenceID)
  
  select top 100000 ReferenceID from chineseresume order by updatedate
  
  select * from @local_variable where Fid > 40 and fid <= 60
  
  end 
的不同  
  begin
  
  create table #temp (FID int identity(1,1),ReferenceID varchar(20))
  
  insert into #temp (ReferenceID)
  
  select top 100000 ReferenceID from chineseresume order by updatedate
  
  select * from #temp where Fid > 40 and fid <= 60 drop table #temp
  
  end
 
存儲過程編寫經驗和優化措施 
From:網頁教學網
  一、適合讀者對象:數據庫開發程序員,數據庫的數據量很多,涉及到對SP(存儲過程)的優化的項目開發人員,對數據庫有濃厚興趣的人。  
  二、介紹:在數據庫的開發過程中,經常會遇到複雜的業務邏輯和對數據庫的操作,這個時候就會用SP來封裝數據庫操作。如果項目的SP較多,書寫又沒有一定的規範,將會影響以後的系統維護困難和大SP邏輯的難以理解,另外如果數據庫的數據量大或者項目對SP 的性能要求很,就會遇到優化的問題,否則速度有可能很慢,經過親身經驗,一個經過優化過的SP要比一個性能差的SP的效率甚至高几百倍。  
  三、內容:  
  1、開發人員如果用到其他庫的Table或View,務必在當前庫中建立View來實現跨庫操作,最好不要直接使用“databse.dbo.table_name”,因爲sp_depends不能顯示出該SP所使用的跨庫table或view,不方便校驗。  
  2、開發人員在提交SP前,必須已經使用set showplan on分析過查詢計劃,做過自身的查詢優化檢查。  
  3、高程序運行效率,優化應用程序,在SP編寫過程中應該注意以下幾點:   
  a)SQL的使用規範:
   i. 儘量避免大事務操作,慎用holdlock子句,提高系統併發能力。
   ii. 儘量避免反覆訪問同一張或幾張表,尤其是數據量較大的表,可以考慮先根據條件提取數據到臨時表中,然後再做連接。
   iii. 儘量避免使用遊標,因爲遊標的效率較差,如果遊標操作的數據超過1萬行,那麼就應該改寫;如果使用了遊標,就要儘量避免在遊標循環中再進行表連接的操作。
   iv. 注意where字句寫法,必須考慮語句順序,應該根據索引順序、範圍大小來確定條件子句的前後順序,儘可能的讓字段順序與索引順序相一致,範圍從大到小。
   v. 不要在where子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統將可能無法正確使用索引。
   vi. 儘量使用exists代替select count(1)來判斷是否存在記錄,count函數只有在統計表中所有行數時使用,而且count(1)比count(*)更有效率。
   vii. 儘量使用“>=”,不要使用“>”。
   viii. 注意一些or子句和union子句之間的替換
   ix. 注意表之間連接的數據類型,避免不同類型數據之間的連接。
   x. 注意存儲過程中參數和數據類型的關係。
   xi. 注意insert、update操作的數據量,防止與其他應用衝突。如果數據量超過200個數據頁面(400k),那麼系統將會進行鎖升級,頁級鎖會升級成表級鎖。   
  b)索引的使用規範:
   i. 索引的創建要與應用結合考慮,建議大的OLTP表不要超過6個索引。
   ii. 儘可能的使用索引字段作爲查詢條件,尤其是聚簇索引,必要時可以通過index index_name來強制指定索引
   iii. 避免對大表查詢時進行table scan,必要時考慮新建索引。
   iv. 在使用索引字段作爲條件時,如果該索引是聯合索引,那麼必須使用到該索引中的第一個字段作爲條件時才能保證系統使用該索引,否則該索引將不會被使用。
   v. 要注意索引的維護,週期性重建索引,重新編譯存儲過程。  
  c)tempdb的使用規範:
   i. 儘量避免使用distinct、order by、group by、having、join、cumpute,因爲這些語句會加重tempdb的負擔。
   ii. 避免頻繁創建和刪除臨時表,減少系統表資源的消耗。
   iii. 在新建臨時表時,如果一次性插入數據量很大,那麼可以使用select into代替create table,避免log,提高速度;如果數據量不大,爲了緩和系統表的資源,建議先create table,然後insert。
   iv. 如果臨時表的數據量較大,需要建立索引,那麼應該將創建臨時表和建立索引的過程放在單獨一個子存儲過程中,這樣才能保證系統能夠很好的使用到該臨時表的索引。
    v. 如果使用到了臨時表,在存儲過程的最後務必將所有的臨時表顯式刪除,先truncate table,然後drop table,這樣可以避免系統表的較長時間鎖定。
    vi. 慎用大的臨時表與其他大表的連接查詢和修改,減低系統表負擔,因爲這種操作會在一條語句中多次使用tempdb的系統表。  
  d)合理的算法使用:   
  根據上面已提到的SQL優化技術和ASE Tuning手冊中的SQL優化內容,結合實際應用,採用多種算法進行比較,以獲得消耗資源最少、效率最高的方法。具體可用ASE調優命令:set statistics io on, set statistics time on , set showplan on 等。
解析:Microsoft SQL Server中的鎖模式
在SQL Server數據庫中加鎖時,除了可以對不同的資源加鎖,還可以使用不同程度的加鎖方式,即鎖有多種模式,SQL Server中鎖模式包括:
1.共享鎖 SQL Server中,共享鎖用於所有的只讀數據操作。共享鎖是非獨佔的,允許多個併發事務讀取其鎖定的資源。默認情況下,數據被讀取後,SQL Server立即釋放共享鎖。例如,執行查詢“SELECT * FROM AUTHORS”時,首先鎖定第一頁,讀取之後,釋放對第一頁的鎖定,然後鎖定第二頁。這樣,就允許在讀操作過程中,修改未被鎖定的第一頁。但是,事務隔離級別連接選項設置和SELECT語句中的鎖定設置都可以改變SQL Server的這種默認設置。例如,“ SELECT * FROM AUTHORS HOLDLOCK”就要求在整個查詢過程中,保持對錶的鎖定,直到查詢完成才釋放鎖定。
2.更新鎖更新鎖在修改操作的初始化階段用來鎖定可能要被修改的資源,這樣可以避免使用共享鎖造成的死鎖現象。因爲使用共享鎖時,修改數據的操作分爲兩步,首先獲得一個共享鎖,讀取數據,然後將共享鎖升級爲排它鎖,然後再執行修改操作。這樣如果同時有兩個或多個事務同時對一個事務申請了共享鎖,在修改數據的時候,這些事務都要將共享鎖升級爲排它鎖。這時,這些事務都不會釋放共享鎖而是一直等待對方釋放,這樣就造成了死鎖。如果一個數據在修改前直接申請更新鎖,在數據修改的時候再升級爲排它鎖,就可以避免死鎖。
3.排它鎖 排它鎖是爲修改數據而保留的。它所鎖定的資源,其他事務不能讀取也不能修改。
4.結構鎖 執行表的數據定義語言 (DDL) 操作(例如添加列或除去表)時使用架構修改 (Sch-M) 鎖。當編譯查詢時,使用架構穩定性 (Sch-S) 鎖。架構穩定性 (Sch-S) 鎖不阻塞任何事務鎖,包括排它鎖。因此在編譯查詢時,其它事務(包括在表上有排它鎖的事務)都能繼續運行。但不能在表上執行 DDL 操作。
5.意向鎖 意向鎖說明SQL Server有在資源的低層獲得共享鎖或排它鎖的意向。例如,表級的共享意向鎖說明事務意圖將排它鎖釋放到表中的頁或者行。意向鎖又可以分爲共享意向鎖、獨佔意向鎖和共享式獨佔意向鎖。共享意向鎖說明事務意圖在共享意向鎖所鎖定的低層資源上放置共享鎖來讀取數據。獨佔意向鎖說明事務意圖在共享意向鎖所鎖定的低層資源上放置排它鎖來修改數據。共享式排它鎖說明事務允許其他事務使用共享鎖來讀取頂層資源,並意圖在該資源低層上放置排它鎖。
6.大容量更新鎖 當將數據大容量複製到表,且指定了 TABLOCK 提示或者使用 sp_tableoption 設置了 table lock on bulk 表選項時,將使用大容量更新鎖。大容量更新鎖允許進程將數據併發地大容量複製到同一表,同時防止其它不進行大容量複製數據的進程訪問該表。
詳細介紹優化SQL Server 2000的設置
  SQL Server已經爲了優化自己的性能而進行了良好的配置,比今天市場其他的關係型數據庫都要好得多。然而,你仍然有幾項設置需要進行修改,以便你的數據庫每分鐘可以處理更多的事務(TPM)。本篇文章的目的就是討論這些設置。我們忽略那些可以通過硬件配置或者表或者索引設計提高的性能,因爲這些內容在本篇文章範圍之外。
  破碎頁面檢測
  在我們開始討論服務器配置開關之前,讓我們快速瀏覽一下你的模型數據庫--或者說用作構建新的數據庫的基礎的模板。默認情況下,你可以在數據庫中創建存儲過程、函數等類似的東西,隨後他們將會被加入新創建的數據庫中。
  要優化性能,你也許想要關閉模型數據庫中的破碎頁面檢測。當一個頁面被成功寫入磁盤的時候,破碎頁面檢測進行識別。如果激活了的話,你可以看到每個寫操作對性能產生的每個細小的影響。大多數現代的磁盤陣列都有板上電池,使得陣列可以在突然斷電的情況下完成所有的寫操作--引起破碎頁面的最頻繁原因。
  以下的步驟可以接受如何關閉破碎頁面檢測:
  
exec sp_dboption 'model', 'torn page detection', 'false'
 
  這篇基礎知識資源可以爲你提供更多有關這個設置的信息。
  大多數的配置是通過系統存儲過程sp_configure完成的。要顯示服務器的全部設置列表以便定製,你可以輸入如下命令:
 
 sp_configure 'show advanced options', 1
 
  GO
 
  RECONFIGURE WITH OVERRIDE
 
 
  你可以配置的選項的數量根據你的SQL Server的版本、服務包,以及位數版本(64位的SQL Server比32位的選項要多)而定。我將直接討論最能影響SQL Server性能優化的選項。
  Affinity mask: Affinity mask讓你可以控制SQL Server使用哪個處理器。對於大多數情況,你不應該接觸這個設置,讓操作系統控制處理器關係。然而,你也許想要用這個選項來將某個處理器專門用於另一個進程(例如,MSSearch 或者 SQL Server磁盤 IO ,以及 SQL Server的平衡)。參考基礎知識資源獲取更多有關這個設置的信息。
  Awe enabled: Awe的啓動可以讓SQL Server Enterprise版本運行在Windows 2000以及以上高級服務器上,或者Windows 2003 Enterprise以及以上的版本使用超過4GB的內存。如果你的服務器符合這些條件的話,就激活這個設置吧。
  並行成本極限:當查詢需要進行並行處理的時候,並行的成本極限就定下來了。默認情況是五秒鐘。將這個數值改爲稍低的數值,俄可以讓更多個查詢獲得並行處理,但是這也會引起CPU瓶頸。這個設置只有在多個處理器的機器上纔會起作用。
  填充因子:填充因子設置了在創建聚簇索引的時候用來自動填充的因子。在頻繁插入的表中,將數值從默認的90%設置爲較低的數值,你會獲得收益。
  輕量級緩衝池:這個設置啓動了光纖模式。使用這個選項在CPU利用率很高的8路及其以上的服務器上。這可以讓光纖同時爲每個線程提供服務,同時在默認情況下運行在每個處理器上。某些任務可以從這些光纖中獲得優勢。
  並行的最大程度:當服務器可以使用並行或者不能使用並行,或者是當某個數量的處理器可以用於並行操作的時候,這個設置就確定了。並行就是多個處理器上發生多個處理。例如,查詢的並行操作可以在不同的處理器上同時處理。
  服務器最大內存(MB):如果你在SQL Server上運行了其他的處理,並且有足夠的內存,那麼你有可能想要留出512MB的內存給操作系統和這些進程。例如,你可以在MSSearch或者在本地運行大量的代理的情況下將其設置爲512。
最大工作線程:最大工作線程設置與ADO.net中的連接池有些類似。通過這個設置,任何超過限制(255個用戶)的用戶連接都可以在線程池中等待,直到爲某個連接服務的線程得到釋放,就好像是ADO.net中的連接與連接池共享。如果你有很大量的連接,並且大量的內存,那麼你就可以提高這個數值。
  網絡包尺寸(B):這個設置控制了網絡中傳輸到你的客戶端的包的尺寸。在有損耗的網絡中(例如電話線),你可能想要將這個參數設置爲比較低的數值,墨人數值是4096。在連接良好的網絡中,你可以提高這個設置,特別是涉及BLOB的大型批處理操作。
  優先推進:這個設置爲SQL Server提供了處理器的推動。在任務管理器中,點擊進程標籤,定位SQL Server的位置,然後右擊它。選擇“設置優先級別”。注意,SQL Server應該運行在正常的優先級別上。輸入如下命令:
 
  Sp_configure 'priority boost', 1
 
  Reconfigure with override
 
 
  然後重新啓動你的SQL Server。在任務管理器中察看SQL Server現在運行在什麼優先級別上。它應該是在高優先級上。SQL Server應該比其他的用戶進程運行優先級別要高。在專用於SQL Server的服務器上使用這個設置。
總結
  本篇討論了最常見的SQL Server優化設置。在做出改變之前和之後分別在測試環境中進行基線確定是非常重要的,可以據此來評估在典型的負載下,改變對你的系統的影響。
SQL Server 數據庫中關於死鎖的分析
SQL Server數據庫發生死鎖時不會像ORACLE那樣自動生成一個跟蹤文件。有時可以在[管理]->[當前活動] 裏看到阻塞信息(有時SQL Server企業管理器會因爲鎖太多而沒有響應).
設定跟蹤1204:
 
USE MASTER
 
DBCC TRACEON (1204,-1)
 
 
顯示當前啓用的所有跟蹤標記的狀態:
DBCC TRACESTATUS(-1)
取消跟蹤1204:
DBCC TRACEOFF (1204,-1)
在設定跟蹤1204後,會在數據庫的日誌文件裏顯示SQL Server數據庫死鎖時一些信息。但那些信息很難看懂,需要對照SQL Server聯機叢書仔細來看。根據PAG鎖要找到相關數據庫表的方法:
DBCC TRACEON (3604)
DBCC PAGE (db_id,file_id,page_no)
DBCC TRACEOFF (3604)
請參考sqlservercentral.com上更詳細的講解.但又從CSDN學到了一個找到死鎖原因的方法。我稍加修改, 去掉了遊標操作並增加了一些提示信息,寫了一個系統存儲過程sp_who_lock.sql。代碼如下:
 
if exists (select * from dbo.sysobjects
where id = object_id(N'[dbo].[sp_who_lock]')
and OBJECTPROPERTY(id, N'IsProcedure') = 1)
drop procedure [dbo].[sp_who_lock]
GO
/********************************************************
//  創建 : fengyu  郵件 : [email protected]
//  日期 :2004-04-30
//  修改 : 從http://www.csdn.net/develop/Read_Article.asp?id=26566
//  學習到並改寫
//  說明 : 查看數據庫裏阻塞和死鎖情況
********************************************************/
use master
go
create procedure sp_who_lock
as
begin
declare @spid int,@bl int,
@intTransactionCountOnEntry     int,
@intRowcount             int,
@intCountProperties         int,
@intCounter             int
create table #tmp_lock_who (
id int identity(1,1),
spid smallint,
bl smallint)
IF @@ERROR<>0 RETURN @@ERROR
insert into #tmp_lock_who(spid,bl) select  0 ,blocked
from (select * from sysprocesses where  blocked>0 ) a
where not exists(select * from (select * from sysprocesses
where  blocked>0 ) b
where a.blocked=spid)
union select spid,blocked from sysprocesses where  blocked>0
IF @@ERROR<>0 RETURN @@ERROR
-- 找到臨時表的記錄數
select     @intCountProperties = Count(*),@intCounter = 1
from #tmp_lock_who
IF @@ERROR<>0 RETURN @@ERROR
if    @intCountProperties=0
select '現在沒有阻塞和死鎖信息' as message
-- 循環開始
while @intCounter <= @intCountProperties
begin
-- 取第一條記錄
select     @spid = spid,@bl = bl
from #tmp_lock_who where Id = @intCounter
begin
if @spid =0
select '引起數據庫死鎖的是: '+ CAST(@bl AS VARCHAR(10))
+ '進程號,其執行的SQL語法如下'
else
select '進程號SPID:'+ CAST(@spid AS VARCHAR(10))+ '被'
+ '進程號SPID:'+ CAST(@bl AS VARCHAR(10)) +'阻塞,其當前進程執行的SQL語法如下'
DBCC INPUTBUFFER (@bl )
end
-- 循環指針下移
set @intCounter = @intCounter + 1
end
drop table #tmp_lock_who
return 0
end
 
 
需要的時候直接調用:
sp_who_lock
就可以查出引起死鎖的進程和SQL語句.
SQL Server自帶的系統存儲過程sp_who和sp_lock也可以用來查找阻塞和死鎖, 但沒有這裏介紹的方法好用。如果想知道其它tracenum參數的含義,請看www.sqlservercentral.com文章
我們還可以設置鎖的超時時間(單位是毫秒), 來縮短死鎖可能影響的時間範圍:
例如:
 
use master
seelct @@lock_timeout
set lock_timeout 900000
-- 15分鐘
seelct @@lock_timeout
 
 
 
優化SQLServer索引的小技巧
SQL Server中有幾個可以讓你檢測、調整和優化SQL Server性能的工具。在本文中,我將說明如何用SQL Server的工具來優化數據庫索引的使用,本文還涉及到有關索引的一般性知識。
關於索引的常識
影響到數據庫性能的最大因素就是索引。由於該問題的複雜性,我只可能簡單的談談這個問題,不過關於這方面的問題,目前有好幾本不錯的書籍可供你參閱。我在這裏只討論兩種SQL Server索引,即clustered索引和nonclustered索引。當考察建立什麼類型的索引時,你應當考慮數據類型和保存這些數據的 column。同樣,你也必須考慮數據庫可能用到的查詢類型以及使用的最爲頻繁的查詢類型。
索引的類型
如果column保存了高度相關的數據,並且常常被順序訪問時,最好使用clustered索引,這是因爲如果使用clustered索引,SQL Server會在物理上按升序(默認)或者降序重排數據列,這樣就可以迅速的找到被查詢的數據。同樣,在搜尋控制在一定範圍內的情況下,對這些 column也最好使用clustered索引。這是因爲由於物理上重排數據,每個表格上只有一個clustered索引。
與上面情況相反,如果columns包含的數據相關性較差,你可以使用nonculstered索引。你可以在一個表格中使用高達249個nonclustered索引--儘管我想象不出實際應用場合會用的上這麼多索引。
當表格使用主關鍵字(primary keys),默認情況下SQL Server會自動對包含該關鍵字的column(s)建立一個獨有的cluster索引。很顯然,對這些column(s)建立獨有索引意味着主關鍵字的唯一性。當建立外關鍵字(foreign key)關係時,如果你打算頻繁使用它,那麼在外關鍵字cloumn上建立nonclustered索引不失爲一個好的方法。如果表格有 clustered索引,那麼它用一個鏈表來維護數據頁之間的關係。相反,如果表格沒有clustered索引,SQL Server將在一個堆棧中保存數據頁。
數據頁
當索引建立起來的時候,SQLServer就建立數據頁(datapage),數據頁是用以加速搜索的指針。當索引建立起來的時候,其對應的填充因子也即被設置。設置填充因子的目的是爲了指示該索引中數據頁的百分比。隨着時間的推移,數據庫的更新會消耗掉已有的空閒空間,這就會導致頁被拆分。頁拆分的後果是降低了索引的性能,因而使用該索引的查詢會導致數據存儲的支離破碎。當建立一個索引時,該索引的填充因子即被設置好了,因此填充因子不能動態維護。
爲了更新數據頁中的填充因子,我們可以停止舊有索引並重建索引,並重新設置填充因子(注意:這將影響到當前數據庫的運行,在重要場合請謹慎使用)。 DBCC INDEXDEFRAG和DBCC DBREINDEX是清除clustered和nonculstered索引碎片的兩個命令。INDEXDEFRAG是一種在線操作(也就是說,它不會阻塞其它表格動作,如查詢),而DBREINDEX則在物理上重建索引。在絕大多數情況下,重建索引可以更好的消除碎片,但是這個優點是以阻塞當前發生在該索引所在表格上其它動作爲代價換取來得。當出現較大的碎片索引時,INDEXDEFRAG會花上一段比較長的時間,這是因爲該命令的運行是基於小的交互塊(transactional block)。
填充因子
當你執行上述措施中的任何一個,數據庫引擎可以更有效的返回編入索引的數據。關於填充因子(fillfactor)話題已經超出了本文的範疇,不過我還是提醒你需要注意那些打算使用填充因子建立索引的表格。
在執行查詢時,SQL Server動態選擇使用哪個索引。爲此,SQL Server根據每個索引上分佈在該關鍵字上的統計量來決定使用哪個索引。值得注意的是,經過日常的數據庫活動(如插入、刪除和更新表格),SQL Server用到的這些統計量可能已經“過期”了,需要更新。你可以通過執行DBCC SHOWCONTIG來查看統計量的狀態。當你認爲統計量已經“過期”時,你可以執行該表格的UPDATE STATISTICS命令,這樣SQL Server就刷新了關於該索引的信息了。
建立數據庫維護計劃
SQL Server提供了一種簡化並自動維護數據庫的工具。這個稱之爲數據庫維護計劃嚮導(Database Maintenance Plan Wizard ,DMPW)的工具也包括了對索引的優化。如果你運行這個嚮導,你會看到關於數據庫中關於索引的統計量,這些統計量作爲日誌工作並定時更新,這樣就減輕了手工重建索引所帶來的工作量。如果你不想自動定期刷新索引統計量,你還可以在DMPW中選擇重新組織數據和數據頁,這將停止舊有索引並按特定的填充因子重建索引。
Sybase SQL Server索引的使用和優化 
  在應用系統中,尤其在聯機事務處理系統中,對數據查詢及處理速度已成爲衡 量應用系統成敗的標準。而採用索引來加快數據處理速度也成爲廣大數據庫用戶所 接受的優化方法。
  在良好的數據庫設計基礎上,能有效地使用索引是SQL Server取得高性能的基礎,SQL Server採用基於代價的優化模型,它對每一個提交的有關表的查詢,決定是否使用索引或用哪一個索引。因爲查詢執行的大部分開銷是磁盤I/O,使用索引提高性能的一個主要目標是避免全表掃描,因爲全表掃描需要從磁盤上讀表的每一個數據頁,如果有索引指向數據值,則查詢只需讀幾次磁盤就可以了。所以如果建立了合理的索引,優化器就能利用索引加速數據的查詢過程。但是,索引並不總是提高系統的性能,在增、刪、改操作中索引的存在會增加一定的工作量,因此,在適當的地方增加適當的索引並從不合理的地方刪除次優的索引,將有助於優化那些性能較差的SQL Server應用。實踐表明,合理的索引設計是建立在對各種查詢的分析和預測上的,只有正確地使索引與程序結合起來,才能產生最佳的優化方案。本文就SQL Server索引的性能問題進行了一些分析和實踐。
  一、聚簇索引(clustered indexes)的使用
  聚簇索引是一種對磁盤上實際數據重新組織以按指定的一個或多個列的值排序。由於聚簇索引的索引頁面指針指向數據頁面,所以使用聚簇索引查找數據幾乎總是比使用非聚簇索引快。每張表只能建一個聚簇索引,並且建聚簇索引需要至少相當該表120%的附加空間,以存放該表的副本和索引中間頁。建立聚簇索引的思想是:
  1、 大多數表都應該有聚簇索引或使用分區來降低對錶尾頁的競爭,在一個高事務的環境中,對最後一頁的封鎖嚴重影響系統的吞吐量。
  2、在聚簇索引下,數據在物理上按順序排在數據頁上,重複值也排在一起,因而在那些包含範圍檢查(between、<、<=、>、> =)或使用group by或order by的查詢時,一旦找到具有範圍中第一個鍵值的行,具有後續索引值的行保證物理上毗連在一起而不必進一步搜索,避免了大範圍掃描,可以大大提高查詢速度。
  3、 在一個頻繁發生插入操作的表上建立聚簇索引時,不要建在具有單調上升值的列(如IDENTITY)上,否則會經常引起封鎖衝突。
  4、 在聚簇索引中不要包含經常修改的列,因爲碼值修改後,數據行必須移動到新的位置。
  5、 選擇聚簇索引應基於where子句和連接操作的類型。聚簇索引的侯選列是:
  ● 主鍵列,該列在where子句中使用並且插入是隨機的。
  ● 按範圍存取的列,如pri_order > 100 and pri_order < 200 。
  ● 在group by或order by中使用的列。
  ● 不經常修改的列。
  ● 在連接操作中使用的列。
  二、非聚簇索引(nonclustered indexes)的使用
  SQL Server缺省情況下建立的索引是非聚簇索引,由於非聚簇索引不重新組織表中的數據,而是對每一行存儲索引列值並用一個指針指向數據所在的頁面。換句話說非聚簇索引具有在索引結構和數據本身之間的一個額外級。一個表如果沒有聚簇索引時,可有250個非聚簇索引。每個非聚簇索引提供訪問數據的不同排序順序。在建立非聚簇索引時,要權衡索引對查詢速度的加快與降低修改速度之間的利弊。另外,還要考慮這些問題:
  ● 索引需要使用多少空間。
  ● 合適的列是否穩定。
  ● 索引鍵是如何選擇的,掃描效果是否更佳。
  ● 是否有許多重複值。
  對更新頻繁的表來說,表上的非聚簇索引比聚簇索引和根本沒有索引需要更多的額外開銷。對移到新頁的每一行而言,指向該數據的每個非聚簇索引的頁級行也必須更新,有時可能還需要索引頁的分理。從一個頁面刪除數據的進程也會有類似的開銷,另外,刪除進程還必須把數據移到頁面上部,以保證數據的連續性。所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情況:
  ● 某列常用於集合函數(如Sum,....)。
  ● 某列常用於join,order by,group by。
  ● 查尋出的數據不超過表中數據量的20%。
  三、覆蓋索引(covering indexes)的使用
  覆蓋索引是指那些索引項中包含查尋所需要的全部信息的非聚簇索引,這 種索引之所以比較快也正是因爲索引頁中包含了查尋所必須的數據,不需去訪 問數據頁。 如果非聚簇索引中包含結果數據,那麼它的查詢速度將快於聚簇索引。
  但是由於覆蓋索引的索引項比較多,要佔用比較大的空間。而且update 操 作會引起索引值改變。所以如果潛在的覆蓋查詢並不常用或不太關鍵,則覆蓋索引的增加反而會降低性能。
  四、索引的選擇技術
  p_detail是住房公積金管理系統中記錄個人明細的表,有890000行,觀察在不同索引下的查詢運行效果,測試在C/S環境下進行,客戶機是 IBM PII350(內存64M),服務器是DEC Alpha1000A(內存128M),數據庫爲SYBASE11.0.3。
  1、 select count(*) from p_detail where op_date>’19990101’ and op_date<’19991231’ and pri_surplus1>300
  2、 select count(*),sum(pri_surplus1) from p_detail where op_date>’19990101’ and pay_month between ‘199908’ and ’199912’
  不建任何索引 查詢1 1分15秒
  查詢2 1分7秒
  在op_date上建非聚簇索引 查詢1 57秒
  查詢2 57秒
  在op_date上建聚簇索引 查詢1 <1秒
  查詢2 52秒
  在pay_month、op_date、pri_surplus1上建索引 查詢1 34秒
  查詢2 <1秒
  在op_date、pay_month、pri_surplus1上建索引 查詢1 <1秒
  查詢2 <1秒
  從以上查詢效果分析,索引的有無,建立方式的不同將會導致不同的查詢效果,選擇什麼樣的索引基於用戶對數據的查詢條件,這些條件體現於where從句和join表達式中。一般來說建立索引的思路是:
  (1)、主鍵時常作爲where子句的條件,應在表的主鍵列上建立聚簇索引,尤其當經常用它作爲連接的時候。
  (2)、有大量重複值且經常有範圍查詢和排序、分組發生的列,或者非常頻繁地被訪問的列,可考慮建立聚簇索引。
  (3)、經常同時存取多列,且每列都含有重複值可考慮建立複合索引來覆蓋一個或一組查詢,並把查詢引用最頻繁的列作爲前導列,如果可能儘量使關鍵查詢形成覆蓋查詢。
  (4)、如果知道索引鍵的所有值都是唯一的,那麼確保把索引定義成唯一索引。
  (5)、在一個經常做插入操作的表上建索引時,使用fillfactor(填充因子)來減少頁分裂,同時提高併發度降低死鎖的發生。如果在只讀表上建索引,則可以把fillfactor置爲100。
  (6)、在選擇索引鍵時,設法選擇那些採用小數據類型的列作爲鍵以使每個索
  引頁能夠容納儘可能多的索引鍵和指針,通過這種方式,可使一個查詢必須遍歷的索引頁面降到最小。此外,儘可能地使用整數爲鍵值,因爲它能夠提供比任何數據類型都快的訪問速度。
  五、索引的維護
  上面講到,某些不合適的索引影響到SQL Server的性能,隨着應用系統的運行,數據不斷地發生變化,當數據變化達到某一個程度時將 會影響到索引的使用。這時 需要用戶自己來維護索引。索引的維護包括:
  1、重建索引
  隨着數據行的插入、刪除和數據頁的分裂,有些索引頁可能只包含幾頁數據,另外應用在執行大塊I/O的時候,重建非聚簇索引可以降低分片,維護大塊I/O的效率。重建索引實際上是重新組織B-樹空間。在下面情況下需要重建索引:
  (1)、數據和使用模式大幅度變化。
  (2)、排序的順序發生改變。
  (3)、要進行大量插入操作或已經完成。
  (4)、使用大塊I/O的查詢的磁盤讀次數比預料的要多。
  (5)、由於大量數據修改,使得數據頁和索引頁沒有充分使用而導致空間的使用超出估算。
  (6)、dbcc檢查出索引有問題。
  當重建聚簇索引時,這張表的所有非聚簇索引將被重
  建.
  2、索引統計信息的更新
  當在一個包含數據的表上創建索引的時候,SQL Server會創建分佈數據頁來存放有關索引的兩種統計信息:分佈表和密度表。優化器利用這個頁來判斷該索引對某個特定查詢是否有用。但這個統計信息並不動態地重新計算。這意味着,當表的數據改變之後,統計信息有可能是過時的,從而影響優化器追求最有工作的目標。因此,在下面情況下應該運行update statistics命令:
  (1)、數據行的插入和刪除修改了數據的分佈。
  (2)、對用truncate table刪除數據的表上增加數據行。
  (3)、修改索引列的值。
  六、結束語
  實踐表明,不恰當的索引不但於事無補,反而會降低系統的執行性能。因爲大量的索引在插入、修改和刪除操作時比沒有索引花費更多的系統時間。例如下面情況下建立的索引是不恰當的:
  ● 在查詢中很少或從不引用的列不會受益於索引,因爲索引很少或從來不必搜索基於這些列的行。
  ● 只有兩個或三個值的列,如男性和女性(是或否),從不會從索引中得到好處。
  另外,鑑於索引加快了查詢速度,但減慢了數據更新速度的特點。可通過在一個段上建表,而在另一個段上建其非聚簇索引,而這兩段分別在單獨的物理設備上來改善操作性能。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章