SQL Server中參數化SQL寫法遇到parameter sniff ，導致不合理執行計劃重用的一種解決方案

parameter sniff問題是重用其他參數生成的執行計劃，導致當前參數採用該執行計劃非最優化的現象。想必熟悉數據的同學都應該知道，產生parameter sniff最典型的問題就是使用了參數化的SQL（或者存儲過程中使用了參數化）寫法，如果存在數據分佈不均勻的情況下，正常情況下生成的執行計劃，在傳入在分佈數據較多的參數的情況下，重用了正常參數生成的執行計劃，而這種緩存的執行計劃並非適合當前參數的一種情況。

這種情況，在實際業務中，出現的頻率還是比較高的，因爲存儲過程一般都是採用參數化的寫法，這時，遇到分佈不均勻的數據參數時，parameter sniff現象就出現了，這種問題還是比較讓人頭疼的。

具體parameter sniff產生的原因，我就不做過多的解釋了，解釋這個就顯得太low了

我舉個簡單的例子，模擬一下這個現象，說明參數化的存存儲過程是怎麼寫的，存在哪些問題，又如何解決parameter sniff問題，

先創建一個測試環境：

create table ParameterSniffProblem
(
    id int identity(1,1),
    CustomerId int,
    OrderId int,
    OrederStatus int,
    CreateDate Datetime,
    Remark varchar(200)
)declare @i int = 0while @i<500000begin
    INSERT INTO ParameterSniffProblem values (@i%10000,@i,RAND()*10,GETDATE()-RAND()*100,NEWID())    set @i=@i+1end

 --假如某一個客戶有非常多的訂單，模擬數據分佈不均勻的情況INSERT INTO ParameterSniffProblem values (6666,RAND()*100000,1,GETDATE()-RAND()*100,NEWID())GO 100000--創建正常的索引CREATE CLUSTERED INDEX IDX_CreateDate on ParameterSniffProblem(CreateDate)CREATE INDEX IDX_CustomerId ON ParameterSniffProblem(CustomerId)

參數化存儲過程的寫法：

在編寫存儲過程的時候，我們一般建議採用參數化的寫法，目的是爲了減少存儲過程的編譯和加強執行計劃緩存的重用

大概是這樣子的

         

     NOCOUNT   
    
                       (         ()  N
           
        
　　　　 (      CONCAT(,(      CONCAT(,(      CONCAT(,(      CONCAT(,  
        
 sp_executesql ,

Parameter Sniff問題：

這就潛在一個parameter sniff問題，

比如我查詢用戶ID=100的訂單信息，一個正常的分佈的數據，存儲過程第一次編譯，這個執行計劃完全沒有問題，

如果我接着改變參數執行查詢用戶6666的信息，一個分佈及其不均勻的數據，但是因爲重用上面緩存的執行計劃，就出現parameter sniff問題了，這個執行計劃顯然是不合理的

IO就不看了，刻意造的例子

如果我清空執行計劃緩存，

重新執行上述查詢，因爲有了重編譯，執行計劃就是不這個樣子，對於CustomerID=6666這個參數來說，顯然走全表掃描代價要更小一點

想必這是一個開發中常見的問題給，

我們參數化SQL就是爲了讓不同參數的查詢重用執行計劃，

但是很不幸，數據分佈不均勻的時候，重用執行計劃恰恰又給數據庫造成了傷害，

上例中，如果是正常參數重用了分佈較多數據的執行計劃，比如命名可以用到索引，結果是表掃描，後果會更嚴重。

那麼，既想要儘可能的重用執行計劃，又要避免因爲執行計劃重用產生parameter sniff問題，怎麼辦？

我們知道問題在於@p_CustomerId身上，那麼可不可以對有可能產生parameter sniff問題的@p_CustomerId不做參數化，直接拼湊在SQL中，

如果@p_CustomerId變化了就重編譯SQL，也就是對傳入進來的@p_CustomerId重編譯

如果是@p_CustomerId不變，其他參數有變化，比如這裏時間字段的變化，還可以享受參數化帶來的執行計劃重用的好處

也就是這樣處理 @p_CustomerId這個參數，直接把@p_CustomerId以字符串的方式平湊在SQL語句中，

這樣的話，就相當於即席查詢了，不通過參數化的方式給CustomerId這個查詢條件字段賦值

IF(@p_CustomerId IS NOT NULL)
SET @sqlcommand = CONCAT(@sqlcommand,'AND CustomerId= ',@p_CustomerId)

這樣再去執行存儲過程的時候，

帶入@p_CustomerId=1的時候，執行IDX_CustomerId的index seek

帶入@p_CustomerId=6666的時候，重編譯，執行計劃是全表掃描，避免重用上面生成的執行計劃，造成不合理的執行方式對效率以及數據庫服務器資源的消耗

這樣會儘可能的減少parameter sniff問題帶來的影響，當緩存了@p_CustomerId=1的執行計劃的時候，

再次傳入@p_CustomerId=1，其他條件有較小的變化，比如時間字段上有改動，依然可以重用緩存的執行計劃，避免重編譯帶來的影響

結論：

這種方式於處理parameter sniff問題，當然不是完美的，肯定也有問題，我當然知道一旦@p_CustomerId不同就要重編譯

肯定會因爲@p_CustomerId參數值不同，這樣的話，不可避免地增加了重編譯的機會，

但是卻不會因爲不合理的執行計劃重用，帶來的parameter sniff問題

要知道一旦產生parameter sniff問題，大量的查詢用到不合理的執行計劃，會對整個服務器產生非常嚴重的影響，比如可能會產生大量的IO等

同時存在一個好處，

比如第一次傳入@p_CustomerId=1，

再次傳入@p_CustomerId=1，其他條件有較小的變化，比如時間字段上有改動，依然可以重用緩存的執行計劃，避免重編譯帶來的影響

當然我這裏只是一個簡單的例子，實際應用中遠遠比這個複雜

比如分佈的特別的多的數據有兩個特點，第一分佈的標示不僅僅只有一個，第二分佈不均的數據是動態的，

有可能第一季度是A這部分數據佔據大多數，有可能是第二季度B數據佔絕大多數

所以很難採用Plan Guide的方式解決parameter sniff問題

這種方式可以在一定程度上也能夠重用緩存的執行計劃，可以減少（但不可避免）重編譯的次數

同時，這種方式與拼湊一個SQL字符串執行的即席查詢方式相比，同時還可以利用參數化帶來的其他好處，比如SQL注入等等

總結：

　　　　parameter sniff問題的解決方式有很多，不一一囉嗦了

　　　　最典型的就是強制重編譯，

　　　　或者使用EXEC執行一個拼湊出來的字符串，這種方式屬於Adhoc查詢

　　　　或者查詢提示，

　　　　或者是使用本地變量，

　　　　或者使用Plan Guide等等等等，

　　　　每種方式都有他的侷限性，至少到目前爲止，還沒有一種十全十美的方式來解決parameter sniff問題

　　　　遇到問題，解決方法有很多種，以最小的代價解決問題纔是王道。

SQL Server中參數化SQL寫法遇到parameter sniff ，導致不合理執行計劃重用的一種解決方案

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

Hadoop之RPC簡單使用(遠程過程調用協議)

Scala之Traits

Spring-data-redis操作redis知識總結

SQL Server中參數化SQL寫法遇到parameter sniff ，導致不合理執行計劃重用的一種解決方案

SQL Server 並行操作優化，避免並行操作被抑制而影響SQL的執行效率

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結