【原創】PostgreSQL hstore 列性能提升一例

PostgreSQL 支持hstore 來存放KEY->VALUE這類數據，其實也類似於ARRAY或者JSON類型。要高效的使用這類數據，當然離不開高效的索引。我們今天就來看看兩類不同的索引對於同一種檢索請求的性能問題。

假如我們有這樣一個原始表，基於str1字段有一個BTREE索引。

t_girl=# \d status_check;
          Table "ytt.status_check"
 Column |         Type          | Modifiers 
--------+-----------------------+-----------
 is_yes | boolean               | not null
 str1   | character varying(20) | not null
 str2   | character varying(20) | not null
Indexes:
    "index_status_check_str1" btree (str1)

裏面有10W條記錄。數據大概如下，

t_girl=# select * from status_check limit 2;
 is_yes | str1 |         str2         
--------+------+----------------------
 f      | 0    | cfcd208495d565ef66e7
 t      | 1    | c4ca4238a0b923820dcc
(2 rows)
Time: 0.617 ms
t_girl=#

存放hstore類型的status_check_hstore 表結構，基於str1_str2字段有一個GIST索引。

 Table "ytt.status_check_hstore"
  Column   |  Type   | Modifiers 
-----------+---------+-----------
 is_yes    | boolean | 
 str1_str2 | hstore  | 
Indexes:
    "idx_str_str2_gist" gist (str1_str2) 
t_girl=# select * from status_check_hstore limit 2;
 is_yes |          str1_str2          
--------+-----------------------------
 f      | "0"=>"cfcd208495d565ef66e7"
 t      | "1"=>"c4ca4238a0b923820dcc"
(2 rows)
Time: 39.874 ms

接下來我們要得到跟查詢原始表一樣的結果，當然原始表的查詢非常高效。表語句以及結果如下，

t_girl=# select * from status_check where str1 in ('10','23','33');        
 is_yes | str1 |         str2         
--------+------+----------------------
 t      | 10   | d3d9446802a44259755d
 t      | 23   | 37693cfc748049e45d87
 f      | 33   | 182be0c5cdcd5072bb18
(3 rows)
Time: 0.690 ms

上面的語句用了不到1毫秒。

接下來我們對hstore表進行查詢，

t_girl=# select is_yes,skeys(str1_str2),svals(str1_str2) from status_check_hstore where str1_str2 ?| array['10','23','33'];
 is_yes | skeys |        svals         
--------+-------+----------------------
 t      | 10    | d3d9446802a44259755d
 t      | 23    | 37693cfc748049e45d87
 f      | 33    | 182be0c5cdcd5072bb18
(3 rows)
Time: 40.256 ms

我的天，比原始表的查詢慢了幾十倍。

看下查詢計劃，把所有行都掃描了一遍。

                                    QUERY PLAN                                     
-----------------------------------------------------------------------------------
 Bitmap Heap Scan on status_check_hstore  (cost=5.06..790.12 rows=100000 width=38)
   Recheck Cond: (str1_str2 ?| '{10,23,33}'::text[])
   ->  Bitmap Index Scan on idx_str_str2_gist  (cost=0.00..5.03 rows=100 width=0)
         Index Cond: (str1_str2 ?| '{10,23,33}'::text[])
(4 rows)
Time: 0.688 ms

我們想辦法來優化這條語句，如果把這條語句變成跟原始語句一樣的話，那麼是否就可以用到BTREE索引了？

接下來，建立一個基於BTREE的函數索引，

t_girl=# create index idx_str1_str2_akeys on status_check_hstore using btree (array_to_string(akeys(str1_str2),','));
CREATE INDEX
Time: 394.123 ms
OK,變化語句來執行下同樣的檢索，
t_girl=# select is_yes,skeys(str1_str2),svals(str1_str2) from status_check_hstore where array_to_string(akeys(str1_str2),',') in ('10','23','33');        
 is_yes | skeys |        svals         
--------+-------+----------------------
 t      | 10    | d3d9446802a44259755d
 t      | 23    | 37693cfc748049e45d87
 f      | 33    | 182be0c5cdcd5072bb18
(3 rows)
Time: 0.727 ms

這次和原始查詢速度一樣快了。

【原創】PostgreSQL hstore 列性能提升一例

.Net 8.0 下的新RPC，IceRPC之試試的新玩法"打洞"

關於遊戲付費的一點想法

我通過CKA和CKS啦！

《最新出爐》系列入門篇-Python+Playwright自動化測試-42-強大的可視化追蹤利器Trace Viewer

大數據怎麼學？對大數據開發領域及崗位的詳細解讀，完整理解大數據開發領域技術體系

【原創】PostgreSQL 給數組排序

【原創】REDIS與MYSQL實現標籤的對比

【原創】oracle函數INSTR的MySQL實現

【原創】POSTGRESQL交叉表的實現

【原創】mysql 錯誤緩衝堆棧

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結