TokuDB和InnoDB的讀寫分析與比較

原創

2020-02-22 21:36

我們知道，在MySQL單機版本里面最流行的也是唯一支持全事務的引擎爲INNODB。其特點是數據本身是用B-TREE來組織，數據本身即是龐大的根據主鍵聚簇的B-TREE索引。所以在這點上，寫入速度就會有些降低，因爲要每次寫入要用一次IO來做索引樹的重排。特別是當數據量本身比內存大很多的情況下，CPU本身被磁盤IO糾纏的做不了其他事情了。這時我們要考慮如何減少對磁盤的IO來排解CPU的處境，那麼如何做呢？（當然，如果數據足夠放到內存裏面，這些事情大可不必考慮。）
1. 可以把INNODB 個PAGE增大？（默認16KB）但是增大也就帶來了一些缺陷。比如，對磁盤進行CHECKPOINT的時間將延後。
2. 把日誌文件放到更快速的磁盤上？比如SSD？

其實這時，我們可以考慮用另外一個知名的引擎TokuDB。誰叫MySQL 天生支持隨意可插拔呢！
TokuDB 其實本身數據存儲用到了B-TREE的變形版本Fractal-Tree。 Fractal-Tree 也就是在B-Tree原來的非葉子節點增加了一個緩存，無論對這個樹怎麼操作，都是一個模式：即父親節點的緩存滿了，就流淌到兒子節點，然後兒子節點的緩存滿了後，再次流淌到孫子節點等等一系列最後到了葉子節點，然後等到葉子節點的PAGE足夠大的時候，進行CHECK POINT。當然不管如何做緩存，每次事務後，還是得首先刷新到REDO 日誌，要不數據一致性就很難保證了。

接下來，這裏測試下同樣的環境InnoDB和TokuDB的性能差異。當然，我沒有做壓力測試，只是簡單的手動執行了幾次SQL而已。
（5.6.10-enterprise-commercial-advanced-log MySQL Enterprise Server - Advanced Edition (Commercial)）
用來導入的文件大概爲35M。

1. INNODB.
對應的參數：
 innodb_buffer_pool_size=32M
 bulk_insert_buffer_size=20M
 query_cache_size = 0


導入性能：（InnoDB在這裏慢在CPU一直忙於IO置換。）
mysql> load data infile '/tmp/t3_push.csv' into table t3_push;
Query OK, 955527 rows affected (30 min 44.03 sec)
Records: 955527  Deleted: 0  Skipped: 0  Warnings: 0


讀性能：（讀的性能還是很好的，這裏用到5.6的ICP以及MRR特性。）
mysql> select count(*) from t3_push where rank1 < 20 and rank2 < 30;        
+----------+
| count(*) |
+----------+
|       49 |
+----------+
1 row in set (0.06 sec)


調大
innodb_buffer_pool=128M


mysql> load data infile '/tmp/t3_push.csv' into table t3_push;
Query OK, 955527 rows affected (38.72 sec)
Records: 955527  Deleted: 0  Skipped: 0  Warnings: 0
調大後，其實導入性能還是不錯的。

 2. TokuDB.
（5.5.30-tokudb-7.1.0-e-log TokuDB Enterprise Server (GPL) ）
對應的參數：
 tokudb_cache_size=32M
 tokudb_loader_memory_size=20M
 query_cache_size = 0


寫性能：（這裏IO次數很少，所以導入速度很快。）


mysql> load data infile '/tmp/t3_push.csv' into table t3_push;
Query OK, 955527 rows affected (19.73 sec)
Records: 955527  Deleted: 0  Skipped: 0  Warnings: 0


讀性能：（讀的速度比INNODB稍微慢了些。）
mysql> select count(*) from t3_push where rank1 < 20 and rank2 < 30;   
+----------+
| count(*) |
+----------+
|       49 |
+----------+
1 row in set (0.54 sec)
mysql> select count(*) from t3_push where rank1 < 200 and rank2 < 300;        
+----------+
| count(*) |
+----------+
|     5759 |
+----------+
1 row in set (4.13 sec)
但是TokuDB可以給二級索引變聚簇，所以這點上如果只讀的話，還是會比InnoDB快。
給列rank2 加聚簇索引，
mysql> alter table t3_push add clustering index idx_rank2(rank2);
Query OK, 0 rows affected (6.79 sec)
Records: 0  Duplicates: 0  Warnings: 0


現在所有的基於索引idx_rank2 的查詢都是瞬間的。
mysql> select count(*) from t3_push where rank1 < 20 and rank2 < 30;
+----------+
| count(*) |
+----------+
|       49 |
+----------+
1 row in set (0.00 sec)


mysql> select count(*) from t3_push where rank1 < 200 and rank2 < 300;        
+----------+
| count(*) |
+----------+
|     5759 |
+----------+
1 row in set (0.01 sec)

懶得去死

發佈了97 篇原創文章 · 獲贊 2 · 訪問量 47萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

TokuDB和InnoDB的讀寫分析與比較

如何使用 JS 判斷用戶是否處於活躍狀態

Mono 支持LoongArch架構

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

POSTGRESQL 分區表初次體驗

狀態值在數據庫中的檢索

MySQL 存儲過程調試工具商業和免費

PostgreSQL 實現MySQL "insert ignore" 語法。

TokuDB和InnoDB的讀寫分析與比較

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結