mysql 高效的去重插入數據

原創

2020-02-25 10:34

前言：

我們最簡單的想法就是先查詢一下，看看這個對象有沒有在，如果在，就更新或者刪除，或者忽略，如果不在就插入，但是對於數據處理來說，這個可能就有點浪費性能了，而且我們學習的也是批量存儲比單一存儲要快，單一存儲30ms，批量存儲10個40ms，批量存儲越大，他們兩個的差距就越大，又有人提出了select in ，我們批量的去查詢，看看鍵在沒在我們批量數據的數組裏面，找到在的就忽略掉，確實時間可以快一點，但是處理麻煩，接下來，就要放大招了！

大招

mysql 有一個特性的存儲 ON DUPLICATE KEY UPDATE,有就update，沒有就更新，當然如果你想忽略就不在更新的地方寫東西不就行了，如果你想替換，就將所有的字段更新一遍

關於如何使用，什麼例子都不如官網https://dev.mysql.com/doc/refman/5.7/en/insert-on-duplicate.html

mysql語句會了，再來點配菜

peewee框架對該語句的支持http://docs.peewee-orm.com/en/latest/peewee/api.html#Insert.on_conflict

on_conflict 可以配置重複就更新

on_conflict_ignore 配置重複就忽略

on_conflict_replace 配置重複就替換

測試

9000行數據去重 800ms

44000行數據1-2s,

注意

數據量大了，mysql可能就有點’撐不住‘比如你可能會遇到大數據在存儲的時候出現錯誤MySQL server has gone away (BrokenPipeError(32, 'Broken pipe'))，一般是因爲max_allowed_packet，客戶端和mysql服務器的傳輸字節數太小了，默認是4m，我一般會設置到100m，具體怎麼設，自己百度。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

表鎖和行鎖都由鎖結構承載這些鎖結構在內存裏是個什麼樣的存在作者操盛春愛可生技術專家公衆號『一樹一溪』作者專注於研究 MySQL 和 OceanBase 源碼。愛可生開源社區出品原創內容未經授權不得隨意使用轉載請聯繫小編並註明來源。

2024-05-31 12:13:56

一文講透 OceanBase 單機版：架構介紹、部署流程、性能測試、MySQL對比、資源配置等等

引言 OceanBase 單機集中式集羣（即單機版，後文不再稱“單機集中式集羣”）是OceanBase 推出的極簡數據庫架構，區別於分佈式集羣架構，單機版無多副本和擴縮容能力，適用於開發測試環境及數據安全性要求不高的業務系統。 OceanB

2024-05-31 00:04:39

centos7按照MYSQL8（安裝包）

查詢Linux的clibc版本 rpm -qa | grep glibc 現在mysql官網找到對應glibc版本的下載url 然後在linux內下載 wget https://dev.mysql.com/get/Downloads

2024-05-29 22:15:17

MySQL 重啓之後無法寫入數據了？

數據庫交接後因 persist_only 級別的參數設置引發的故障分析。作者：不喫芫荽，愛可生華東交付服務部 DBA 成員，主要負責 MySQL 故障處理及相關技術支持。愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編

2024-05-29 00:01:11

Dolphinscheduler不重啓加載Oracle驅動

轉載自劉茫茫看山問題背景某天我們的租戶反饋數據庫連接缺少必要的驅動，我們通過日誌查看確實是缺少部分數據庫的驅動，因爲DolphinScheduler默認只帶了Oracle和MySQL的驅動，並且需要將pom文件中的test模式去掉纔可以

2024-05-28 21:22:10

第 52 期：MySQL 半同步複製頻繁報錯

社區王牌專欄《一問一實驗：AI 版》全新改版歸來，得到了新老讀者們的關注。其中不乏對 ChatDBA 感興趣的讀者前來諮詢，表達了想試用體驗 ChatDBA 的意願，對此我們表示感謝 🤟。目前，ChatDBA 還在最後的準備階段，會盡快跟

2024-05-28 00:00:49

Apache DolphinScheduler(2.x和3.x版本) 本地環境搭建教程一覽

在迅速變化的技術領域，本地環境的搭建和調試對於軟件開發的效率和效果至關重要。本文將詳細介紹如何爲Apache DolphinScheduler搭建一個高效的本地開發環境，包括2.x和3.x版本的設置方法。無論您是初學者還是有經驗的開發者

2024-05-27 12:38:21

淺析MySQL 8.0直方圖原理

本文分享自華爲雲社區《【MySQL技術專欄】MySQL8.0直方圖介紹》，作者：GaussDB 數據庫。背景數據庫查詢優化器負責將SQL查詢轉換爲儘可能高效的執行計劃，但因爲數據環境不斷變化導致優化器對查詢數據瞭解的不夠充足，可能無法

2024-05-27 10:58:41

分佈式任務調度內的 MySQL 分頁查詢優化

作者：vivo 互聯網數據庫團隊- Qiu Xinbo 本文主要通過圖示介紹了用主鍵進行分片查詢的過程，介紹了主鍵分頁查詢存在SQL性能問題，如何去創建高效的索引去優化主鍵分頁查詢的SQL性能問題對於數據分佈不均

2024-05-24 12:09:18

mysql utf8_unicode_ci 與 utf8_general_ci

您可以在這裏檢查和比較這兩種排序規則提供的排序順序： https://collation-charts.org/mysql60/mysql604.utf8_unicode_ci.european.html https://collation

2024-05-24 00:56:30

KubeEdge v1.17.0發佈！數據處理能力與易用性全面提升

本文分享自華爲雲社區《KubeEdge v1.17.0發佈！數據處理能力與易用性全面提升》，作者：雲容器大未來。 KubeEdge社區v1.17.0 版本正式發佈。新版本爲邊緣節點和設備帶來了更多的新能力，同時持續在易用性上

2024-05-23 10:58:31

MySQL 核心模塊揭祕 | 17 期 | InnoDB 有哪幾種行鎖？

InnoDB 有哪幾種行鎖，其中比較特殊的插入意向鎖爲什麼而存在？作者：操盛春，愛可生技術專家，公衆號『一樹一溪』作者，專注於研究 MySQL 和 OceanBase 源碼。愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫

2024-05-23 00:11:23

在一次滲透中學會編寫Tamper腳本

拿到這個網站，通過對比查詢，我們發現閉合參數 finsh 時，查詢出的內容更多經過進一步判斷，確實存在漏洞不過在測試的時候發現存在一定的過濾但是可以通過內聯註釋進行繞過。這裏也是加深瞭解了內聯註釋的知識點，之前只會簡單的

2024-05-22 11:16:41

MySQL 隱式轉換必知必會

在生產環境中經常會有一些隱式類型轉換導致SQL索引失效，性能極差，進而影響影響集羣負載和業務的情況。本文總結了隱式轉換常見的場景，在生產中要儘量避免 SQL 隱式轉換的出現。作者：張洛丹，熱衷於數據庫技術，不斷探索，期望未來能夠撰寫更有

2024-05-22 00:02:44

linux加載動態庫失敗

一般我們在Linux下執行某些外部程序的時候可能會提示找不到共享庫的錯誤, 比如: tmux: error while loading shared libraries: libevent-1.4.so.2: cannot open sha

2024-05-21 00:52:55

24小時熱門文章

最新文章

最新評論文章