pymysql流式遊標

原創

2020-06-12 22:47

Python通過pymysql操作向mysql讀取千萬、百萬級別的數據庫時

如果用傳統的fetchall()或fetchone()方法，都是先默認在內存裏緩存下所有行然後再處理，大量的數據會導致內存資源消耗光，內存容易溢出

此時則建議使用SSCursor(流式遊標)，避免客戶端佔用大量內存

這個 cursor 實際上沒有緩存下來任何數據，它不會讀取所有所有到內存中，它的做法是從儲存塊中讀取記錄，並且一條一條返回給你,使用迭代器而不用 fetchall ,即省內存又能很快拿到數據

例：

def select_pan_url(self):
    db = pymysql.connect(host='localhost', port=3306, user='root', passwd='', db='')
    cursor = db.cursor(cursor=pymysql.cursors.SSDictCursor)

    select_sql = "select `name`, `detail_url`, `pan_title`, `pan_psw`, `pan_real_url` from agepan_wj"
    try:
        cursor.execute(select_sql)
        # 在處理大量數據時可以分割進行
        datas = cursor.fetchall()
        for pan in datas:
            self.row_lists.append(pan)
    except Exception as e:
        print('取數據失敗', e)
        db.rollback()
    finally:
        cursor.close()
        db.close()

需要注意的是：

因爲SSCursor是沒有緩存的遊標，結果集只要沒取完，這個connect是不能再處理別的sql，包括另外生成一個cursor 也不行的，如果需要幹別的，請另外再生成一個連接對象

每次讀取後處理數據要快，不能超過 60 s，否則mysql將會斷開這次連接

也可以修改SET NET_WRITE_TIMEOUT = xx來增加超時間隔

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

最新美團面試集合（一面+二面+三面+重點技術面試題）附面試解析

一面 1. 簡短自我介紹 2. 事務的ACID，其中把事務的隔離性詳細解釋一遍 3. 髒讀、幻影讀、不可重複讀 4. 紅黑樹、二叉樹的算法 5. 平常用到哪些集合類？ArrayList和LinkedList區別？HashMap內部數據結構

2023-10-10 01:43:49

ORDER BY id 爲何效率不高

ORDER BY id 爲何效率不高背景系統代碼中有以下查詢SQL，DBA要求優化； SELECT id, user_id, patient_id, his_id, bill_no, log_model FROM platfom_fee

2023-09-30 22:32:45

Linux環境下的主流技術部署（基於Docker容器）

搞了臺阿里雲服務器，準備學習下基於Docker容器的各種主流技術部署，那麼讓我們愉快的開始吧！ Docker環境安裝安裝yum-utils：yum install -y yum-utils device-mapper-pe

2023-02-25 00:27:07

MySQL探祕(四):InnoDB的磁盤文件及落盤機制

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

程序员历小冰

2021-12-08 12:33:52

Oracle 大佬離職，怒噴 MySQL “糟糕的數據庫”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 19:58:57

如何使用 MySQL 慢查詢日誌進行性能優化 - Profiling、mysqldumpslow 實例詳解

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-24 16:08:53

騰訊雲竇賢明：單一數據庫不能解決所有問題

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-15 15:28:51

全網播放超 5億的秒級實時臺網互動是如何實現的？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-15 15:03:49

API網關Kong實戰

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"1.Kong介紹",

2021-10-18 13:23:55

獨一無二的「MySQL調優金字塔」相信也許你擁有了它，你就很可能擁有了全世界。

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"開發俏皮話","at

2021-10-14 11:03:55

Linux 系統安裝mysql過程記錄

Linux 系統安裝mysql過程記錄資源清單 1 mysql mysql-5.6.37-linux-glibc2.12-x86_64.tar.gz 2 linux CentOS release 6.9 (Fin

2021-09-11 21:14:10

StarRocks v2.0.1 測試使用報告

1. 測試背景 starrocks 2.0.1版本使用低基數全局字典優化後，性能有很大提升，這是準備重點測試部分，測試後對於聚合sql有明顯的性能提升。當然企業中統計分析中多維數據分析的場景也比較多，有助於整體的性能提升，大家可以規劃合適

2024-04-26 11:25:42

WebAPI接口測試數據庫操作

通常我們是不建議直接查看數據庫內容來檢查功能的，但是在沒有外部接口或者圖形界面驗證的情況下，只能通過查詢數據庫來驗證。比如我們手工需要從界面上添加一萬條數據，估計要花好幾天時間，顯然不能手工去操作。那麼有一種方法就是：直接操作數據庫，把數

2021-12-25 21:15:09

tushare專題-金融股票數據獲取正確姿勢

首先通過 Anaconda 安裝攜帶安裝好 python 安裝見官網，https://docs.anaconda.com/anaconda/install/windows/ 如果XX module沒有，請命令行 pip3 install X

2021-08-23 21:29:30

seafile服務器使用腳本搭建

1.安裝步驟 https://github.com/haiwen/seafile-server-installer-cn https://manual.seafile.com/deploy/using_mysql/ 2.

2021-08-19 21:23:16

24小時熱門文章

最新文章

最新評論文章