pickle——保存python中數據結構的模塊

原創

2020-06-25 10:55

前些天自己借用《machine learning in action》一書中的FP-Growth代碼，實現了頻繁項集的發現和關聯規則的挖掘。由於數據量比較大，在用python跑的時候有時會出現kernel die的提示，kernel重啓後又要重新從數據庫裏讀數據、整理、發現頻繁項集，實在不要太麻煩。於是就想基於spark實現，沒準兒這些七七八八的毛病就好了呢？

在spark上實現後，尷尬的事情發生了。同一算法，spark上算出的頻繁項集個數竟然和《machine learning in action》中的代碼算出來的個數不同。好奇寶寶於是想一探究竟，怎麼比較兩段代碼得到的頻繁項集呢？沒錯，就是利用pickle模塊！

python的pickle模塊（泡菜模塊）可以將python的數據結構，如list、tuple、dict等等都存在一個文件中，方便這些結構的持久化，同時也簡化了代碼。簡單用法如下:

import pickle

#數據保存
temp_dict1 = {'001':'hello', '002':'world'}
file = open('test.pkl', 'wb')
pickle.dump(temp_dict1, file)
file.close()

#數據加載
file = open('test.pkl', 'rb')
temp_dict2 = pickle.load(file) #取出的temp_dict2 就可以爲我們所用了
file.close()

這樣，就已經可以滿足我比較兩個列表的想法了

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

pickle——保存python中數據結構的模塊

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

Java ThreadPoolShutdown

5月21日相聚上海張江！與文心大模型一起共建大模型產業應用生態圈

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

“她”來了，陪伴賽道鉅變！爲GPT-4o加上你的一個數字分身

京東秒送售後系統退款業務重構心得| 京東零售技術團隊

pickle——保存python中數據結構的模塊

python數據挖掘入門與實戰——學習筆記（第5、6章）

python數據挖掘入門與實戰——學習筆記（第1、2章）

python數據挖掘入門與實戰——學習筆記（第3、4章）

使用sklearn實現tfidf特徵計算

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結