原创 Python 單例模式

首先,我們先創建一個測試用例 def test_sig(sig_class): a = sig_class(1) print("a = {}(1)\na.value={}".format(sig_class.__name__

原创 關於百度翻譯接口的一點吐槽

語言代碼既不符合ISO 639-2,也不符合 ISO-639-1 簡直了…………

原创 lxml 解析巨大深嵌套DOM樹的問題

今天客戶反映,我們的微信爬蟲,有一篇文章的信息不全:問題鏈接 仔細觀察之後,我們發現,這篇文章是由135微信編輯器生成的,正文內容的DOM樹非常深,有幾百層。 使用 lxml.etree.HTML(text).xp(xpath)進行解析的時

原创 mongo性能: TPS從1000到20000

我在redis裏存了一個10億的set。別問我爲啥存這麼多……………… 然後佔了接近100G內存……………… 然後我就想倒出來,參考了幾篇文章,把TPS從1000多提升到了2萬。 多線程(最主要的) batch insert redis