原创 批量取文件

file_dir='G:/2017年更新2018年樓盤/' for root, dirs, files in os.walk(file_dir): # print(root) # 當前目錄路徑 # pri

原创 jieba(結巴)分詞的使用

""" jieba添加自定義詞或詞庫 """ import jieba str_text="李小福是創新辦主任也是雲計算方面的專家" str_jing2=jieba.cut(str_text,cut_all=False) prin

原创 python的全文檢索庫Whoosh使用示例

pip install whoosh 首先,我有一個xiaoshuo文件夾,裝了幾部小說 直接上代碼: 首先是創建索引的文件 from whoosh.filedb.filestore import FileStorage fr

原创 python爬蟲重試模塊

from retrying import retry @ retry(stop_max_attempt_number = 10) #讓被裝飾的函數反覆執行10次,10次全部報錯纔會報錯, 中間有一次正常就繼續往下走 def g

原创 爬取小說並在手機上看

有時候在手機APP軟件上看的一部小說到某一章看不了了,是vip章節,我在電腦瀏覽器上搜了下發現網頁上是有全本的,都能看。但是網頁廣告多,啥都有,一不小心就點進去了,很是麻煩。我想,爬下來吧。。。 很簡單的小爬蟲,網站也沒有啥反爬,

原创 python使用replace做多字符替換

如果需要替換的字符比較少,我們可以直接寫出來,但是多的話,就要用for循環了,先看需要替換的字符比較少的時候,很簡單 代碼1: text='我愛我家' #'我'替換爲'他','家'替換爲'空' data=text.replace(

原创 python使用pyqt5自制成語接龍

前段時間看了下pyqt5,還寫了個計算器玩玩,python使用pyqt5製作計算器,前面也寫過一個成語接龍的小程序,自制成語接龍。就想着把他倆結合一下,做個有界面的成語接龍玩玩。 代碼如下: 首先是chengyu.py,這個文件是

原创 關於python爬蟲post請求

今天搞爬蟲代碼,明明能找到post請求網址,以及請求需要帶的參數,但是寫到代碼裏就是不行 運行結果卻出了問題 後面找到了問題 只需要將data數據json格式化一下 結果 完美收工

原创 獲取多進程函數返回值

from multiprocessing import Process from multiprocessing import Manager def a(x): b=1+2 x[b]=b if __name__=

原创 圖片文字識別各種方法比較

網上有很多種圖片文字識別方法,我這選了幾種,做下比較 代碼在這: import tesserocr from PIL import Image import pytesseract def a(): #這是一種辦法,使用

原创 python 爬取doc文檔

doc_href='https://resource.lzbank.com:18106/cportalFileServer/files//site/doc/pc/20201/12021/goods/2020052117240860

原创 python代碼中寫sql語句的模糊查詢

cp_name='產品名稱' db = pymysql.connect(host="127.0.0.1", user="root", password="", db="demo", port=3306,charset='utf8'

原创 推薦一個在線格式化顯示json網址

因爲疫情,在家呆了很久,也失業了,emmmmm。。。。 剛找到工作,公司老人給我推薦了一個json格式化顯示網址 https://json.cn 複製想要顯示的json文本內容放到位置1,位置2會自動顯示json樣式,方便數據

原创 自制成語接龍

都是用的基礎的語法,很好理解 前提先爬取一些成語,我爬的搜出來的這些,代碼在 爬取一些成語 爬出來的txt放在同級目錄下面就好了 import random def get_list(): with open("che

原创 if ...if和if...elif區別

我一直以爲寫if還是elif都是一樣的,今天沒事做了下試驗,證明凡是存在的都是合理的。。。。。不會存在無謂的東西。 通過運行下面的代碼我可以看出,if…elif的邏輯是,程序先走if,能走就走,走完就不走elif了,走不通的情況才