原创 批量取文件
file_dir='G:/2017年更新2018年樓盤/' for root, dirs, files in os.walk(file_dir): # print(root) # 當前目錄路徑 # pri
原创 jieba(結巴)分詞的使用
""" jieba添加自定義詞或詞庫 """ import jieba str_text="李小福是創新辦主任也是雲計算方面的專家" str_jing2=jieba.cut(str_text,cut_all=False) prin
原创 python的全文檢索庫Whoosh使用示例
pip install whoosh 首先,我有一個xiaoshuo文件夾,裝了幾部小說 直接上代碼: 首先是創建索引的文件 from whoosh.filedb.filestore import FileStorage fr
原创 python爬蟲重試模塊
from retrying import retry @ retry(stop_max_attempt_number = 10) #讓被裝飾的函數反覆執行10次,10次全部報錯纔會報錯, 中間有一次正常就繼續往下走 def g
原创 爬取小說並在手機上看
有時候在手機APP軟件上看的一部小說到某一章看不了了,是vip章節,我在電腦瀏覽器上搜了下發現網頁上是有全本的,都能看。但是網頁廣告多,啥都有,一不小心就點進去了,很是麻煩。我想,爬下來吧。。。 很簡單的小爬蟲,網站也沒有啥反爬,
原创 python使用replace做多字符替換
如果需要替換的字符比較少,我們可以直接寫出來,但是多的話,就要用for循環了,先看需要替換的字符比較少的時候,很簡單 代碼1: text='我愛我家' #'我'替換爲'他','家'替換爲'空' data=text.replace(
原创 python使用pyqt5自制成語接龍
前段時間看了下pyqt5,還寫了個計算器玩玩,python使用pyqt5製作計算器,前面也寫過一個成語接龍的小程序,自制成語接龍。就想着把他倆結合一下,做個有界面的成語接龍玩玩。 代碼如下: 首先是chengyu.py,這個文件是
原创 關於python爬蟲post請求
今天搞爬蟲代碼,明明能找到post請求網址,以及請求需要帶的參數,但是寫到代碼裏就是不行 運行結果卻出了問題 後面找到了問題 只需要將data數據json格式化一下 結果 完美收工
原创 獲取多進程函數返回值
from multiprocessing import Process from multiprocessing import Manager def a(x): b=1+2 x[b]=b if __name__=
原创 圖片文字識別各種方法比較
網上有很多種圖片文字識別方法,我這選了幾種,做下比較 代碼在這: import tesserocr from PIL import Image import pytesseract def a(): #這是一種辦法,使用
原创 python 爬取doc文檔
doc_href='https://resource.lzbank.com:18106/cportalFileServer/files//site/doc/pc/20201/12021/goods/2020052117240860
原创 python代碼中寫sql語句的模糊查詢
cp_name='產品名稱' db = pymysql.connect(host="127.0.0.1", user="root", password="", db="demo", port=3306,charset='utf8'
原创 推薦一個在線格式化顯示json網址
因爲疫情,在家呆了很久,也失業了,emmmmm。。。。 剛找到工作,公司老人給我推薦了一個json格式化顯示網址 https://json.cn 複製想要顯示的json文本內容放到位置1,位置2會自動顯示json樣式,方便數據
原创 自制成語接龍
都是用的基礎的語法,很好理解 前提先爬取一些成語,我爬的搜出來的這些,代碼在 爬取一些成語 爬出來的txt放在同級目錄下面就好了 import random def get_list(): with open("che
原创 if ...if和if...elif區別
我一直以爲寫if還是elif都是一樣的,今天沒事做了下試驗,證明凡是存在的都是合理的。。。。。不會存在無謂的東西。 通過運行下面的代碼我可以看出,if…elif的邏輯是,程序先走if,能走就走,走完就不走elif了,走不通的情況才