快下班了,正好準備去買彩票,就順手寫了2個腳本,一個用來下載最近的彩票數據,一個用來統計彩票數字,分享給大家!
彩票數據獲取並寫入excel表格
數據來源自己看吧~用外鏈通不過。。。
所用庫:xlwt,requests,lxml
有幾點需要注意的:
1、構建列表。因爲存入excel文件的時候用的是列表,所以新建一個函數,分別取網頁5個數據:時間、期數、開獎數123,然後每一頁嵌套寫入列表類似結構爲[[時間、期數、開獎數1,2,3],[時間、期數、開獎數1,2,3]……],在循環頁數,獲取所有的數據!注意構建列表的形式和列表結果,這個在你寫入表格的時候很重要!
2、寫入數據。xlwt寫入文件的方法爲ws.write(行,列,數據),按行寫入文件,所以新建一個變量line(代碼第36行),每寫入一行自增1。
其他方面都很簡單,沒有反爬,就是爲了獲取數據,好做分析!
最後excel表中的數據
是這樣的:
最後大概有4840行數據,足夠我們分析的了!
數據處理
用xlrd庫就可以~話說xlwt庫和xlrd庫好像就是一個寫數據,一個讀數據。。。
就寫了一個抓熱門數字的,也就是取頻率最高的。如果您有更好的想法或者玩法,可以自行去實現哦!
先讀取數據,然後取到每一行的2.3.4列,每一列寫入一個列表(現在有些後悔,不該寫那麼多數據進來),然後3個列表合併一個總列表,這樣我們就有了4個列表,取出每一個列表中出現次數最多的那個數字,代碼如下:
第1個數字頻率最高的是 [3]
第2個數字頻率最高的是 [6]
第3個數字頻率最高的是 [8]
單個數字頻率最高的是 [3]
因爲趕時間下班。。就全部用了列表推導式,也沒有用pandas庫或者可視化庫做出很炫酷的圖表,等我研究出完美的預測方案的時候在做【手動哭泣】,不過依現在的趨勢,是沒什麼希望了。。。
最後要說的是,從開始研究分析各種數據到現在習慣性的買彩票,沒中過大獎(超過200的都算大獎)!果然童話都是騙人的……還是學python比較好玩!
我有一個微信公衆號,經常會分享一些python技術相關的乾貨;如果你喜歡我的分享,可以用微信搜索“python語言學習”關注
歡迎大家加入千人交流答疑裙:699+749+852