原创 股價翻番 人生贏家,python爬取基金 篩選股票

前言: 聽說你想要變富?那就沉住氣慢慢來吧,沒聽過這句名言麼:“窮人總是不想慢慢的變富”。都想着一夜暴富,中個caipiao啥的,可哪有那麼幸運呢?總不能像我一樣中了78萬的cai piao,然後自己偷偷的花吧。 想要慢慢的變富有,只要理好

原创 自己動手造“輪子”---python常用的幾個方法

前言:由於工作內容的原因,經常需要些python腳本,久而久之,發現有一些方法經常用到,於是就自己動手編輯了一些常用的、大衆的、通用的方法。小弟不才,但也希望能爲開源做做貢獻。 最後再附上代碼哈; 一、目前該文件中只總結了五個方法: 1、p

原创 use options instead of chrome_options 問題的解決

使用 selenium可以調用 google、firebox等瀏覽器進行爬蟲的爬取,但當我運行: from selenium import webdriver from selenium.webdriver.chrome.options i

原创 爬蟲+正向代理,30+行代碼我爬取了[鏈家]3000+條數據

北京這麼大,總有一套房子適合自己; 一、選擇目標網站: 鏈[lian]家[jia]:https://bj.lianjia.com/點擊【租房】,進入租房首頁:這就是要爬取的首頁了; 二、先爬取一頁 1、分析頁面右擊一個房源的鏈接,點擊[檢查

原创 scrapy框架爬取大樂透數據

github項目地址: https://github.com/v587xpt/lottery_spider# 上次做了一個雙色球的數據爬取,其實大樂透的爬取也很簡單,使用request就可以爬取,但是爲了更好的進步,這次爬取大樂透採用了s

原创 30行python代碼爬取歷年雙色球

當年學爬蟲的第一個想法就是想把雙色球的數據爬下來,然後看能不能用什麼牛叉的算法,或者數據分析把後面的雙色球概率算出來;知道現在才抽空寫了這幾行代碼爬取了雙色球的數據,我也真是夠懶的;也算是閒來無事,練手的爬蟲吧;好了,多餘的就不說了,直接上

原创 小白的python爬蟲,40代碼教你爬取豆瓣小說

這篇文章寫了很久了,一直沒有發佈;爬蟲學的差不多了,覺得這篇文章對新手實踐還是有些作用的。畢竟這也是我剛學爬蟲的時候練習的,爬取了比較好爬的網站,也比較經典;多餘的解釋不說了,代碼裏每一行都有註釋,解釋的很清楚;後續有時間的話還會發布一些爬

原创 docker容器利用pipework橋接網絡跨主機通信

docker容器的跨主機通信有好多種方案,此處用的是橋接物理網卡的方式實現的;. 一、新建網卡,並橋接物理網卡; 在宿主機上新建一個網卡,並橋接物理網卡,可以使用 nm-connection-editor 命令進入圖形化界面進行配置,也可以

原创 利用amoeba(變形蟲)實現mysql數據庫讀寫分離

關於mysql的讀寫分離架構有很多,百度的話幾乎都是用mysql_proxy實現的。由於proxy是基於lua腳本語言實現的,所以網上不少網友表示proxy效率不高,也不穩定,不建議在生產環境使用;amoeba是阿里開發的一款數據庫讀寫分離

原创 nginx搭建雙活、高可用DNS服務器

內容簡介:關於dns服務器,有的公司是使用公共的dns,如:222.222.222.222、114.114.114.114等,也有的公司選擇搭建自己的dns,能靈活更改配置來滿足公司內部的需求;我所在公司是一家做語音呼叫、轉發的客服公司,屬

原创 linux病毒防禦軟件clamav安裝使用

先附上官網的安裝 : http://www.clamav.net/documents/installing-clamav ; Clam AntiVirus(ClamAV)是免費而且開放源代碼的防毒軟件,軟件與病毒碼的更新皆由社羣免費發佈

原创 解決挖礦病毒佔用cpu以及誤刪 ld-linux-x86-64.so.2 文件的問題

上次已經被抓去挖礦了當了一次曠工了,本以爲解決了,沒想到竟然死灰復燃。 這次佔用cpu的依然是一個ld-linux的進程,kill掉之後同樣就查了關於test用戶的進程,果然,test用戶的進程有100+個,比不上上次,還是用上次的腳本,將

原创 python調用百度AI提取圖片文字

python本身也有識別圖片轉文字的框架,但是相比調用接口,識別的精度就略顯不行了; 這是 百度AI 的網站: https://ai.baidu.com/ ; 點擊右上角的 控制檯 ,申請或者登陸; 進去之後左側有 【文字識別】:點擊【創建

原创 Linux 命令行中使用 tcpdump 抓包

tcpdump 是一個命令行實用工具,允許你抓取和分析經過系統的流量數據包。它通常被用作於網絡故障分析工具以及安全工具。tcpdump 是一款強大的工具,支持多種選項和過濾規則,適用場景十分廣泛。由於它是命令行工具,因此適用於在遠程服務器或

原创 linux服務器crontab定時任務

※ cron是一個linux下的定時執行工具,可以在無需人工干預的情況下運行作業。由於Cron 是Linux的內置服務,但它不自動起來,可以用以下的方法啓動、關閉這個服務:service crond start //啓動服