原创 shell腳本介紹與基本使用(三)
運算符 例: num1=11 num2=22 sum=num1+num2 echo $sum 格式:expr m + n 或 $((m+n)) (注意expr運算符之間要有空格) expr
原创 Python的文本對比模塊difflib
2.1 文件內容差異對比方法 difflib作爲Python的標準庫模塊,無需安裝,作用是對比文本之間的差異,且支持輸出可讀性較強的html文檔,與Linux下的diff命令相似。我們可以使用difflb對比代碼、配置文件的差
原创 shell腳本介紹與基本使用(四)
流程控制語句 if/else命令 1.單分支if條件語句 if [ 條件判斷式 ] then 程序 fi 或者 if [ 條件判斷式 ];then 程序 fi eg:#!/bin/s
原创 決策樹算法(三)
5.決策樹的劃分依據三——基尼值和基尼指數 5.1概念 CART 決策樹 [Breiman et al., 1984] 使用"基尼指數" (Gini index)來選擇劃分屬性. CART 是Classification and
原创 shell腳本介紹與基本使用(二)
6.shell變量 變量:是shell傳遞數據的一種方式,用來代表每個取值的符號名。當shell腳本需要保存一些信息時,如一個文件名或是一個數字,就把它存放在一個變量中。 變量設置規則: 1.變量名稱可以由字母,數字和下劃
原创 Python的系統性能模塊psutil
1.1系統性能模塊psutil psutil是一個跨平臺庫,能夠實現獲取系統運行的進程和系統利用率(包括cpu、內存、磁盤、網絡等)信息。它主要應用於系統監控,分析和限制系統自願及進程的管理。它實現了同等命令行工具提供的功能,
原创 反爬與反反爬(二)圖片驗證碼
8.圖片驗證碼 1.什麼是圖片驗證碼 驗證碼(CAPTCHA)全自動區分計算機和認類的圖靈測試,是一種區分用戶是計算機還是人的全自動程序 1.1驗證碼的作用 防止惡意破解密碼、劇票、論壇灌水、刷頁。 1.2圖片驗證碼在爬蟲
原创 爬蟲之JS解析,Python模擬JS代碼運行。(附帶模擬人人網登錄案例)
六、JS解析 1.定位js文件 1.通過initiator定位到js文件 2.通過search搜索關鍵字定位到js文件 3.通過元素綁定的事件監聽函數找到js文件,Event Listeners 注:三種方法不能保證每一種都能找
原创 決策樹算法(五)
9.決策樹算法API class sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None) criterion
原创 推薦算法及其一個算法案例
三、推薦算法 1)推薦模型構建流程 Data(數據)—>Features(特徵)—>ML Algorithm(選擇算法訓練模型)—>Prediction Output(預測輸出) 數據清洗/數據處理 數據來源 顯性數據 比
原创 推薦系統的設計
二、推薦系統的設計 1)推薦系統的要素 UI和UE(前端界面) 數據(Lambda架構) 業務知識 算法 2)推薦系統架構 推薦系統的整體架構 大數據Lambda架構 Lambda架構是實時大數據處理框架 L
原创 Python的DNS處理模塊dnspython
1.3 DNS處理模塊dnspython dnspython(http://www.dnspython.org/)是Python實現的一個DNS工具包,它支持幾乎所有的記錄類型,可以用於查詢、傳輸並動態更新ZONE信息,同時支
原创 Mongodb數據庫的增刪改查(三)
Mongodb的增刪改查 7.1mongodb插入數據 命令:db.集合名稱.insert(document) db.stu.insert({name:'wtt',gender:1}) db.stu.insert({_id:"
原创 Mongodb數據庫入門(一)
七、Mongodb數據庫 mongodb數據庫主要用於海量存儲,常被用在數據採集項目中。 1.mongodb的介紹 1.1什麼是mongodb mongodb是一個功能最豐富的NoSQL非關係型數據庫。由C++語言編寫 mong
原创 Mongodb數據庫入門(二)
3.mongodb的簡單使用 3.1 mongodb服務端的啓動 默認端口號:27017 默認配置文件的位置:/etc/mongod.conf 默認的日誌位置:/var/log/mongodb/mongod.log mongo