原创 GBDT+LR 入門+實例

GBDT-LR思想利用GBDT生成特徵在利用LR對特徵值進行擬合。 GBDT是梯度提升決策樹,由多棵樹組成。構造一個決策樹,根據已有的模型和實際樣本輸出的殘差上再構造一顆決策樹,不斷地進行迭代。 每一次迭代都會產生一個增益較大的分

原创 java工程讀取文件方式及文件加載方式File ResourceUtils ClassPathResource jar加載失敗處理

java工程讀取文件方式及文件加載方式File ResourceUtils ClassPathResource jar加載失敗處理 文件讀取方式(按行或全部讀取) 文件記載方式 File 1.讀取方式 按行讀取 Buff

原创 深度學習常見概念和keras網絡

深度學習常見概念和keras網絡 梯度下降 loss function 優化 keras主要網絡 keras建立model 1.梯度下降 隨機梯度下降 小批量梯度下降 帶動量梯度下降 (更快的梯度下降) adagrad (調

原创 關鍵詞提取-TFIDF

TF-IDF 用於提取關鍵詞,那麼如何從多個文檔中提取出關鍵詞。文章的關鍵詞可能有什麼規律,表示文章主要意思,那這個詞應該在該文章中出現多次,但是在其他文章中出現次數不多。 TF 詞頻 (Term Frequency)表示w在文檔

原创 keras模型部署 flask & tfserving

keras訓練後的模型可以用兩種方法實現。 利用keras的save方法保存模型成h5格式。利用python web框架加載h5模型並利用api請求對外提供http請求 生成pb格式,利用tfserving加載pb模型。提供ht

原创 圖片分類常見處理流程

圖片分類常見處理流程 樣本來源 競賽官方提供 爬蟲(selenium+urllib2+可以搜圖的網站) 初始化webdrive,設置代理 初始urllib2 設置代理 driver =webdrive.FireFox()

原创 機器學習問題處理流程

1.加載數據,查看總體情況pandas。如果文件過大則用chunck分塊 head() info() describe() 注意缺失值 2.數據預處理 離羣點 根據數據說明判斷是否要去除 數據是否符合正態分佈。如果用迴歸模型

原创 文本分類模型處理流程

文本分類模型處理流程 1.樣本整理 2.數據預處理 直接按照字符處理可以使用keras的api Tokenizer(char_level=True) 建立字符數字索引 text_to_sequences() 將句子轉成數字 p

原创 mybatis插入單個對象 多個對象 key衝突更新操作

在mybatis操作過程中會有插入對象,批量插入表格等情況。下面對常見幾種情形進行示例: //根據id批量獲取一批用戶信息 List<User> queryByIds(List<Integer> Ids); //批量插入user

原创 模型實踐(一)

對之前一節部分進行實踐,使用keras進行實現,keras關於循環神經網絡有多個方法。https://keras.io/zh/layers/recurrent/ SimpleRNN LSTM+CNN 樣本 使用ai挑戰賽用戶評

原创 BIO 僞異步IO NIO 說明示例

網絡IO編程基本模型是C/S,即客戶端服務端通信。但對於傳統通信方式服務會被阻塞。下面介紹幾種非同步通信方式。 BIO 開啓單獨線程進行端口監聽,對每個請求開啓一個線程進行相應 僞異步IO 服務端開啓一個線程池,請求從線程池中隨

原创 spring之入門ioc(控制反轉)di(依賴注入)

spring是一個容器管理框架。 重點: ioc 控制反轉,以往對象的創建式通過new方式,現在對應都由spring管理通過反射形式將對象初始化放在spring容器中。 di 依賴注入,bean與bean之間根據依賴關係進行引用

原创 spring之入門 bean生命週期

spring bean生命週期主要分爲初始化創建、使用、銷燬。下面詳細介紹這個過程。 1實例化bean 通過加載xml文件。 2設置bean屬性值 3調用BeanNameAware setBeanName 4調用BeanFac

原创 conda install & pip install區別 & 查看當前環境下包的情況

conda可以方便開發管理python環境,包可以conda 安裝有時使用pip整理一下不同點。 conda 創建環境 conda create --name a_conda_env python=3.6 名爲a_conda_env

原创 機器學習實戰(基於Sklearn和tensorflow)第三章 分類 學習筆記

機器學習實戰 書籍第三章例子學習筆記 書中源碼,here 本文地址,here 要分爲Mnist數據處理、交叉驗證、混淆矩陣、精度、多分類問題等。 加載數據 可以從本地下載 fetch_mldata下載較慢,可以下載到本地 鏈接:ht