原创 深度學習模型提升模型效果的常見方法

在訓練集上表現不好,需要降低bias: 調整超參數,如設置更深更寬的網絡 訓練更長的時間 選擇其它特徵學習函數(CNN、RNN、LSTM、GRU等) 在驗證集上表現不好,需要降低方差: 引入正則化(如L2) 引入dropou

原创 SAS® Model Manager功能調研

  基本概念 使用SAS Model Manager,可以將模型存儲在公共模型存儲庫中,並在項目和文件夾中組織它們。還可以評估模型以選擇冠軍模型,監控模型的性能以及發佈模型。 Model Manager提供了多維度的模型管理功能,如下所示

原创 機器學習的行業與場景總結

行業與場景 金融服務 風險管理 信用評分 預測分析 客戶流失 欺詐檢測 違約風險 貸前客戶評分 貸後違約預測 網點備付金智能預測 保險 索賠管理 客戶流失 欺詐識別 反洗錢

原创 《TensorFlow 2.0深度學習算法實戰教材》學習筆記(四、TensorFlow 進階)

合併與分割 合併 張量的合併可以使用拼接(Concatenate)和堆疊(Stack)操作實現,拼接並不會產生新的維度,而堆疊會創建新維度。選擇使用拼接還是堆疊操作來合併張量,取決於具體的場景是否需要創建新維度。 拼接 在Tens

原创 Hive鑑權方式說明

  當通過JDBC方式訪問Hive數據庫時,可以通過在連接參數中將“AuthMech”設置爲不同的值來使用不同的鑑權方式,如下給出各種鑑權方式的連接串示例 不使用鑑權:在連接參數中將“AuthMech”屬性設置爲“0” 連接串示例:

原创 《TensorFlow 2.0深度學習算法實戰教材》學習筆記(三、TensorFlow 基礎)

數據類型 TensorFlow 中的基本數據類型,它包含了數值型、字符串型和布爾型。 數值類型 數值類型的張量是TensorFlow 的主要數據載體,分爲: 標量(Scalar) 單個的實數,如1.2, 3.4 等,維度數(Di

原创 產品設計思維工具(2019年做產品的一點總結)

  序號 方法 應用場景/說明 1 先使用文字陳述出所有已知信息,再進行精簡 界面Label定義 文字描述 2 將信息結構化 界面信息排列,結構化可以提供良好的閱讀理解以及擴展能力 3 思考用戶

原创 sklearn訓練模型、保存模型文件(文本、pkl)、模型文件轉換(pkl2onnx)以及模型可視化

1.使用環境 IDE:Jupyter Lab,使用Python2 kernel實現 模型可視化:GraphViz,可以直接在jupyter中使用;Netron    window版本 模型轉化:在onnx/onnx-ecosystem容器

原创 產品工作中/閱讀中的涓滴意念

工作中/閱讀中的涓滴意念,也許在未來某個一籌莫展的時刻能讓我茅塞頓開。

原创 在Jupyter Notebook中調用ML模型服務圖像標題生成器

說明:寫本文的目的主要是驗證如何在Jupyter Notebook中通過API調用機器學習模型服務。 1、環境說明 CentOS7(部署在VMware Workstation Pro中的虛擬機) 需要安裝有docker 2、前提條件:鏡

原创 《TensorFlow 2.0深度學習算法實戰教材》學習筆記(八、過擬合)

機器學習的主要目的是從訓練集上學習到數據的真實模型,從而能夠在未見過的測試集上面也能夠表現良好,我們把這種能力叫做泛化能力。 提到了模型的表達能力,也稱之爲模型的容量(Capacity)。當模型的表達 能力偏弱時,比如單層線性層,

原创 《TensorFlow 2.0深度學習算法實戰教材》學習筆記(一、人工智能緒論)

人工智能緒論 人工智能,機器學習,神經網絡,深度學習之間關係 機器學習分類 機器學習可以分爲有監督學習(Supervised Learning)、無監督學習(Unsupervised Learning)和強化學習(Rei

原创 YellowBrick-聚類評估示例

Yellowbrick庫是一個機器學習的診斷可視化平臺,可用於引導數據科學家進行模型選擇。它用一個新的核心對象擴展了SciKit學習API:可視化工具。可視化工具允許模型作爲SciKit學習管道過程的一部分進行擬合和轉換,在高維數據轉換過

原创 在Jupyter Notebook中實現圖像檢測服務的調用

1、環境說明 CentOS7(部署在VMware Workstation Pro中的虛擬機) 需要安裝有docker 2、前提條件:鏡像準備 部署了圖形檢測服務的鏡像:codait/max-object-detector Github地

原创 《TensorFlow 2.0深度學習算法實戰教材》學習筆記(六、反向傳播算法)

反向傳播算法和梯度下降算法是神經網絡的核心算法。 導數與梯度 導數本身是標量,沒有方向,但是導數表徵了函數值在某個方向Δ𝒙的變化率。在這些任意Δ𝒙方向中,沿着座標軸的幾個方向比較特殊,此時的導數也叫做偏導數(Partial Der