機器學習（Coursera吳恩達）（八其他）

原創

2018-08-31 03:28

機器學習（Coursera吳恩達）（八其他）

標籤（空格分隔）：機器學習

異常檢測(anomaly detection)

異常檢測問題：假設有一個新飛機，引擎有特徵變量 $x_{t e s t}$ ，異常檢測就是我們希望制導這個新的飛機引擎是否有某種異常。
給定數據集 $x^{(1)}, x^{(2)} ， x^{(3)}, . . ., x^{(m)}$ ，假設數據集是正常的，我們希望制導新的數據 $x_{t e s t}$ 是不是異常的，即測試數據不屬於該組數據的機率。

這種方式稱爲密度估計，表達式如下：
$i f p (x) < ϵ a n o m a l y; p (x) > ϵ n o r m a l$
欺詐檢測： $x^{(i)} = 用户的第 i 个活动特征$
模型 $p (x)$ 是其屬於一組數據的可能性，通過 $p (x) < ϵ$ 檢測非正常用戶。
異常檢測主要是用來識別欺騙。

算法

對於給定的數據集 $x^{(1)}, x^{(2)} ， x^{(3)}, . . ., x^{(m)}$ ，我們要針對每一個特徵計算 $μ$ 和 $δ^{2}$ 的估計值。

μ_{j} = \frac{1}{m} \sum_{i = 1}^{m} x_{j}^{(i)}

δ_{j}^{2} = \frac{1}{m} \sum_{j = 1}^{m} (x^{(i)} - μ_{j})^{2}

一旦我們獲得了均值和方差的估計值，給定新的一個訓練實例，根據模型計算 $p (x)$ .
當 $p (x) < ϵ$ 爲異常。

數據集選擇

還是要用F1選擇閾值。判斷查準率和查重率。

與監督學習對比

選擇特徵

對於異常檢測算法，我們使用的特徵是至關重要的.
異常檢測假設特徵服從高斯分佈，例如使用對數函數： $x = l o g (x + c)$ ,其中 $c$ 爲非負數，或者 $x = x^{c}$ , c爲0-1之間的一個分數。

目的是讓數據特徵更接近高斯分佈。

推薦系統

引入標記：
* $n_{u}$ 代表用戶數
* $n_{m}$ 代表電影書
* $r (i, j)$ 如果用戶j給電影i評分，則爲1
* $y^{i, j}$ 用戶j給電影i的評分
* $m_{j}$ 用戶j評分過電影的綜述

基於內容

$θ^{(j)}$ 表示用戶j的參數。( $\in R^{n + 1}$ )
$x^{(i)}$ 電影i的特徵
用戶j和電影i，我們預測的評分爲 $(θ^{(j)})^{T} x^{(i)}$
代價函數針對用戶j：

爲了學習所有用戶，要對所有用戶的代價函數求和：

然後對這個總的代價函數使用梯度下降法求最優解。

協同過濾

現在，我們如果沒有對每一個電影都有評價，也就是沒有電影的特徵。因爲我們很難對每一個電影都設計合適的特徵，所以在我們擁有用戶評價的情況下，需要對每個電影學習特徵。
*協同過濾：是電影特徵與用戶參數協同學習。前提是我們不知道用戶的參數 $θ$ 也不知道電影的特徵 $x$ 。我們擁有的只有用戶對電影的評分。
修改優化目標：

對代價函數求偏導數：（對 $θ$ 和 $x$ 同時最小化）

算法步驟：
1. 初始 $x^{(1)}, x^{(2)} ， x^{(3)}, . . ., x^{(n_{m})}; θ^{(1)}, θ^{(2)} ， θ^{(3)}, . . ., θ^{(n_{u})}$
2. 使用梯度下降法最小化代價函數
3. 在訓練完之後，我們預測 $(θ^{(j)})^{T} x^{(i)}$ 爲用戶j對電影i的預測評分。

大規模學習算法

用學習曲線確定是否我們需要打大訓練集。
隨機梯度下降法
直接用梯度下降，對大規模系統來說每一次迭代都需要對所有數據進行誤差進行累加，那麼一次的計算量就會特別大。所以要找更快捷的方法，適用於大規模學習。
小批量梯度下降（Mini-batch）
隨機梯度下降收斂

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「機器學習_8」Bag-of-Words

Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子） 3. 侷限性 1.文字問題文本建模的一個問題是它很雜亂，機器學習算法之類的技術更喜歡定義明確的

2020-07-08 11:01:54

迴歸損失函數：L1 Loss, L2 Loss, Smooth L1 Loss

講解的很清楚： https://www.cnblogs.com/wangguchangqing/p/12021638.html

2020-07-08 10:39:04

變身漫畫道具玩了沒？這樣的 AI 人像特效機器學習服務幫你實現

近期，抖音上一款 “變身漫畫” 的特效刷爆“我的關注”，二次元漫畫樣式的畫風更是讓大家欲罷不能。從明星到路人，從大朋友到小朋友紛紛參與其中，抖音 App 中“變身漫畫”話題頁顯示約有 1851 萬餘人使用該道具。如今，此類視頻 / 圖片

2020-07-14 12:03:51

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

分類問題中的決策面畫法 (直觀理解plt.contour的用法)

摘要通過分類問題中決策面的繪製過程直觀理解matplotlib中contour的用法，主要包括對 np.meshgrid 和plt.contour的直觀理解。前言分類問題中，我們習慣用2維的dmeo做例子，驗證算法的有效性。

张王李刘赵孙杨

2020-07-08 11:10:55

KNN算法第二章 Pandas & sklearn 機器學習實戰 Machine Learning in action

本專欄計劃藉助Pandas與sklearn重新實現書中的實戰案例。 k-近鄰算法1. KNN算法流程2. KNN改進約會網站的配對效果2.1 數據準備：從文本中解析數據2.2 數據可視化：散點圖2.3 數據處理：歸一化數值2.4

2020-07-08 11:09:44

[R]聚類算法:k-means模組

延伸<[Excel]k-means聚類算法的應用，以評價現有供應商的水平為例。>文章，同時恰巧在圖書館看到一本R語言機器學習書籍，因此正好可進一步瞭解如何用R語言來實現k-means算法和應用，一併將k-means模組建立起來，做為未來參

2020-07-08 10:38:53

微信小程序之藍牙 BLE 踩坑記錄微信小程序之藍牙 BLE 踩坑記錄

微信小程序之藍牙 BLE 踩坑記錄前言前段時間接手了一個微信小程序的開發，主要使用了小程序在今年 3 月開放的藍牙 API ，此過程踩坑無數，特此記錄一下跳坑過程。順便開了另一個相關的小項目，歡迎 start 和 fork： B

不及格的程序員-八神

2022-11-01 14:10:27

被鄙視做不出3D效果的一天

UI設計點兒3D效果，切圖片後給前端用，前端按照圖片做出靜態效果，結果項目上不滿意。沒錯是我太菜了，菜的一批。心裏已經燃起學習three.js的慾望。

2020-07-08 12:31:12

opencv 加載tensorflow pb模型

opencv加載的pb模型必須是用tf.layers 和 tf.nn 下的api構建的,使用slim會在加載時報未知的layer的錯誤基本流程: 1.加載pb bool CardDetect::load_model(string mo

2020-07-08 12:23:28

Redis 數據持久化方案

Redis 數據持久化方案一、持久化方案 RDB（Redis DataBase）：指定的時間間隔內保存數據快照（SNAPSHOTTING），fork出子進程，之後再由子進程完成這些持久化的工作； AOF（Append Only

2020-07-08 12:09:41

GitHub中常用高頻操作

GitHub 常用命令建立克隆已經存在的一個版本庫 $ git clone ssh://[email protected]/repository.git(SSH協議) $ git clone https://github.co

不如烂笔头

2020-07-08 11:54:44

a標籤中使用onclick提示function未定義

<a href="javascript:;" onclick="text()">leave a message</a> 今天做東西的時候，發現在a標籤中使用onclick觸發函數，一直報錯，顯示function未定義，開始還以爲

2020-07-08 11:27:27

MCU初始化流程——從上電到main()之間

說明：以下介紹示例的MCU地址空間如下： ROM空間爲：0x0000 0000 – 0x0000 8000 RAM空間爲：0x2000 0000 – 0x2000 2000

2020-07-08 11:00:06

24小時熱門文章

最新文章

最新評論文章