瞭解基於視覺的缺陷檢測的原理與方法

基於統計分類的方法：
（1）基於KNN方法（最近鄰法）：利用相似度，找出k個訓練樣本，然後打分，按得分值排序。
（2）基於Naive Bayes算法：計算概率，構建分類模型。

引導：

醫生對病人進行診斷就是一個典型的分類過程，任何一個醫生都無法直接看到病人的病情，只能觀察病人表現出的症狀和各種化驗檢測數據來推斷病情，這時醫生就好比一個分類器，而這個醫生診斷的準確率，與他當初受到的教育方式（構造方法）、病人的症狀是否突出（待分類數據的特性）以及醫生的經驗多少（訓練樣本數量）都有密切關係。

一、KNN分類器
1.1.1最近鄰算法
     定義：計算未知樣本與所有訓練樣本的距離，並以最近鄰者的類別作爲決策未知樣本類別的唯一依據。
     缺陷：對噪聲數據過於敏感。
     措施：將被決策樣本週邊的多個最近樣本計算在內，擴大參與決策的樣本量，以避免個別數據直接決定決策結果。
1.1.2K-最近鄰算法（KNN）
     基本思路：選擇未知樣本一定範圍內的K個樣本，該K個樣本中某一類型出現的次數最大，則未知樣本判定爲該類型。
     舉例說明：
如果K=3，綠色圓點的最近的3個鄰居是2個紅色小三角形和1個藍色小正方形，少數從屬於多數，基於統計的方法，判定綠色的這個待分類點屬於紅色的三角形一類。如果K=5，綠色圓點的最近的5個鄰居是2個紅色三角形和3個藍色的正方形，還是少數從屬於多數，基於統計的方法，判定綠色的這個待分類點屬於藍色的正方形一類。

     算法執行步驟：
（1）輸入測試集。
（2）設定參數k。
（3）遍歷測試集，對於測試集中每個樣本，計算該樣本（測試集中）到訓練集中每個樣本的距離；取出訓練集中到該樣本（測試集中）的距離最小的k個樣本的類別標籤；對類別標籤進行計數，類別標籤次數最多的就是該樣本（測試集中）的類別標籤。
（4）遍歷完畢,輸出測試集的類別。
1.1.3 知識補充
      距離度量表示的是兩樣本之間的相似程度。
常用距離度量方式：

二、樸素貝葉斯分類器
2.1貝葉斯公式
貝葉斯公式理解
https://www.zhihu.com/question/19725590/answer/241988854
（怎樣用非數學語言講解貝葉斯定理（Bayes’s theorem）？）
2.2樸素貝葉斯分類器
2.2.1基本思想
     對於給出的待分類項，求解在此項出現的條件下各個類別出現的概率，哪個最大，就認爲此待分類項屬於哪個類別。

2.2.2樸素貝葉斯“公式”

2.2.3樸素貝葉斯分類器

三、瑕疵缺陷檢測
檢測方法：
（1）瑕疵缺陷圖像特徵的選擇與提取。
（2）計算缺陷圖像與標準圖像關於灰度的差值。
（3）通過差值與設定閾值比較判斷是否存在缺陷。
3.1缺陷圖像差分法
3.1.1基本原理

3.1.2基本流程
（1）有效檢測區域的設定
（2）圖像配準與剪裁
（3）設定差分閾值
（4）缺陷位置的判別
3.2缺陷圖像特徵的選擇與提取
詳見：https://zhuanlan.zhihu.com/p/43488853
3.2.1特徵提取方法
（1）灰度值特徵
（2）灰度差特徵
（3）直方圖特徵
（4）變換系數特徵
（5）線條和角點的特徵
（5）灰度邊緣特徵
（6）紋理特徵
3.2.2特徵選擇（數據降維）
降維的原因：在機器學習中，如果特徵值即維度過多，會引發維度災難。維度災難最直接的後果就是過擬合現象，進而導致分類識別的錯誤，因此我們需要對所提的特徵進行降維處理。
基本原理：特徵選擇是將原始空間進行變換，重新生成一個維數更小各維之間更獨立的特徵空間。
降維面臨的問題：
（1）降維後數據應該包含更多的信息？
（2）降維後會損失多少信息？
（3）降維後對分類識別效果有多大影響？
數據降維後的好處：
（1）進行數據壓縮，減少數據存儲所需空間以及計算所需時間。
（2）消除數據間的冗餘，以簡化數據，提高計算效率。
（3）去除噪聲，提高模型性能。
（4）改善數據的可理解性，提高學習算法的精度。
（5）將數據維度減少到2維或者3維，進行可視化。
常用方法：主成分分析，隨機映射，非負矩陣分解。
3.2.3主成分分析（PCA）
方法概述：此方法目標是找到數據中最主要的元素和結構，去除噪音冗餘，將原有的複雜數據降維，揭露出隱藏在複雜數據背後的簡單結構。主成分分析就是試圖在力保數據信息丟失最少的原則下，對這種多變量的數據表進行最佳綜合簡化。這些綜合指標就稱爲主成分，也就是說，對高維變量空間進行降維處理，很顯然，識辨系統在一個低維空間要比在一個高維空間容易得多。從線性代數角度來看，PCA目標是找到一組新正交基去重新描述得到的數據空間，這個維度就是主元。
3.3灰度形態學的缺陷檢測
3.3.1概述
     灰度數學形態學的基本運算有膨脹、腐獨、開啓和關閉，其中利用膨脹和腐蝕的組合可構成開啓和關閉，而利用開啓和關閉又可構成形態濾波器。
在灰度圖像的形態分析中，結構元素可以是何的三維結構，常用的有圓錐、圓柱、半球或拋物線。模板尺寸總是奇數，這樣檬板中心正好對應一個像素。
3.3.2      形態操作對圖像影響
（1）膨脹灰度圖像的結果是，比背景亮的部分得到擴張，而比背景暗的部分受到收縮。
（2）腐蝕灰度圖像的結果是，比背景暗的部分得到擴張，而比背景亮的部分受到收縮。
（3）開啓一幅圖像可消除圖中的孤島或尖峯等過亮的點。
（4）關閉一幅圖可將比背景暗且尺寸比結構元素小的結構除掉。
（5）形態濾波器是非線性信號濾波器，它通過變換來局部地修改信號的幾何特徵。將開運算和閉運算結合起來可消除噪聲。
（6）如果用一個小的結構元素先開啓再閉合一幅圖像，就有可能將圖像中小於結構元素的類似噪聲結構除去。
3.3.3實例說明
電路板佈線的缺陷檢測：對於一幅大小爲1100×870、灰度級爲256的電路板灰度圖像，其佈線缺陷分爲斷線和毛刺，利用灰度形態學檢測這些缺陷。取結構元素爲5×5的半球模板，首先對原圖灰度開啓，消除比鄰域亮且尺寸比結構元素小的區域；然後對原圖灰度閉合，消除比鄰域暗且尺寸比結構元素小的區域，兩次結果差異即爲缺陷。

四、劃痕檢查
概述：劃痕檢測的基本分析過程分爲兩步首張，確定檢測產品表面是否有劃痕，其次，在確定被分析圖像上存在劃痕之後，對劃痕進行提取。由於在工業檢測中圖像的多樣性，對於每一種圈像，都要經過分析綜合考慮各種手段來進行處理達到效果。一般來說，劃痕部分的灰度值和周圍正常部分相比要暗，也就是劃痕部分灰度值偏小，而且大多都是在光滑表面，所以整幅圖的灰度變化總體來說非常均勻，缺乏紋理特徵。
基本方法：基於統計的灰度特徵或者閾值分割的方法將劃痕部分標出。