神經網絡學習(二)

原創

2020-05-17 00:58

神經網絡學習(二)

手寫數字識別

認識數據集

from sklearn.datasets import load_digits   #導入手寫數字數據集

digits = load_digits()
print(digits.keys())
dict_keys(['data', 'target', 'frame', 'feature_names', 'target_names', 'images', 'DESCR'])

print(digits.data)
print(digits.data.shape)
[[ 0.  0.  5. ...  0.  0.  0.]
 [ 0.  0.  0. ... 10.  0.  0.]
 [ 0.  0.  0. ... 16.  9.  0.]
 ...
 [ 0.  0.  1. ...  6.  0.  0.]
 [ 0.  0.  2. ... 12.  0.  0.]
 [ 0.  0. 10. ... 12.  1.  0.]]
(1797, 64)
#數據裏面存儲了圖片的所有信息，一共有1797張圖面，每張圖面有64個像素點
print(digits.target)
print(digits.target.shape)
[0 1 2 ... 8 9 8]
(1797,)
#從標籤可以看出數據的範圍是從0-9
print(digits.images)
print(digits.images.shape)
[[[ 0.  0.  5. ...  1.  0.  0.]
  [ 0.  0. 13. ... 15.  5.  0.]
  [ 0.  3. 15. ... 11.  8.  0.]
  ...
  [ 0.  4. 16. ... 16.  6.  0.]
  [ 0.  8. 16. ... 16.  8.  0.]
  [ 0.  1.  8. ... 12.  1.  0.]]]
(1797, 8, 8)
#圖像信息時8*8的矩陣存儲的

數據集圖像顯示

import matplotlib.pyplot as plt
plt.figure(figsize=(8,8))
for i in range(20):
    plt.subplot(2,10,i+1)  #圖片是2*10的 參數(行數，列數，當前圖片的序號）
    plt.imshow(digits.images[i],cmap="Greys")
    plt.xlabel(digits.target[i])
    plt.xticks([])
    plt.yticks([])  #去掉座標軸
plt.show()

神經網絡設計

網絡結構

整個神經網絡分爲3層，由於圖像的像素是64，所以輸入節點一共64個，隱藏層設計爲100個，輸出一共有10種情況，所以設計爲10個。
即網絡結構爲64 x 100 x10

激活函數

$S(x)=\frac{1}{1+e^{-x}}$
$S'(x)=S(x) \cdot (1-S(x))$

反向傳播更新公式

$\alpha$ ：爲學習步長
$\bm{\omega}^{2}$ ：輸入層神經網絡權重
$\bm{\omega}^{3}$ ：隱藏層神經網路權重
隱藏層參數更新：
$\begin{aligned} \bm{\delta}^{(3)} &=-(\bm{y}-\bm{a}^{(3)}) \odot f'(\bm{z}^{(3)}) \\ &=-(\bm{y}-\bm{a}^{(3)}) \odot S(\bm{z}^{(3)})(1-S(\bm{z}^{(3)})) \\ \nabla_{\bm{\omega}^{3}}E &= \bm{\delta}^{(3)}(\bm{a}^{(2)})^\text{T} \\ \bm{\omega}^{3} &= \bm{\omega}^{3} - \alpha \nabla_{\bm{\omega}^{3}}E \end{aligned}$
輸入層參數更新：
$\begin{aligned} \bm{\delta}^{(2)} &= \left( (\bm{\omega}^{3})^{\text{T}}\bm{\delta}^{3} \right)\odot S'(\bm{z}^{(2)}) \\ \nabla_{\bm{\omega}^{2}}E &= \bm{\delta}^{(2)}(\bm{x})^\text{T} \\ \bm{\omega}^{2} &= \bm{\omega}^{2} - \alpha \nabla_{\bm{\omega}^{2}}E \end{aligned}$

實例程序

L1對應 $a^{(2)}$
L2對應 $a^{(3)}$
V對應 $\bm{\omega}^{2}$
W對應 $\bm{\omega}^{3}$
L1_delta對應 $\bm{\delta}^{(2)}$
L2_delta對應 $\bm{\delta}^{(3)}$

import numpy as np
from sklearn.datasets import load_digits  #導入手寫數字數據集
from sklearn.preprocessing import LabelBinarizer  # 標籤二值化
from sklearn.model_selection import train_test_split  # 切割數據,交叉驗證法
import matplotlib.pyplot as plt

def sigmoid(x):
    return 1 / (1 + np.exp(-x))
    
def dsigmoid(x):
    return x * (1 - x)
    
class NeuralNetwork:
    def __init__(self, layers):  # (64,100,10)
        # 權重的初始化,範圍-1到1：+1的一列是偏置值
        self.V = np.random.random((layers[0] + 1, layers[1] + 1)) * 2 - 1
        self.W = np.random.random((layers[1] + 1, layers[2])) * 2 - 1

    def train(self, X, y, lr=0.11, epochs=10000):
        # 添加偏置值：最後一列全是1
        temp = np.ones([X.shape[0], X.shape[1] + 1])
        temp[:, 0:-1] = X
        X = temp

        for n in range(epochs + 1):
            # 在訓練集中隨機選取一行(一個數據)：randint()在範圍內隨機生成一個int類型
            i = np.random.randint(X.shape[0])
            x = [X[i]]
            # 轉爲二維數據：由一維一行轉爲二維一行
            x = np.atleast_2d(x)

            # L1：輸入層傳遞給隱藏層的值；輸入層64個節點，隱藏層100個節點
            # L2：隱藏層傳遞到輸出層的值；輸出層10個節點
            L1 = sigmoid(np.dot(x, self.V))
            L2 = sigmoid(np.dot(L1, self.W))

            # L2_delta：輸出層對隱藏層的誤差改變量
            # L1_delta：隱藏層對輸入層的誤差改變量
            L2_delta = (y[i] - L2) * dsigmoid(L2)
            L1_delta = L2_delta.dot(self.W.T) * dsigmoid(L1)

            # 計算改變後的新權重
            self.W += lr * L1.T.dot(L2_delta)
            self.V += lr * x.T.dot(L1_delta)

            # 每訓練1000次輸出一次準確率
            if n % 1000 == 0:
                predictions = []
                for j in range(X_test.shape[0]):
                    # 獲取預測結果：返回與十個標籤值逼近的距離，數值最大的選爲本次的預測值
                    o = self.predict(X_test[j])
                    # 將最大的數值所對應的標籤返回
                    predictions.append(np.argmax(o))
                # np.equal()：相同返回true，不同返回false
                accuracy = np.mean(np.equal(predictions, y_test))
                print('迭代次數：', n, '準確率：', accuracy)

    def predict(self, x):
        # 添加偏置值：最後一列全是1
        temp = np.ones([x.shape[0] + 1])
        temp[0:-1] = x
        x = temp
        # 轉爲二維數據：由一維一行轉爲二維一行
        x = np.atleast_2d(x)

        # L1：輸入層傳遞給隱藏層的值；輸入層64個節點，隱藏層100個節點
        # L2：隱藏層傳遞到輸出層的值；輸出層10個節點
        L1 = sigmoid(np.dot(x, self.V))
        L2 = sigmoid(np.dot(L1, self.W))
        return L2
        
# 載入數據:8*8的數據集
digits = load_digits()
print(digits.keys())
X = digits.data
Y = digits.target
# 輸入數據歸一化：當數據集數值過大，乘以較小的權重後還是很大的數，代入sigmoid激活函數就趨近於1，不利於學習
X -= X.min()
X /= X.max()

NN = NeuralNetwork([64, 100, 10])
# sklearn切分數據
X_train, X_test, y_train, y_test = train_test_split(X, Y)
# 標籤二值化：將原始標籤(十進制)轉爲新標籤(二進制)
labels_train = LabelBinarizer().fit_transform(y_train)
labels_test = LabelBinarizer().fit_transform(y_test)

print('開始訓練')
NN.train(X_train, labels_train, epochs=20000)
print('訓練結束')

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

神經網絡學習(二)

神經網絡學習(二)

手寫數字識別

認識數據集

數據集圖像顯示

神經網絡設計

網絡結構

激活函數

反向傳播更新公式

實例程序

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

京東面試：如何進行JVM調優？

Python 將PowerPoint (PPT/PPTX) 轉爲HTML

SQL優化-20231016

vim使用操作

Learning both Weights and Connections for Efficient Neural Networks

Learning both Weights and Connections for Efficient Neural Networks 論文進一步的實驗與思考

linux常用語法學習

安卓平板電腦使用Termux編程環境配置

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結