首先下載MNIST數據集:
鏈接:https://pan.baidu.com/s/1Nn83ELVE1AbH89c-9THK4g
提取碼:4m0x
這個神經網絡比較簡單,沒有用中間層,直接輸入輸出層。建議先了解一下softmax函數。
import tensorflow as tf
#和手寫數字相關的一個數據包
#這裏一定要給input_data起個別名,不然下文會提示not defined
import tensorflow.examples.tutorials.mnist.input_data as input_data
#載入數據集合
mnist=input_data.read_data_sets("MINIST_data",one_hot=True)
#m每個批次的大小
#批次:訓練模型的時候,將一個批次的數據放進網絡進行訓練,以一個矩陣的形式
batch_size=100
#計算一共有多少個批次 數量 整除
n_batch=mnist.train.num_examples//batch_size
#定義兩個placeholder
#行與批次有關係,列784=28*28
x=tf.placeholder(tf.float32,[None,784])
#數字從0到9一共10個標籤
y=tf.placeholder(tf.float32,[None,10])
#創建一個簡單的神經網絡
#輸入層 784 個神經元 輸出層有10個神經元
#權值
W=tf.Variable(tf.zeros([784,10]))
#偏置值
b=tf.Variable(tf.zeros([10]))
#矩陣相乘 x*W+b 相當於信號的總和 經過softmax函數 ,將輸出信號轉化爲概率值 存放到預測值裏面
prediction=tf.nn.softmax(tf.matmul(x,W)+b)
#二次大家函數
loss=tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step=tf.train.GradientDescentOptimizer(0.2).minimize(loss)
#初始化變量
init=tf.global_variables_initializer()
#求準側率的方法
#比較兩個參數是否相同 返回值是true 和false
#argmax求標籤裏最大的值是在那個位置 返回概率最大的那個 和真實的值比較 參數1表示在行向量上搜索
#結果存放在一個bool型列表中
correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))
#求準確率
#cast 將布爾類型轉化爲32位浮點型 再求平均值 將true轉化爲1.0 將false轉化爲0 即可達到準確率
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
with tf.Session() as sess:
sess.run(init)
#迭代21個週期
for epoch in range(21):
for batch in range(n_batch):
#獲得100張圖片 將圖片的數據保存在xs裏面,將標籤保存在ys裏面 下一次再執行這個函數時,獲得下一個批次的圖片
batch_xs,batch_ys=mnist.train.next_batch(batch_size)
#訓練 將數據傳入
sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
#將測試集的圖片和標籤傳進去 然後求準側率
acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
print("ITer"+str(epoch)+",Test accuracy:"+str(acc))
經過21次迭代後,準確率維持在91%左右。
本文參考視頻: