深度學習之tensorflow的簡單使用
最近在學習深度學習,本文記錄了在學習時利用tensorflow敲的幾個簡單案例,將持續更新。
tensorflow簡介
Tensorflow是一個編程系統,使用圖來表示計算任務。使用圖來表示計算任務. 圖中的節點被稱之爲 op (operation 的縮寫). 一個 op 獲得 0 個或多個 Tensor, 執行計算, 產生 0 個或多個 Tensor. 每個 Tensor 是一個類型化的多維數組. TensorFlow 程序通常被組織成一個構建階段和一個執行階段. 在構建階段, op 的執行步驟 被描述成一個圖. 在執行階段, 使用會話執行執行圖中的 op。
環境配置
見鏈接:https://blog.csdn.net/candice5566/article/details/103773727
利用tensorflow處理簡單的非線性迴歸問題
import tensorflow as tf
import numpy as np
#python中一個畫圖的工具包
import matplotlib.pyplot as plt
#生成樣本點
#使用numpy生成200個隨機點
#生成在-0.5到0.5均勻分佈的200個點 一維數據 後面的是增加一個維度 200行一列的數據
x_data=np.linspace(-0.5,0.5,200)[:,np.newaxis]
noise=np.random.normal(0,0.02,x_data.shape)
y_data=np.square(x_data)+noise
#定義兩個placeholder
#後面的屬性是定義形狀,行數不限定None,列數爲1列 ps x,y和樣本對應的
x=tf.placeholder(tf.float32,[None,1])
y=tf.placeholder(tf.float32,[None,1])
#構建神經網絡
#輸入一個x經過神經網絡的計算輸出y,我們期望預測值和真實的值比較接近
#輸入時一個一個的點,只有一個神經元,中間層可以調節,輸出層也是一個神經元
#定義神經網絡中間層
#得到權值,起初賦隨機值 1,10 1是輸入有一個,中間層有10個神經元
Weights_L1=tf.Variable(tf.random_normal([1,10]))
#偏置值初始化爲0
biases_L1=tf.Variable(tf.zeros([1,10]))
#計算信號的總和 矩陣的乘法
Wx_plus_b_L1=tf.matmul(x,Weights_L1)+biases_L1
#L1中間層的輸出
#用雙曲正切函數作爲激活函數
L1=tf.nn.tanh(Wx_plus_b_L1)
#定義神經網絡輸出層
Weights_L2=tf.Variable(tf.random_normal([10,1]))
#偏置值初始化爲0\
#輸出層有一個神經元偏置值只有一個
biases_L2=tf.Variable(tf.zeros([1,1]))
Wx_plus_b_L2=tf.matmul(L1,Weights_L2)+biases_L2
prediction=tf.nn.tanh(Wx_plus_b_L2)
#定義代價函數和訓練的方法
#二次代價函數
loss=tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
for _ in range(2000):
#訓練,傳樣本值
sess.run(train_step,feed_dict={x:x_data,y:y_data})
#獲得預測值
prediction_value=sess.run(prediction,feed_dict={x:x_data})
#畫圖
plt.figure()
#將樣本點以散點圖的方式打印出來
plt.scatter(x_data,y_data)
#預測的結果 紅實線
plt.plot(x_data,prediction_value,'r-',lw=5)
plt.show()
#訓練出來的結果的loss值是最小的
如代碼所示,利用梯度下降方法來求loss的最小值,最終訓練出來的結果如下圖:
使用梯度下降法訓練MNIST數據集並分類
首先下載MNIST數據集:
鏈接:https://pan.baidu.com/s/1Nn83ELVE1AbH89c-9THK4g
提取碼:4m0x
這個神經網絡比較簡單,沒有用中間層,直接輸入輸出層。建議先了解一下softmax函數。
import tensorflow as tf
#和手寫數字相關的一個數據包
#這裏一定要給input_data起個別名,不然下文會提示not defined
import tensorflow.examples.tutorials.mnist.input_data as input_data
#載入數據集合
mnist=input_data.read_data_sets("MINIST_data",one_hot=True)
#m每個批次的大小
#批次:訓練模型的時候,將一個批次的數據放進網絡進行訓練,以一個矩陣的形式
batch_size=100
#計算一共有多少個批次 數量 整除
n_batch=mnist.train.num_examples//batch_size
#定義兩個placeholder
#行與批次有關係,列784=28*28
x=tf.placeholder(tf.float32,[None,784])
#數字從0到9一共10個標籤
y=tf.placeholder(tf.float32,[None,10])
#創建一個簡單的神經網絡
#輸入層 784 個神經元 輸出層有10個神經元
#權值
W=tf.Variable(tf.zeros([784,10]))
#偏置值
b=tf.Variable(tf.zeros([10]))
#矩陣相乘 x*W+b 相當於信號的總和 經過softmax函數 ,將輸出信號轉化爲概率值 存放到預測值裏面
prediction=tf.nn.softmax(tf.matmul(x,W)+b)
#二次大家函數
loss=tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step=tf.train.GradientDescentOptimizer(0.2).minimize(loss)
#初始化變量
init=tf.global_variables_initializer()
#求準側率的方法
#比較兩個參數是否相同 返回值是true 和false
#argmax求標籤裏最大的值是在那個位置 返回概率最大的那個 和真實的值比較 參數1表示在行向量上搜索
#結果存放在一個bool型列表中
correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))
#求準確率
#cast 將布爾類型轉化爲32位浮點型 再求平均值 將true轉化爲1.0 將false轉化爲0 即可達到準確率
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
with tf.Session() as sess:
sess.run(init)
#迭代21個週期
for epoch in range(21):
for batch in range(n_batch):
#獲得100張圖片 將圖片的數據保存在xs裏面,將標籤保存在ys裏面 下一次再執行這個函數時,獲得下一個批次的圖片
batch_xs,batch_ys=mnist.train.next_batch(batch_size)
#訓練 將數據傳入
sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
#將測試集的圖片和標籤傳進去 然後求準側率
acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
print("ITer"+str(epoch)+",Test accuracy:"+str(acc))
經過21次迭代後,準確率維持在91%左右。
利用RNN訓練MNIST數據集
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
mnist=input_data.read_data_sets("MINIST_data",one_hot=True)
#輸入圖片是28*28
n_inputs=28 #輸入一行,一行有28 個數據
max_time=28 #一共28行
lstm_size=100 #隱層單元
n_classes=10 #10個分類
batch_size=50 #每個批次50個樣本
n_batch=mnist.train.num_examples//batch_size
x=tf.placeholder(tf.float32,[None,784])
#數字從0到9一共10個標籤
y=tf.placeholder(tf.float32,[None,10])
#初始化權值
weights=tf.Variable(tf.truncated_normal([lstm_size,n_classes],stddev=0.1))
biases=tf.Variable(tf.constant(0.1,shape=[n_classes]))
#定義RNN網絡
def RNN(X,weights,biases):
# inputs=[batch_size,max_time,n_inputs] 把x轉換爲50個28列28行的數據格式 因爲inputs在後面的調用,格式是固定的。
inputs=tf.reshape(X,[-1,max_time,n_inputs])
#定義LSTM基本CELL
#lstm_cell=tf.contrib.rnn.core_run_cell.BasicLSTMCell(lstm_size)
lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(lstm_size)
#final_state[0]是cell_state
#final_state[1]是hidden_state
outputs,final_state=tf.nn.dynamic_rnn(lstm_cell,inputs,dtype=tf.float32)
results=tf.nn.softmax(tf.matmul(final_state[1],weights)+biases) #神經網絡最終的輸出 在經過softmax函數轉化爲概率
return results #得到結果 返回
#計算RNN的返回結果
prediction=RNN(x,weights,biases)
#損失函數
cross_entropy=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=prediction,labels=y))
#使用AdamOptimizer進行優化
train_step=tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))
#求準確率
#cast 將布爾類型轉化爲32位浮點型 再求平均值 將true轉化爲1.0 將false轉化爲0 即可達到準確率
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
init=tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
for epoch in range(6):
for batch in range(n_batch):
#獲得100張圖片 將圖片的數據保存在xs裏面,將標籤保存在ys裏面 下一次再執行這個函數時,獲得下一個批次的圖片
batch_xs,batch_ys=mnist.train.next_batch(batch_size)
#訓練 將數據傳入
sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
#將測試集的圖片和標籤傳進去 然後求準側率
acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
print("Iter " + str(epoch) + ",Testing Accuracy " + str(acc))
訓練效果還是不錯的,比之前用普通的神經網絡效果好很多的。
參考視頻:https://www.bilibili.com/video/av20542427?t=561&p=23