深度學習之tensorflow的簡單使用（附詳細代碼）

深度學習之tensorflow的簡單使用

最近在學習深度學習，本文記錄了在學習時利用tensorflow敲的幾個簡單案例，將持續更新。

tensorflow簡介

Tensorflow是一個編程系統，使用圖來表示計算任務。使用圖來表示計算任務. 圖中的節點被稱之爲 op (operation 的縮寫). 一個 op 獲得 0 個或多個 Tensor, 執行計算, 產生 0 個或多個 Tensor. 每個 Tensor 是一個類型化的多維數組. TensorFlow 程序通常被組織成一個構建階段和一個執行階段. 在構建階段, op 的執行步驟被描述成一個圖. 在執行階段, 使用會話執行執行圖中的 op。

環境配置

見鏈接：https://blog.csdn.net/candice5566/article/details/103773727

利用tensorflow處理簡單的非線性迴歸問題

import tensorflow as tf
import numpy as np
#python中一個畫圖的工具包
import matplotlib.pyplot as plt
#生成樣本點
#使用numpy生成200個隨機點
#生成在-0.5到0.5均勻分佈的200個點 一維數據 後面的是增加一個維度  200行一列的數據
x_data=np.linspace(-0.5,0.5,200)[:,np.newaxis]
noise=np.random.normal(0,0.02,x_data.shape)
y_data=np.square(x_data)+noise
 
#定義兩個placeholder
#後面的屬性是定義形狀，行數不限定None，列數爲1列 ps x，y和樣本對應的
x=tf.placeholder(tf.float32,[None,1])
y=tf.placeholder(tf.float32,[None,1])
 
#構建神經網絡
#輸入一個x經過神經網絡的計算輸出y，我們期望預測值和真實的值比較接近
#輸入時一個一個的點，只有一個神經元，中間層可以調節，輸出層也是一個神經元
 
#定義神經網絡中間層
#得到權值，起初賦隨機值 1,10 1是輸入有一個，中間層有10個神經元
Weights_L1=tf.Variable(tf.random_normal([1,10]))
#偏置值初始化爲0
biases_L1=tf.Variable(tf.zeros([1,10]))
#計算信號的總和   矩陣的乘法
Wx_plus_b_L1=tf.matmul(x,Weights_L1)+biases_L1
#L1中間層的輸出 
#用雙曲正切函數作爲激活函數
L1=tf.nn.tanh(Wx_plus_b_L1)
 
 
#定義神經網絡輸出層
Weights_L2=tf.Variable(tf.random_normal([10,1]))
#偏置值初始化爲0\
#輸出層有一個神經元偏置值只有一個
biases_L2=tf.Variable(tf.zeros([1,1]))
Wx_plus_b_L2=tf.matmul(L1,Weights_L2)+biases_L2
prediction=tf.nn.tanh(Wx_plus_b_L2)
 
#定義代價函數和訓練的方法
 
#二次代價函數
loss=tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step=tf.train.GradientDescentOptimizer(0.1).minimize(loss)
 
 
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for _ in range(2000):
        #訓練，傳樣本值
        sess.run(train_step,feed_dict={x:x_data,y:y_data})
        
    #獲得預測值
    prediction_value=sess.run(prediction,feed_dict={x:x_data})
    #畫圖
    plt.figure()
    #將樣本點以散點圖的方式打印出來
    plt.scatter(x_data,y_data)
    #預測的結果 紅實線 
    plt.plot(x_data,prediction_value,'r-',lw=5)
    plt.show()
 
    
    #訓練出來的結果的loss值是最小的

如代碼所示，利用梯度下降方法來求loss的最小值，最終訓練出來的結果如下圖：

使用梯度下降法訓練MNIST數據集並分類

首先下載MNIST數據集：

鏈接：https://pan.baidu.com/s/1Nn83ELVE1AbH89c-9THK4g
提取碼：4m0x

這個神經網絡比較簡單，沒有用中間層，直接輸入輸出層。建議先了解一下softmax函數。

import tensorflow as tf
#和手寫數字相關的一個數據包
#這裏一定要給input_data起個別名，不然下文會提示not defined
import tensorflow.examples.tutorials.mnist.input_data as input_data
#載入數據集合
mnist=input_data.read_data_sets("MINIST_data",one_hot=True)
 
#m每個批次的大小
#批次：訓練模型的時候，將一個批次的數據放進網絡進行訓練，以一個矩陣的形式
batch_size=100
#計算一共有多少個批次   數量 整除
n_batch=mnist.train.num_examples//batch_size
 
#定義兩個placeholder
#行與批次有關係，列784=28*28 
x=tf.placeholder(tf.float32,[None,784])
#數字從0到9一共10個標籤
y=tf.placeholder(tf.float32,[None,10])
 
#創建一個簡單的神經網絡
#輸入層 784 個神經元 輸出層有10個神經元
#權值
W=tf.Variable(tf.zeros([784,10]))
#偏置值
b=tf.Variable(tf.zeros([10]))
#矩陣相乘   x*W+b 相當於信號的總和 經過softmax函數 ，將輸出信號轉化爲概率值 存放到預測值裏面
prediction=tf.nn.softmax(tf.matmul(x,W)+b)
 
#二次大家函數
loss=tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step=tf.train.GradientDescentOptimizer(0.2).minimize(loss)
 
#初始化變量
init=tf.global_variables_initializer()
 
#求準側率的方法
#比較兩個參數是否相同 返回值是true 和false
#argmax求標籤裏最大的值是在那個位置 返回概率最大的那個  和真實的值比較 參數1表示在行向量上搜索
#結果存放在一個bool型列表中
correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))
#求準確率
#cast 將布爾類型轉化爲32位浮點型 再求平均值 將true轉化爲1.0 將false轉化爲0 即可達到準確率
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
 
with tf.Session() as sess:
    sess.run(init)
    #迭代21個週期
    for epoch in range(21):
        for batch in range(n_batch):
            #獲得100張圖片 將圖片的數據保存在xs裏面，將標籤保存在ys裏面 下一次再執行這個函數時，獲得下一個批次的圖片
            batch_xs,batch_ys=mnist.train.next_batch(batch_size)
            #訓練 將數據傳入
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
        #將測試集的圖片和標籤傳進去 然後求準側率
        acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
        print("ITer"+str(epoch)+",Test accuracy:"+str(acc))

經過21次迭代後，準確率維持在91%左右。

利用RNN訓練MNIST數據集

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import  input_data
mnist=input_data.read_data_sets("MINIST_data",one_hot=True)
 
#輸入圖片是28*28
n_inputs=28 #輸入一行，一行有28 個數據
max_time=28 #一共28行
lstm_size=100 #隱層單元
n_classes=10 #10個分類
batch_size=50 #每個批次50個樣本
n_batch=mnist.train.num_examples//batch_size
 
x=tf.placeholder(tf.float32,[None,784])
#數字從0到9一共10個標籤
y=tf.placeholder(tf.float32,[None,10])
 
#初始化權值
weights=tf.Variable(tf.truncated_normal([lstm_size,n_classes],stddev=0.1))
biases=tf.Variable(tf.constant(0.1,shape=[n_classes]))
 
#定義RNN網絡
def RNN(X,weights,biases):
    # inputs=[batch_size,max_time,n_inputs]  把x轉換爲50個28列28行的數據格式 因爲inputs在後面的調用，格式是固定的。
    inputs=tf.reshape(X,[-1,max_time,n_inputs])
    #定義LSTM基本CELL
    #lstm_cell=tf.contrib.rnn.core_run_cell.BasicLSTMCell(lstm_size)  
    lstm_cell = tf.nn.rnn_cell.BasicLSTMCell(lstm_size)
    #final_state[0]是cell_state
    #final_state[1]是hidden_state
    outputs,final_state=tf.nn.dynamic_rnn(lstm_cell,inputs,dtype=tf.float32)
    results=tf.nn.softmax(tf.matmul(final_state[1],weights)+biases) #神經網絡最終的輸出  在經過softmax函數轉化爲概率 
    return results #得到結果 返回
 
#計算RNN的返回結果
prediction=RNN(x,weights,biases)
#損失函數
cross_entropy=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=prediction,labels=y))
#使用AdamOptimizer進行優化
train_step=tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))
#求準確率
#cast 將布爾類型轉化爲32位浮點型 再求平均值 將true轉化爲1.0 將false轉化爲0 即可達到準確率
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))
 
init=tf.global_variables_initializer()
 
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(6):
        for batch in range(n_batch):
            #獲得100張圖片 將圖片的數據保存在xs裏面，將標籤保存在ys裏面 下一次再執行這個函數時，獲得下一個批次的圖片
            batch_xs,batch_ys=mnist.train.next_batch(batch_size)
            #訓練 將數據傳入
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
        #將測試集的圖片和標籤傳進去 然後求準側率
        acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
        print("Iter " + str(epoch) + ",Testing Accuracy " + str(acc))

訓練效果還是不錯的，比之前用普通的神經網絡效果好很多的。

參考視頻：https://www.bilibili.com/video/av20542427?t=561&p=23

深度學習之tensorflow的簡單使用（附詳細代碼）

深度學習之tensorflow的簡單使用

tensorflow簡介

環境配置

利用tensorflow處理簡單的非線性迴歸問題

使用梯度下降法訓練MNIST數據集並分類

利用RNN訓練MNIST數據集

Python 潮流週刊#52：Python 處理 Excel 的資源

在leetcode運行代碼報錯inconsistent use of tabs and spaces in indentation

解決browser = webdriver.Chrome()報錯：Message: 'chromedriver' executable needs to be in PATH.

C++中return 0 和return 1 的區別

如何理解keras中的keras.utils.to_categorical

python 虛擬環境的搭建和基本使用

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結