原创 linux下導入自己寫的模塊,找不到conda命令

自定義的模塊必須PYTHONPATH上,否則在導入該模塊時會出現找不到該模塊的錯誤,即必須把所需要的模塊的路徑添加到PYTHONPATH(一般情況下是把lib/python3.5/site-packages添加到PYTHONPAT

原创 已解決 failed call to cuInit: CUDA_ERROR_NO_DEVICE

重啓服務器之後就出現連接不上NVIDIA驅動的情況。這個時候tensorflow還是可以運行的,但只是在用cpu跑。安裝gpu版的TensorFlow時,也顯示已安裝。 首先在終端輸入nvidia-smi 出現NVIDIA-SMI

原创 keras調用load_model時報錯ValueError: Unknown Layer:LayerName, ValueError: Unknown metric function:recall

出現該錯誤原因 因爲保存的model中包含了自定義的層(Custom Layer),導致加載模型的時候無法解析該Layer。 參考can not load_model() if my model contains my own L

原创 Tensorflow常用函數(三)

1 tensorflow比較函數 # 判斷每一個數是否大於threshold greater = tf.greater(x, threshold) # 判斷每一個數是否小於threshold less = tf.less(x,thre

原创 linux下壓縮zip解壓縮unzip命令使用

zip 將當前目錄下的所有文件和文件夾全部壓縮成xxx.zip文件,-r表示遞歸壓縮子目錄下所有文件. zip -r xxx.zip ./* 將tmp文件夾及文件夾下的所有文件壓縮成tmp.zip,並存放在目錄/h

原创 Pandas之read_csv()讀取文件跳過報錯行

pandas讀取文件(read_csv),跳過報錯的行 讀取文件時遇到和列數不對應的行,此時會報錯。若報錯行可以忽略,則添加以下參數: 樣式:pandas.read_csv(***,error_bad_lines=False) pan

原创 Tensorflow基礎

TensorFlow 簡介 TensorFlow 是一個使用數據流圖進行數值計算的開放源代碼軟件庫。圖中的節點代表數學運算,而圖中的邊則代表在這些節點之間傳遞的多維數組(張量)。藉助這種靈活的架構,可以通過一個 API 將計算工作部署

原创 在任意文件夾下右鍵菜單中添加cmd選項

使用cmd時,需要一步一步cd到代碼所在的文件夾需要花費很長的時間,以下操作適用於win7和win10系統,其它版本可能略有不同。 win+R快捷鍵,輸入regedit後回車,打開註冊表編輯器; 在註冊表編輯器中找到HKEY_CLA

原创 python之多線程與多進程

操作系統 任務調度 時間片 大部分操作系統的任務調度採用時間片輪轉的搶佔式調度方式,也就是說一個任務執行一小段時間後強制暫停去執行下一個任務,每個任務輪流執行。任務執行的一小段時間叫做時間片 運行狀態:任務正在執行時的狀態叫做運行狀態

原创 python函數之默認參數、可變參數、關鍵字參數和更pythonic的編程

默認參數、可變參數、關鍵字參數 如果一個函數的參數中含有默認參數,則這個默認參數後的所有參數都必須是默認參數 也就是說默認參數要放在參數最後。 def format_date(year = 2007, month, day):

原创 python 輸入一個字符串,把與字符串的第一個字母相同的字母替換成‘*’

def sub_use_xing(str): ''' 輸入一個字符串,把與字符串的第一個字母相同的字母替換成‘*’ :param str: :return: ''' for i in r

原创 pandas學習筆記

異常值檢測和過濾 使用 describe() 函數查看每一列的描述性統計 count 列的元素的個數 mean 平均值 std 標準方差,描述數據的波動,離散程度 min 最小 max 最大 數據小於標準方差的四倍,認爲數據是有意義的

原创 機器學習中數據的屬性類型

本文簡單介紹機器學習中數據的屬性類型,針對數據的不同屬性類型需要不同的數據預處理方法。 數據集由數據對象組成,一個數據對象代表一個實體。數據對象又稱樣本、實例、數據點或對象。屬性(attribute)是一個數據字段,表示數據對象的一個

原创 .tsv和.csv格式文件區別及python處理

機器學習中,我們在使用一些經典的分類器對數據進行分類時,需要對數據進行一些必要的預處理。或者我們在使用別人提供的數據使用一些經典的機器學習算法進行學習時,一般常見的數據格式會是.tsv和.csv格式. 逗號分隔值 (Comma-Sep

原创 scikit learn各個常用模型調參總結

SVM 對數據進行歸一化 (simple scaling) 使用RBF kernel 使用cross_validation 和 grid_search得到最佳參數gamma和C 使用得到的最優C和gamma訓練訓練數據 測試 sv