原创 如何打印csdn的文章

1.按F12進入Chorme瀏覽器開發者選項 2.在clone中粘貼下面的代碼,並按回車即可。 (function(){ $("#side").remove(); $("#comment_title, #comment_list,

原创 pycharm連接遠程環境 mac

pycharm配置遠程服務器環境 第一步打開項目然後點“Pycharm”配置環境  第二步點‘project interpreter’後面的設置“add” ,然後選用“ssh”,並輸入遠程服務器的網址和用戶名 第三步輸入服務器密碼,也

原创 tensorflow中循環神經網絡搭建時常用的函數介紹

tensorflow中循環神經網絡搭建時常用的函數介紹tf.contrib.rnn.BasicLSTMCell()函數tf.contrinb.rnn.GRUCelltf.contrib.rnn.DropoutWrapper()函數

原创 Transformer作爲特徵提取器

Transformer之前 上圖是經典的雙向RNN模型,我們知道該模型是通過遞歸的方式運行,雖然適合對序列數據建模,但是缺點也很明顯“它無法並行執行”也就無法利用GPU強大的並行能力,再加上各種門控機制,運行速度很慢。一般而言,

原创 面試題50:第一次只出現一次的字符

第一種求解方法是:暴力求解,並分析時間複雜度和空間複雜度 掃描字符串,每次拿當前的一個字符與後面的字符進行比較,如果後面的字符沒有出現該字符,則該字符是第一個只出現一次的字符;否則,掃描下一個字符。 假設字符長度爲n,則時間複雜度

原创 中心極限定理與大數定律的區別

定義的區別 什麼是中心極限定理? 中心極限定理,是說隨着樣本數量的增加,樣本的均值分佈呈正態分佈。對原總體的分佈不做任何要求,意味着無論總體是什麼分佈,其抽樣樣本的均值的頻數的分佈都隨着抽樣數的增多而趨於正態分佈。 什麼是大數定律

原创 tensorflow函數學習(一)

1. tensorflow.Session() import tensorflow as tf state = tf.Variable(0.0,dtype=tf.float32) one = tf.constant(1.0,dtyp

原创 tensorflow函數學習(二)--正則和規範化

參考https://blog.csdn.net/abiggg/article/details/79368982 1.L2正則 tf.nn.l2_normalize的使用 tf.nn.l2_normalize(x, dim, epsilon

原创 機器學習算法:tf.contrib.crf條件隨機場

tf.contrib.crf.crf_log_likelihood(inputs, tag_indices, sequence_lengths, transition_params=None) 函數的目的:使用crf 來計算損失

原创 深度學習中的embedding和fintune的理解

在學習自然語言處理過程中,目前使用的神經網絡模型中大都有embedding層。 embedding層本質是一個降維的過程,在自然語言處理過程中,如果使用的是one-hot編碼,則每個word的向量的shape是[vocab_size]。o

原创 論文《Neural Machine Translation by Jointly Learning to Align Translate》

#背景 這篇論文是第一個在NLP中使用attention機制的工作。翻譯任務是典型的seq2seq問題。那麼,什麼是seq2seq問題?簡單的說就是,根據輸入序列X,生成一個輸出序列Y,序列的長度不固定。當輸入序列X和輸出序列Y是

原创 數值型數據的預處理總結

主要使用的是pandas的DataFrame的數據結構,記錄一些基本操作。 1.讀取文件和保存文件 df = pd.read_csv(文件名) result_df.to_excel(文件名:‘a.xlsx’) #將結果存在a.xl

原创 python中的形參(*args,**kwargs)

兩篇博客: https://www.cnblogs.com/xuyuanyuan123/p/6674645.html https://www.cnblogs.com/zhangzhuozheng/p/8053045.html 多個

原创 命名實體識別(BiLSTM+CRF)(一)

最近複習了命名實體識別的項目,做一下記錄。 數據集 數據集使用的是人民日報已經標註好的新聞數據,概況: 主要的任務是識別人名(nr)、地名(ns)和組織結構名(nt) 項目使用的是字符級的embedding,因此在數據預處理

原创 k-折交叉驗證

一、k折交叉驗證的目的(爲什麼要用k折交叉驗證?) 1.根本原因:數據有限,單一的把數據都用來做訓練模型,容易導致過擬合。(反過來,如果數據足夠多,完全可以不使用交叉驗證。)較小的k值會導致可用於建模的數據量太小,所以小數據集的交