原创 Character-level Convolutional Networks for Text Classification

Character-level Convolutional Networks for Text Classification 概述:驗證使用字符級的CNN進行文本分類任務的可能性 筆記: 1.文本分類是個nlp經典問題,從人工標註特徵到

原创 《Convolutional Neural Networks for Sentence Classification》

《Convolutional Neural Networks for Sentence Classification》 概述:使用基於word2vec的單層CNN,對多個文本分類任務進行了評測。 結論: 1.word2vec是個好東西

原创 bpe分詞算法的原理以及在機器翻譯中的應用

概述: bpe(byte pair encoding),是一種根據字節對進行編碼的算法。主要目的是爲了數據壓縮,算法描述爲字符串裏頻率最常見的一對字符被一個沒有在這個字符中出現的字符代替的層層迭代過程。該算法在論文:https://arx

原创 旋轉矩陣

給定一個 n × n 的二維矩陣表示一個圖像。 將圖像順時針旋轉 90 度。 給定 matrix = [ [1,2,3], [4,5,6], [7,8,9] ], 原地旋轉輸入矩陣,使其變爲: [ [7,4,1],

原创 python讀取文本文件以特定字符串開頭的行

 比如讀取文本文件中以[src-1]開頭的行。 #encoding:utf-8 import re file_object = open('test.txt','rU', encoding='UTF-8') f = open('out