原创 用tensorflow構建動態RNN

直接看代碼 def create_cell(): cell = rnn.LSTMCell(num_units) return rnn.DropoutWrapper(cell, input_keep_prob=0.5)

原创 tf.expand_dims()、tf.tile()、tf.squeeze()

tf.expand_dims(input, dim, name=None) TensorFlow中,想要維度增加一維,可以使用tf.expand_dims(input, dim

原创 TF-IDF

TF-IDF:是一種加權技術。採用一種統計方法,根據字詞在文本中出現的次數和在整個語料中出現的文檔頻率來計算一個字詞在整個語料中的重要程度。 優點:能過濾掉一些常見的卻無關緊要的詞語,同時保留影響整個文本的重要詞語。 公式如下: TF−I

原创 python list轉字符串時報TypeError: sequence item 0: expected a bytes-like object, str found

Traceback (most recent call last): File "process.py", line 25, in <module> s=b' '.join(text) TypeError: sequence

原创 NLP常用術語解析

自然語言處理,後者用英文稱爲:Natural Language Processing(NLP)包含一系列相對專業的術語,比如:命名實體識別、詞性標註等。剛開始做NLP的時候,往往會搞不清這些術語的具體含義,尤其是看一些會議、期刊的論文的時

原创 os.path.basename(sys.argv[0])

os.path.basename():返回path最後的文件名 sys.argv[0]:一個從程序外部獲取參數的橋樑,是一個list,第一個爲程序本身,隨後才依次是外部給予的參數。 if __name__ == '__main__':

原创 pyspark -- DataFrame

與RRD的區別 1.DataFrame讓spark具備了處理大規模結構化數據的能力,比rdd轉化方式更加簡單易用,並且獲得了更高的計算性能 2. DataFrame支持sql查詢 3.RDD是分佈式的Java對象集合,對象內部結構不可知

原创 pyspark -- RDD

rdd:彈性分佈數據集   創建 1.sc.parallelize(...) 2.引用文件 sc.textFile(...)   轉換 .map(...) .filter(...) .flatMap(...) .distinct(...)

原创 iOS NSFileHandle 基本用法介紹

NSFileHandle  此類主要是對文件內容進行讀取和寫入操作 NSFileMange   此類主要是對文件進行的操作以及文件信息的獲取 常用處理方法 + (id)fileHandleForReadingAtPath:(NS

原创 cocoa pods 1.0.0安裝及問題解決

今天整一個剛到的設備,系統版本10.11.4,安裝cocoapods,安裝過程我就簡單的複述一下, 第一步: 確保有Ruby環境,Mac中自帶Ruby環境,可以根據ruby -v進行查看當前Ruby版本是否支持cocoapods。 第二步

原创 Xcode 更新到9.0 新建xib報錯: Safe Area Layout Guide Before IOS 9.0

昨天趁着週末把xcode版本給更到了9.0,今天在工程中新建一個帶有xib的View,報錯:Safe Area Layout Guide Before IOS 9.0 報錯的字面意思就是safe area佈局應用在iOS 9之前的版本上

原创 UITextView輸入崩潰問題(隨筆記)

系統版本8.4 採用xib拖拽delegate時 點擊編輯時會閃退

原创 Anaconda安裝jieba、wordcloud等第三方庫

本文是jieba在anaconda中的安裝方法,wordcloud等第三方庫與jieba安裝方法相同,這裏是wordcloud包的下載地址 許多論壇中說使用conda install jieba安裝,我的嘗試是不可行的。我發現jieba作

原创 App Icon Size

原创 StaticCells靜態單元格

今天是週末挺冷的,再有幾天2015就結束了,提前祝大家新年快樂吧。閒話不多說,說咱們的靜態單元格吧。靜態單元格只能用在UITableViewController中,所以實例如下: 一、首先創建一個“Single View Applicat