原创 NLP 利器 Gensim 來訓練 word2vec 詞向量模型的參數設置

使用 Gensim 來訓練 word2vec 詞向量模型的參數設置 文章目錄一、最小頻次 min_count二、詞向量維度 size三、並行處理核心數 workers 我們可以使用一些參數設置來控制訓練的速度和質量。 一、最小頻次

原创 Python Pandas 圖形繪製(一):折線圖,柱狀圖

Pandas 圖形繪製(一):折線圖,柱狀圖一、折線圖 Line Chart1.1 默認繪製折線圖 df.plot1.2 繪製多條折線二、柱狀圖 Bar Chart2.1 垂直柱狀圖 df.plot.bar2.2 疊加柱狀圖 st

原创 NLP 利器 Gensim 中 word2vec 模型的訓練損失計算,和對比基準的選擇

本文爲系列文章之一,前面的幾篇請點擊鏈接: NLP 利器 gensim 庫基本特性介紹和安裝方式 NLP 利器 Gensim 庫的使用之 Word2Vec 模型案例演示 NLP 利器 Gensim 來訓練自己的 word2vec

原创 NLP 利器 Gensim 來訓練自己的 word2vec 詞向量模型

首先,要訓練一個自己的詞向量模型,我們是需要一些數據的。 在這裏,我們使用 Lee Corpus 作爲訓練用語料數據。 下載地址: lee_background.cor 文章目錄一、數據預處理二、訓練模型三、存儲模型四、讀取模型

原创 Python Pandas 圖形繪製(三):散點圖(單維度和交叉維度)

Pandas 圖形繪製(三)準備數據:1. 散點圖(單維度)df.plot.scatter2. 散點圖(交叉維度)x,y,c 準備數據: import matplotlib.pyplot as plt import pandas

原创 Gensim 中 word2vec 模型的恢復訓練:載入存儲模型並繼續訓練

Gensim 中 word2vec 模型的恢復訓練 本文爲系列文章之一,前面的幾篇請點擊鏈接: NLP 利器 gensim 庫基本特性介紹和安裝方式 NLP 利器 Gensim 庫的使用之 Word2Vec 模型案例演示 NLP

原创 C# 的算數運算符,關係運算符,邏輯運算符,位運算符,賦值運算符,其他運算符(學習心得 8)

內置數學/邏輯運算符分類: 算數運算符 關係運算符 邏輯運算符 位運算符 賦值運算符 其他運算符 文章目錄一、算數運算符二、關係運算符三、邏輯運算符四、位運算符五、賦值運算符六、其他運算符七、運算符優先級 一、算數運算符 C#

原创 C# 的類型轉換(顯式/隱式)及內置類型轉換方法彙總(學習心得 5)

把 數據 從一種 類型 轉化爲 另一種 類型。 有 2 種形式: 隱式類型轉換:默認的安全方式,不會導致數據丟失。 顯式類型轉換:需要強制類型轉換運算符,會造成數據丟失。 顯式類型轉換案例: using System; na

原创 C# 的判斷語句 if else循環,switch 循環,嵌套判斷語句(學習心得 9)

判斷條件是否成立,成立則執行 A,不成立則執行 B(可選)。 一、判斷語句 1.1 if 語句 語法: if(boolean_expression) { /* 如果布爾表達式爲真將執行的語句 */ } 例: using S

原创 C# 變量的定義,初始化,賦值(學習心得 6)

變量:即存儲區的名字,以便程序進行操作。 每個變量有類型:值類型,引用類型,指針類型等。 類型決定內存大小和佈局。 一、變量定義 變量定義語法: <data_type> <variable_list>; 例: int i, j,

原创 NLP 利器 Gensim 中 word2vec 模型詞嵌入 Word Embeddings 的可視化

本文爲系列文章之一,前面的幾篇請點擊鏈接: NLP 利器 gensim 庫基本特性介紹和安裝方式 NLP 利器 Gensim 庫的使用之 Word2Vec 模型案例演示 NLP 利器 Gensim 來訓練自己的 word2vec

原创 C# 的基本語法,標識符,關鍵字(學習心得 3)

C# 是面對對象的編程。 程序由各種交互對象組成。 同種類對象,通常在相同的 class 中。 例如我們實現一個矩形對象 Rectangle 的類,那這個類下面會有 length 和 width 屬性,根據屬性計算面積和顯示細節。

原创 C# 循環語句:while,for,foreach,do while,break,continue,嵌套循環,無限循環(學習心得 10)

滿足一定條件下,多次執行同一塊代碼。 一、循環類型 1.1 while 循環 語法: while(condition) { statement(s); } condition 可以是任意的表達式,當爲任意非零值時都爲真。

原创 Python Pandas 數據分組 pd.groupby 的相關操作(二)shift, rolling, rank, cumsum, agg

Pandas 數據分組 pd.groupby 的相關操作(二)數據準備一、數據平移 df.shift1.1 上下平移1.2 左右平移1.3 分組數據平移二、數據滾動 df.rolling2.1 滾動求和2.2 滾動求均值三、排名

原创 Python Pandas 處理空數據/缺失數據 dropna fillna,增加/更新列 assign,分層 qcut,向量函數

Pandas 處理空數據/缺失數據,增加/更新列,分層,向量函數數據準備一、處理缺失數據1.1 去除有缺失數據的行 dropna1.2 替換缺失數據 fillna二、增加/更新列2.1 指定生成列的方式2.2 複製現有的列生成新的