原创 transformer xl---vocabulary

data_dir 存放原始數據, def main(unused_argv): del unused_argv # Unused corpus = get_lm_corpus(FLAGS.data_dir, F

原创 word2vec_java源碼解析

第一步,讀取語料(已經分過詞),把每個詞出現的頻率放在wordMap中。 private void readVocab(File file) throws IOException { MapCount<String> mc

原创 xlnet--數據預處理

for split, batch_size in zip( ["train", "valid"], [FLAGS.per_host_train_bsz, FLAGS.per_

原创 MySQL的四種BLOB類型大小

在Java中都對應 byte[] 類型 大小(單位:字節) TinyBlob 最大 255 Blob

原创 指定項目遠程maven倉庫地址

這裏使用阿里雲的鏡像地址,速度快,最新的包都有。自帶的有時候沒有最新版本 <repositories> <repository> <id>alimaven</id> <name>Maven Aliy

原创 gensim(四)--word2vec embedding

訓練並保存模型 def train_savemodel(): model = Word2Vec(PathLineSentences(directory), size=400, window=5, min_count=5,

原创 mysql 8.0使用時的2個問題

1、每次開機,都會報以下錯誤。需要設定時區。 om.mysql.cj.exceptions.InvalidConnectionAttributeException: The server time zone value '�й��

原创 MongoDB可視化工具MongoDB Compass查詢

MongoDB Compass使用這個工具查詢時,如果是主鍵查詢,需要額外加個ObjectId函數。 {_id:ObjectId('5e54a00f7581de30dc3269e0')}

原创 linix系統基本操作

ls 展示當前目錄的所有文件 ls -l 詳細展示 cd … 進入上級目錄 cd / 入根目錄 ls -l -a 顯示所有(含隱藏) 查找日誌文件中的指定字符串 sudo grep -2 -i '_clen

原创 netty應用退出

netty程序,使用shutdownGracefully退出。退出前會把隊列中的消息發送完,釋放channel,多路複用器的去註冊,清空定時器任務等。 public Future<?> shutdownGracefully

原创 okHttp發送http請求

post請求: OkHttpClient client = new OkHttpClient.Builder().retryOnConnectionFailure(false) .readTimeout(

原创 Java程序退出處理

在Java程序退出時,希望做一些保存處理,比如釋放一些資源,或者保證事務執行完再推出。 在Linux環境下,需要使用kill -15 pid命令殺死進程,才能得到通知。 而window環境下,只能通過ctrl+c退出纔有效,命令殺

原创 DelimiterBasedFrameDecoder使用

DelimiterBasedFrameDecoder是一個分隔符解碼器。 FixedLengthFrameDecoder作用和它差不多,只不過是定長。 可以同時接受多個分隔符,第一個參數是緩衝區大小,如果長度超過1024(可以指定

原创 IDEA創建maven多模塊父子項目

父子項目的好處是多人開發時,可以共用父項目的類庫,而每個子項目又可以有自己定製的類庫,改動時也隻影響這一個模塊,並不會影響其他的模塊。 步驟1:創建父項目 ` 修改packaging屬性爲pom <?xml version="1.

原创 LengthFieldBasedFrameDecoder使用

LengthFieldBasedFrameDecoder解碼器,會讀取byteBuf中的前幾個字節,獲取數據長度。 作用是防止粘包。 如果客戶端也是netty,那麼可以配合LengthFieldPrepender使用。Length