原创 GridSearch & Kfold & cross validation

what’s cross validation? Cross-validation is a technique that is used for the assessment of how the results of stat

原创 機器學習的第一步:數據預處理

背景 所謂的機器學習,目前還是基於統計的,有監督的。所以數據的預處理則顯得尤其重要。 今天我們利用sklearn的preprocess來進行數據的預處理。 以前寫過一篇關於特徵縮放的,其實本質也是特徵預處理,使得標準化。 這裏主要

原创 python並行加速之: multiprocessing, multithread

背景 對於java的多線程問題,可以方便利用disrupt架構。在python則一般是使用multiprocessing和multithread兩種解決方案,前者是基於cpu; 後者基於多線程。 具體方案 Process 方案 d

原创 apache maven install notes

introduction(what) if we want to use commands to package, install or deply base MAVEN. let’s install it at mac. how

原创 MAP_K 檢索評估指標

1. MAP_K MAP: mean average precision. precision很容易理解;precision@10表示檢索10個文檔中包含相關所佔的比例, 比如檢索了10個,有9個是相關的,那麼 precis

原创 CNN再思

CNN convolutional neural network,不瞭解的可以學習https://arxiv.org/pdf/1901.06032.pdf,非常全面。 這裏只是CNN的二次抽象,可以認爲是這個話題的再次“全連接”層

原创 cart迴歸樹:練手+sklearn

背景 cart樹作爲決策樹的一種,在非常多的地方被使用。既可以用於分類問題,也可以用於迴歸問題。分類問題則非常容易理解,利用gini係數較大的特徵進行樣本分裂,從而構建一顆分類樹。 今天我們要探討的是迴歸樹。 迴歸樹cart簡介

原创 動態規劃解決宮格移動

介紹 動態規劃(英語:Dynamic programming,簡稱 DP)是一種在數學、管理科學、計算機科學、經濟學和生物信息學中使用的,通過把原問題分解爲相對簡單的子問題的方式求解複雜問題的方法。 動態規劃常常適用於有重疊子問題

原创 動態規劃之二:揹包問題knapsack

揹包問題描述 有n個物品,它們有各自的體積和價值,現有給定容量的揹包,如何讓揹包裏裝入的物品具有最大的價值總和? 類似的問題非常多: 比如每個任務都有時間和價值,我們有一定的時間,現在在有限的的時間裏完成最大價值的任務,如何安排?

原创 mac OWLVis安裝

OWLVis介紹 如果我們需要管理類似KG知識圖譜的東西,可以使用protege。這款斯坦福共享的軟件非常棒。也有網頁版:webpretege.stanford.edu. 但是我們需要觀察更細緻的樹形結構: 如何安裝 但是安裝之後

原创 pyscaffold建立項目管理

pyscaffold 新建一個python項目的管理軟件。一個命令就可以putup my_project即可。 PyScaffold helps you to easily setup a new Python project.

原创 如何利用conda建立的虛擬空間在jupyter裏開發

conda安裝之後使用命令行 將anaconda的bin目錄加入PATH,根據版本不同,也可能是~/anaconda3/bin echo ‘export PATH="~/anaconda2/bin:$PATH"’ >> ~/.ba

原创 RSA premaster secret error問題分析和解決

問題描述 java 在 打包,利用 java -Xmx1g -Djava.ext.dirs=lib2 Runner xx運行。 報錯:RSA premaster secret error 測試沒有問題,本地可以運行且結果正確; 服

原创 mac上安裝xlearn

什麼是xlearn 安裝步驟 1. xcode for clang https://developer.apple.com/download/more/ 下載xcode並安裝,是的,就是5-6G大小,而且解壓縮之後11.8G 2.

原创 StarSpace系列之一:tagspace

問題類型 TagSpace 單詞、標籤的嵌入 用途: 學習從短文到相關主題標籤的映射,例如,在 這篇文章 中的描述。這是一個典型的分類應用。 模型: 通過學習兩者的嵌入,學習的映射從單詞集到標籤集。 例如,輸入“restaurant