原创 Windows下MySQL安裝、卸載、數據路徑配置

1、安裝 以mysql-5.5.19-win32.msi爲例,下載地址http://pan.baidu.com/s/1bPJXkq,不同版本的MySQL安裝過程可能有所不同。 雙擊mysql-5.5.19-win32.msi,按照默認的配

原创 在linux shell中獲取時間

獲得當天的日期 date +%Y-%m-%d 輸出: 2011-07-28   將當前日期賦值給DATE變量 DATE=$(date +%Y%m%d) 有時候我們需要使用今天之前或者往後的日期,這時可以使用date的 -d參數

原创 加載本地文件到Hive表出現NULL列的解決辦法

舉例說明, 現有本地文件,每行兩列,內容如下: 0000000026310400        F 0000000029858520        F 0000000042620180        F 0000000044783820

原创 分類算法中的ROC與PR指標

做過圖像識別、機器學習或者信息檢索相關研究的人都知道,論文的實驗部分都要和別人的算法比一比。可怎麼比,人多嘴雜,我說我的方法好,你說你的方法好,各做各的總是不行——沒規矩不成方圓。於是慢慢的大家就形成了一種約定,用ROC曲線和PR曲線

原创 SQL in 與inner join查詢結果的區別

in和inner join在大多數情況下都是返回兩表的交集,但是兩者還是有區別的,如下例子 mysql> select * from a; +------+------+ | id   | name | +-----

原创 理解Python中的With...as...語法

使用語言的好特性,而不是那些糟糕的特性————不知道誰說的 好久不學習python的語法了,上次去面試,和面試官聊到了python中的with-as statement(也稱context manager),挺感興趣的,這兩天學習了一番,

原创 Jupyter Notebook 的快捷鍵

Jupyter Notebook 有兩種鍵盤輸入模式。編輯模式,允許你往單元中鍵入代碼或文本;這時的單元框線是綠色的。命令模式,鍵盤輸入運行程序命令;這時的單元框線是灰色。 命令模式 (按鍵 Esc 開啓) Enter : 轉入編

原创 值得推薦的C/C++框架和庫 (真的很強大)

值得學習的C語言開源項目 - 1. Webbench Webbench是一個在linux下使用的非常簡單的網站壓測工具。它使用fork()模擬多個客戶端同時訪問我們設定的URL,測試網站在壓力下工作的性能,最多可以模擬3萬個併發連接去測

原创 使用GDB命令行調試器調試C/C++程序

沒有調試器的情況下編寫程序時最糟糕的狀況是什麼?編譯時跪着祈禱不要出錯?用血祭召喚惡魔幫你運行程序?或者在每一行代碼間添加printf("test")語句來定位錯誤點?如你所知,編寫程序時不使用調試器的話是不方便的。幸好,linux下調

原创 在windows上通過瀏覽器遠程連接Linux服務器的jupyter

要實現標題所描述的功能,需要在Liunx服務器端和windows客戶端分別進行配置,需要配置的內容如下: 1、Linux服務器端配置 (1)啓動ipython,$ ipython (2)創建遠程連接密碼,In [1]: from note

原创 Matplotlib學習筆記1-2D繪圖

1、直方圖 matplotlib.pyplot.hist(x, bins=10, range=None, normed=False, weights=None, cumulative=False, bottom=None, histtyp

原创 CMake生成VS2013項目失敗的解決辦法

在使用CMake生成一個VS2013項目時,遇到如下內容的錯誤信息: ————————————————分割線——————————————————— The C compiler identification is MSVC 18.0.2

原创 在python中獲取時間

time.strftime裏面有很多參數,可以讓你能夠更隨意的輸出自己想要的東西: 下面是time.strftime的參數: strftime(fo

原创 VIM常用命令整理

1、移動光標 上下左右:四個方向箭頭或k、j、h、l 上下翻頁:PageUP,PageDN 文首文尾:gg跳到文檔起始位置,G跳到末尾位置 行首行尾:HOME跳到行首,END跳到行尾 到指定行:ESC進入命令模式,ngg,如果沒有顯示行號

原创 sklearn文本特徵提取

sklearn中一般使用CountVectorizer和TfidfVectorizer這兩個類來提取文本特徵,sklearn文檔中對這兩個類的參數並沒有都解釋清楚,本文的主要目的就是解釋這兩個類的參數的作用 (1)CountVector