原创 simhash

轉子: http://blog.sina.com.cn/s/blog_81e6c30b0101cpvu.html  

原创 sed替換^M爲回車

sed -e 's/^M/\n/g' myfile.txt 注意   ^M 使用“CTRL-V CTRL-M”生成,而不是直接鍵入“^M”。

原创 find 用法以及經典案例

刪除5天以上的log:  find deploy/log -type f -ctime +5 -exec rm -f {} \;   替換文件夾下指定文件字符串:   find . -name "*.html" | xargs sed

原创 lucene 之 全文檢索概述

我們日常生活中的數據可以分成兩種,一種是結構化數據,還有一種是非結構化數據。 結構化數據就是固定格式和有限長度的數據,比如數據庫和元數據等等。 非結構化就是無固定格式和不定長的數據,比如郵件和word文檔。 還有介於兩者之間的,半結構化

原创 .gitignore java 版本

    # Operating System Files *.DS_Store Thumbs.db *.sw? .#* *# *~ *.sublime-* # Build Artifacts .gradle/ build/ tar

原创 添加用戶跟組

1、添加用戶,首先用adduser命令添加一個普通用戶,命令如下: #adduser tommy //添加一個名爲tommy的用戶#passwd tommy   //修改密碼Changing password for user tomm

原创 lucene 4.6 之索引文件格式

名詞解釋: document 包含一系列的fields field是一系列terms的代號 term是一系列的bytes   倒排索引: 這個索引存儲了關於這個term的一些統計,爲什麼叫做倒排索引,因爲這個能夠列出包含這個term的所

原创 java class reload 動態加載

在運行時動態加載jar包容易,但是如果想動態替換運行時的類,需要定義自己的classloader , 用自己的classloader 來load這個類。具體代碼如下。 public class UClassloader extends