原创 simhash
轉子: http://blog.sina.com.cn/s/blog_81e6c30b0101cpvu.html
原创 sed替換^M爲回車
sed -e 's/^M/\n/g' myfile.txt 注意 ^M 使用“CTRL-V CTRL-M”生成,而不是直接鍵入“^M”。
原创 find 用法以及經典案例
刪除5天以上的log: find deploy/log -type f -ctime +5 -exec rm -f {} \; 替換文件夾下指定文件字符串: find . -name "*.html" | xargs sed
原创 lucene 之 全文檢索概述
我們日常生活中的數據可以分成兩種,一種是結構化數據,還有一種是非結構化數據。 結構化數據就是固定格式和有限長度的數據,比如數據庫和元數據等等。 非結構化就是無固定格式和不定長的數據,比如郵件和word文檔。 還有介於兩者之間的,半結構化
原创 .gitignore java 版本
# Operating System Files *.DS_Store Thumbs.db *.sw? .#* *# *~ *.sublime-* # Build Artifacts .gradle/ build/ tar
原创 添加用戶跟組
1、添加用戶,首先用adduser命令添加一個普通用戶,命令如下: #adduser tommy //添加一個名爲tommy的用戶#passwd tommy //修改密碼Changing password for user tomm
原创 lucene 4.6 之索引文件格式
名詞解釋: document 包含一系列的fields field是一系列terms的代號 term是一系列的bytes 倒排索引: 這個索引存儲了關於這個term的一些統計,爲什麼叫做倒排索引,因爲這個能夠列出包含這個term的所
原创 java class reload 動態加載
在運行時動態加載jar包容易,但是如果想動態替換運行時的類,需要定義自己的classloader , 用自己的classloader 來load這個類。具體代碼如下。 public class UClassloader extends