原创 獲取含有指定字符串的行和它的上一行

cat  a.txt12345錯誤1abcdefaaaaaa錯誤“錯誤”是固定的字符串,我要想獲取的結果是含有錯誤的行和它的上一行,如下:12345錯誤1aaaaaa錯誤 答案1: [root@hostkiller ~]# cat 2

原创 awk正則表達式使用外部變量(轉)

awk的正則表達式匹配中,如果要使用外部shell 變量,先在變量外加雙引號,再加單引號即可,如:for i in read write print;  do  cat file.txt | awk '{ if ($7~/'"$i"'/

原创 將一個文件中的每兩行合併成一行

將一個文件中的每兩行合併成一行,用什麼方法最簡單? xargs -l2 < file.txt | more

原创 TF-IDF

TF-IDF 維基百科,自由的百科全書 TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索與文本挖掘的常用加權技術。TF-IDF是一種統計方法,用以評估一字

原创 Find–atime –ctime –mtime的用法與區別總結

         週五有同事問起find命令中-mtime n、-mtime –n以及-mtime +n的用法區別,當時雖然記得這裏n是n個24個小時的意思,也是對所有這幾個屬性詳細的用法卻一知半解,索性週末仔細google並且實踐了一番

原创 linux下刪除亂碼文件名的方法(轉載)

linux下刪除亂碼文件名的方法(轉載) 點評:linux下出現亂碼文件名,這裏給出具體的刪除方法,需要的朋友可以參考下。 linux下刪除亂碼文件名, 不廢話:  1. ls -i 列出文件的節點ID, 如: 123

原创 數據庫查詢性能需注意幾點

  1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。   2.應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進

原创 va_list和vsnprintf

va_list和vsnprintf

原创 召回率

召回率(Recall Rate,也叫查全率)是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系統的查全率;精度是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量的是檢索系統的查準率。 基本概念    召

原创 http 304優化,瞭解客戶端緩存

來源:http://blog.csdn.net/JeamKing/article/details/5153741很多人首先會想從服務器緩存方面着手對程序進行 優化,許多不同的服務器緩存方式都有他們自己的特點,像我曾經參與的一些項目中,根據

原创 daemon函數實現原理

linux提供了daemon函數用於創建守護進程,實現原理如下: #include <unistd.h> int daemon(int nochdir, int noclose); 1. daemon()函數主要用於希望脫離控制檯

原创 date

Date=`date -d "-2 day" "+%Y%m%d"` LastDate=`date -d "-1 day $Date" "+%Y%m%d"`

原创 看看

http://bbs.chinaunix.net/thread-543887-1-1.html http://bbs.chinaunix.net/thread-674903-1-1.html http://www.laozhuzhu.co

原创 shmget EINVAL

EINVAL 

原创 man xargs

NAME        xargs - build and execute command lines from standard input SYNOPSIS        xargs  [-0prtx