原创 獲取含有指定字符串的行和它的上一行
cat a.txt12345錯誤1abcdefaaaaaa錯誤“錯誤”是固定的字符串,我要想獲取的結果是含有錯誤的行和它的上一行,如下:12345錯誤1aaaaaa錯誤 答案1: [root@hostkiller ~]# cat 2
原创 awk正則表達式使用外部變量(轉)
awk的正則表達式匹配中,如果要使用外部shell 變量,先在變量外加雙引號,再加單引號即可,如:for i in read write print; do cat file.txt | awk '{ if ($7~/'"$i"'/
原创 將一個文件中的每兩行合併成一行
將一個文件中的每兩行合併成一行,用什麼方法最簡單? xargs -l2 < file.txt | more
原创 TF-IDF
TF-IDF 維基百科,自由的百科全書 TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索與文本挖掘的常用加權技術。TF-IDF是一種統計方法,用以評估一字
原创 Find–atime –ctime –mtime的用法與區別總結
週五有同事問起find命令中-mtime n、-mtime –n以及-mtime +n的用法區別,當時雖然記得這裏n是n個24個小時的意思,也是對所有這幾個屬性詳細的用法卻一知半解,索性週末仔細google並且實踐了一番
原创 linux下刪除亂碼文件名的方法(轉載)
linux下刪除亂碼文件名的方法(轉載) 點評:linux下出現亂碼文件名,這裏給出具體的刪除方法,需要的朋友可以參考下。 linux下刪除亂碼文件名, 不廢話: 1. ls -i 列出文件的節點ID, 如: 123
原创 數據庫查詢性能需注意幾點
1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進
原创 va_list和vsnprintf
va_list和vsnprintf
原创 召回率
召回率(Recall Rate,也叫查全率)是檢索出的相關文檔數和文檔庫中所有的相關文檔數的比率,衡量的是檢索系統的查全率;精度是檢索出的相關文檔數與檢索出的文檔總數的比率,衡量的是檢索系統的查準率。 基本概念 召
原创 http 304優化,瞭解客戶端緩存
來源:http://blog.csdn.net/JeamKing/article/details/5153741很多人首先會想從服務器緩存方面着手對程序進行 優化,許多不同的服務器緩存方式都有他們自己的特點,像我曾經參與的一些項目中,根據
原创 daemon函數實現原理
linux提供了daemon函數用於創建守護進程,實現原理如下: #include <unistd.h> int daemon(int nochdir, int noclose); 1. daemon()函數主要用於希望脫離控制檯
原创 date
Date=`date -d "-2 day" "+%Y%m%d"` LastDate=`date -d "-1 day $Date" "+%Y%m%d"`
原创 看看
http://bbs.chinaunix.net/thread-543887-1-1.html http://bbs.chinaunix.net/thread-674903-1-1.html http://www.laozhuzhu.co
原创 shmget EINVAL
EINVAL
原创 man xargs
NAME xargs - build and execute command lines from standard input SYNOPSIS xargs [-0prtx