原创 開源夏令營之foldcolumn工具及解決方案(七)測試與總結

項目地址http://code.csdn.net/os_camp/16/proposals/65 安裝方法 在https://code.csdn.net/xhu_eternalcc/foldcolumn下載源碼,裏面有 tar/foldc

原创 求某個數是排列中的第幾個--康託展開

轉自:http://blog.csdn.net/niushuai666/article/details/6609944 求4132是第幾個排列? 解:總共4個數,所以n=4.它在全部排列的位置設爲ans,初始化爲0. 1.第一個數是4,比

原创 CSDN英雄會題解之分巧克力與巨人網絡筆試題之上臺階

隨意翻論壇,翻到巨人網絡的一道筆試題,感覺很熟悉。想到在CSDN遇到過。這兩道題很相似,也很簡單,都能很容易的想到動態規劃遞歸,然後將其改成非遞歸實現提高效率。 分巧克力 題意大概是一塊長度爲n的巧克力,每次可以在邊上砍去一段,這段的長度

原创 【C++】使用libxml解析XML文件

1.     構建xmlDocPtr對象,xmlParseMemory(str,str.len) 字符串轉爲XML文檔 , 從文件讀取內容構建xmlReadFile(szDocName,"GB2312",XML_PARSE_RECOV

原创 Hadoop中Combiner的使用

轉自:http://blog.csdn.net/ipolaris/article/details/8723782 在MapReduce中,當map生成的數據過大時,帶寬就成了瓶頸,怎樣精簡壓縮傳給Reduce的數據,有不影響最終的結果呢。

原创 Hadoop 中文編碼相關問題 -- mapreduce程序處理GBK編碼數據並輸出GBK編碼數據

最近些統計程序時,使用了原生的java hadoop,以前使用streaming 模式, 用awk腳本寫時,沒有遇到編碼問題,原生的java hadoop程序,在處理gb18030格式log時,當輸出內容時,出現亂碼。解決方法見下文(轉自

原创 字符串哈希函數

基本概念 所謂完美哈希函數,就是指沒有衝突的哈希函數,即對任意的 key1 != key2 有h(key1) != h(key2)。 設定義域爲X,值域爲Y, n=|X|,m=|Y|,那麼肯定有m>=n,如果對於不同的key1,key2

原创 使用C++標準庫sort自定義比較函數導致死循環問題

永遠讓比較函數對相等的值返回false(來自Effective C++) -------------------------------------------------------------------------------

原创 hadoop相關優化參數

hadoop爲用戶作業提供了多種可配置的參數,以允許用戶根據作業特點調整這些值使作業運行效率達到最優。 程序編寫規範 (1)設置Combiner 如果是一大批MR程序,如果可以設置一個Combiner,Combiner可減少Map Ta

原创 svn checkout單個文件(refers to a file, not a directory)

http://www.letuknowit.com/archives/svn-checkout-single-file/ 有時候需要在svn版本倉庫中某個比較上層的目錄中(比如根目錄)checkout某一個文件,例如下面的svn版本倉

原创 shell中test命令用法詳解

test命令用法。功能:檢查文件和比較值   1)判斷表達式   if test  (表達式爲真)   if test !表達式爲假   test 表達式1 –a 表達式2                  兩個表達式都爲真

原创 svn: File has binary mime type property的解決辦法

 修改~/.subversion/config 找到最後一個section,在最後加上如下一行話: *.txt = svn:mime-type=text/plain;svn:eol-style=native 光這個還不夠,向上搜索到這麼一

原创 C++11:POD數據類型

啥是POD類型? POD全稱Plain Old Data。通俗的講,一個類或結構體通過二進制拷貝後還能保持其數據不變,那麼它就是一個POD類型。 平凡的定義 1.有平凡的構造函數 2.有平凡的拷貝構造函數 3.有平凡的移動

原创 玩轉Google開源C++單元測試框架Google Test系列(gtest)之六 - 運行參數

轉自http://www.cnblogs.com/coderzh/archive/2009/04/10/1432789.html 一、前言 使用gtest編寫的測試案例通常本身就是一個可執行文件,因此運行起來非常方便。同時,gtes

原创 Linux動態加載動態鏈接庫

函數 描述 #include<dlfcn.h>頭文件定義如下四個函數 dlopen 使對象文件可被程序訪問 dlsym   獲取執行了 dlopen 函數的對象文件中的符號的地址 dlerror  返回上一次出現錯誤的字符串錯誤 dl