hadoop上安裝snappy

 snappy也是一個開源的高效壓縮和解壓框架。具體介紹,這裏不再贅述,可以去官網查詢。

 安裝所需軟件:gcc、g++、snappy包、hadoop-snappy源碼包、maven.

 gcc在ubuntu上已經安裝,如果未安裝,包括g++,maven,可以通過以下命令安裝

  1. sudo apt-get install gcc g++ maven2 

下載軟件包:

  snappy :http://code.google.com/p/snappy/downloads/list

  執行如下命令:

  1. tar -zxvf snappy-1.0.5.tar.gz 
  2. cd snappy-1.0.5 
  3. ./configure 
  4. make 
  5. sudo make install 

  使用SVN客戶端下載hadoop-snappy 源碼:

  下載地址:http://hadoop-snappy.googlecode.com/svn/trunk/

 編譯hadoop-snappy 需要automake和libtool包,執行如下命令:

  1. sudo apt-get install automake libtool 
  2. cd hadoop-snappy 
  3. mvn package 

然後把編譯後的 hadoop-snappy-1.0.5-tar/hadoop-snappy-1.0.5/lib/ 下的jar包 拷貝到$HADOOP_HOME/lib下,修改配置文件core-site.xml

  1. <property> 
  2. <name>mapred.compress.map.output</name> 
  3. <value>true</value> 
  4. </property> 
  5. <property> 
  6. <name>mapred.map.output.compression.codec</name> 
  7. <value>org.apache.hadoop.io.compress.SnappyCodec</value> 
  8. </property> 
  9. <property> 
  10. <name>io.compression.codecs</name> 
  11. <value>org.apache.hadoop.io.compress.GzipCodec, 
  12. org.apache.hadoop.io.compress.DefaultCodec, 
  13. org.apache.hadoop.io.compress.BZip2Codec, 
  14. com.hadoop.compression.lzo.LzoCodec, 
  15. com.hadoop.compression.lzo.LzopCodec, 
  16. org.apache.hadoop.io.compress.SnappyCodec 
  17. </value> 
  18. </property> 
  19. <property> 
  20. <name>io.compression.codec.lzo.class</name> 
  21. <value>com.hadoop.compression.lzo.LzoCodec</value> 
  22. </property> 

然後重啓hadoop完事。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章