部署Hadoop的集羣環境爲
操作系統 CentOS 5.8
hadoop版本爲cloudera hadoop-0.20.2-cdh3u3
集羣中設置支持gzip lzo壓縮後,在對壓縮文件進行讀取或者對輸入文件壓縮的時候要使用到hadoop的本地庫,本地庫的默認位置在
$HADOOP_HOME/lib/native/Linux-amd64-64 (64位操作系統)
$HADOOP_HOME/lib/native/Linux-i386-32 (32位操作系統)
文件夾中的libhadoop.so文件,就是hadoop的本地庫。
如果本地庫不存在,或者本地庫與當前操作系統的版本不一致的時候,會報下面的錯誤:
11/09/20 17:29:49 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable
增加調試信息設置
$ export HADOOP_ROOT_LOGGER=DEBUG,console
$ hadoop fs -text /test/data/origz/access.log.gz
2012-04-24 15:55:43,269 WARN org.apache.hadoop.util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
error libhadoop.so /lib64/libc.so.6 required (libc 2.6) /usr/local/hadoop/lib/native/Linux-amd64-64
說明系統中的glibc的版本和libhadoop.so需要的版本不一致導致
查看系統的libc版本
# ll /lib64/libc.so.6
lrwxrwxrwx 1 root root 11 Apr 24 16:49 /lib64/libc.so.6 -> libc-2.5.so
系統中的版本爲2.5
將系統中的glibc升級爲2.9
下載glibc
wget http://ftp.gnu.org/gnu/glibc/glibc-2.9.tar.bz2
下載glibc-linuxthreads
wget http://ftp.gnu.org/gnu/glibc/glibc-linuxthreads-2.5.tar.bz2
解壓
$tar -jxvf glibc-2.9.tar.bz2
$cd glibc-2.9
$tar -jxvf ../glibc-linuxthreads-2.5.tar.bz2
$cd ..
$export CFLAGS="-g -O2"
$./glibc-2.7/configure --prefix=/usr --disable-profile --enable-add-ons --with-headers=/usr/include --with-binutils=/usr/bin
$make
#make install
安裝編譯過程中需要注意三點:
1、要將glibc-linuxthreads解壓到glibc目錄下。
2、不能在glibc當前目錄下運行configure。
3、加上優化開關,export CFLAGS="-g -O2",否則會出現錯誤
安裝完後,可以查看ls -l /lib/libc.so.6已升級
lrwxrwxrwx 1 root root 11 Apr 24 16:49 /lib64/libc.so.6 -> libc-2.9.so
測試本地庫是否升級
$ export HADOOP_ROOT_LOGGER=DEBUG,console
$ hadoop fs -text /test/data/origz/access.log.gz
12/04/25 08:54:47 INFO lzo.LzoCodec: Successfully loaded & initialized native-lzo library [hadoop-lzo rev 6bb1b7f8b9044d8df9b4d2b6641db7658aab3cf8]
12/04/25 08:54:47 DEBUG util.NativeCodeLoader: Trying to load the custom-built native-hadoop library...
12/04/25 08:54:47 INFO util.NativeCodeLoader: Loaded the native-hadoop library
12/04/25 08:54:47 INFO zlib.ZlibFactory: Successfully loaded & initialized native-zlib library
12/04/25 08:54:47 DEBUG fs.FSInputChecker: DFSClient readChunk got seqno 0 offsetInBlock 0 lastPacketInBlock false packetLen 132100
可以看到將glibc升級後不再報錯,已經成功加載本地庫