java:根據文件頭來判斷文件類型

根據文件後綴來判斷文件類型,往往是不靠譜的,因爲要考慮到,可能人爲的更改文件後綴,導致一些問題。
因此,下面是詳細的根據文件頭信息來判斷文件類型。
文件頭的十六進制以後繼續補充。

package com.webserver.utils;

import java.io.FileInputStream;  
import java.io.IOException;  
import java.util.HashMap;  

/**
 * <p>Title:CheckExcelFileTypeUtil </p>
 * <p>Description: 
 * 類描述:獲取和判斷文件頭信息  
 *    |--文件頭是位於文件開頭的一段承擔一定任務的數據,一般都在開頭的部分。 
 *    |--頭文件作爲一種包含功能函數、數據接口聲明的載體文件,用於保存程序的聲明(declaration),而定義文件用於保存程序的實現(implementation)。 
 *    |--爲了解決在用戶上傳文件的時候在服務器端判斷文件類型的問題,故用獲取文件頭的方式,直接讀取文件的前幾個字節,來判斷上傳文件是否符合格式。 
 * 問題說明:
 *    |--文件頭有些信息在windows上運行,對應不上。是否是在linux下才是這些文件頭?還有待驗證。暫時因爲只是需要判斷excel格式,因此暫不驗證。有空我會補充。
 * </p>
 * @author 魯東順
 * @date 2016-11-23上午9:58:39
 */
public class CheckExcelFileTypeUtil {
    // 緩存文件頭信息-文件頭信息  
    public static final HashMap<String, String> mFileTypes = new HashMap<String, String>();  
    static {  
        // images  
        mFileTypes.put("FFD8FF", "jpg");  
        mFileTypes.put("89504E47", "png");  
        mFileTypes.put("47494638", "gif");  
        mFileTypes.put("49492A00", "tif");  
        mFileTypes.put("424D", "bmp");  
        //  
        mFileTypes.put("41433130", "dwg"); // CAD  
        mFileTypes.put("38425053", "psd");  
        mFileTypes.put("7B5C727466", "rtf"); // 日記本  
        mFileTypes.put("3C3F786D6C", "xml");  
        mFileTypes.put("68746D6C3E", "html");  
        mFileTypes.put("44656C69766572792D646174653A", "eml"); // 郵件  
        mFileTypes.put("D0CF11E0", "doc");  
        mFileTypes.put("D0CF11E0", "xls");//excel2003版本文件  
        mFileTypes.put("5374616E64617264204A", "mdb");  
        mFileTypes.put("252150532D41646F6265", "ps");  
        mFileTypes.put("255044462D312E", "pdf");  
        mFileTypes.put("504B0304", "docx");  
        mFileTypes.put("504B0304", "xlsx");//excel2007以上版本文件  
        mFileTypes.put("52617221", "rar");  
        mFileTypes.put("57415645", "wav");  
        mFileTypes.put("41564920", "avi");  
        mFileTypes.put("2E524D46", "rm");  
        mFileTypes.put("000001BA", "mpg");  
        mFileTypes.put("000001B3", "mpg");  
        mFileTypes.put("6D6F6F76", "mov");  
        mFileTypes.put("3026B2758E66CF11", "asf");  
        mFileTypes.put("4D546864", "mid");  
        mFileTypes.put("1F8B08", "gz");  
    }  

    /**
     * <p>Title:getFileType </p>
     * <p>Description: 根據文件路徑獲取文件頭信息</p>
     * @param filePath  文件路徑 
     * @return 文件頭信息 
     * @author 魯東順
     * @date 2016-11-23上午10:06:40
     */
    public static String getFileType(String filePath) {  
        System.out.println(getFileHeader(filePath));  //返回十六進制  如:504B0304
        //System.out.println(mFileTypes.get(getFileHeader(filePath)));  //xlsx
        return mFileTypes.get(getFileHeader(filePath));  
    }  
    /**
     * <p>Title:getFileTypeByFileInputStream </p>
     * <p>Description: 根據文件流獲取文件頭信息</p>
     * @param is   文件流
     * @return  文件頭信息
     * @author 魯東順
     * @date 2016-11-23上午10:23:10
     */
    public static String getFileTypeByFileInputStream(FileInputStream is) {  
        return mFileTypes.get(getFileHeaderByFileInputStream(is));  
    }  

    /**
     * <p>Title:getFileHeader </p>
     * <p>Description: 根據文件路徑獲取文件頭信息 </p>
     * @param filePath 文件路徑 
     * @return 十六進制文件頭信息 
     * @author 魯東順
     * @date 2016-11-23上午10:08:16
     */
    public static String getFileHeader(String filePath) {  
        FileInputStream is = null;  
        String value = null;  
        try {  
            is = new FileInputStream(filePath);  
            byte[] b = new byte[4];  
            /* 
             * int read() 從此輸入流中讀取一個數據字節。int read(byte[] b) 從此輸入流中將最多 b.length 
             * 個字節的數據讀入一個 byte 數組中。 int read(byte[] b, int off, int len) 
             * 從此輸入流中將最多 len 個字節的數據讀入一個 byte 數組中。 
             */  
            is.read(b, 0, b.length);  
            value = bytesToHexString(b);  
        } catch (Exception e) {  
        } finally {  
            if (null != is) {  
                try {  
                    is.close();  
                } catch (IOException e) {  
                }  
            }  
        }  
        return value;  
    }  
    /**
     * <p>Title:getFileHeaderByFileInputStream </p>
     * <p>Description: 根據文件流獲取文件頭信息</p>
     * @param is  文件流
     * @return  十六進制文件頭信息 
     * @author 魯東順
     * @date 2016-11-23上午10:20:27
     */
    public static String getFileHeaderByFileInputStream(FileInputStream is) {  
        String value = null;  
        try {  
            byte[] b = new byte[4];  
            /* 
             * int read() 從此輸入流中讀取一個數據字節。int read(byte[] b) 從此輸入流中將最多 b.length 
             * 個字節的數據讀入一個 byte 數組中。 int read(byte[] b, int off, int len) 
             * 從此輸入流中將最多 len 個字節的數據讀入一個 byte 數組中。 
             */  
            is.read(b, 0, b.length);  
            value = bytesToHexString(b);  
        } catch (Exception e) {  
        } finally {  
            if (null != is) {  
                try {  
                    is.close();  
                } catch (IOException e) {  
                }  
            }  
        }  
        return value;  
    }  

    /**
     * <p>Title:bytesToHexString </p>
     * <p>Description: 將要讀取文件頭信息的文件的byte數組轉換成string類型表示 </p>
     * @param src 要讀取文件頭信息的文件的byte數組 
     * @return  文件頭信息 
     * @author 魯東順
     * @date 2016-11-23上午10:09:56
     */
    private static String bytesToHexString(byte[] src) {  
        StringBuilder builder = new StringBuilder();  
        if (src == null || src.length <= 0) {  
            return null;  
        }  
        String hv;  
        for (int i = 0; i < src.length; i++) {  
            // 以十六進制(基數 16)無符號整數形式返回一個整數參數的字符串表示形式,並轉換爲大寫  
            hv = Integer.toHexString(src[i] & 0xFF).toUpperCase();  
            if (hv.length() < 2) {  
                builder.append(0);  
            }  
            builder.append(hv);  
        }  
        //System.out.println(builder.toString());  
        return builder.toString();  
    }  

    /**
     * <p>Title:main </p>
     * <p>Description: 測試</p>
     * @param args
     * @throws Exception
     * @author 魯東順
     * @date 2016-11-23上午10:11:37
     */
    public static void main(String[] args) throws Exception {  
        /*//測試1...根據文件全路徑
        final String fileType = getFileType("E:\\服務申請模板.xlsx");  
        System.out.println(fileType);  */

        //測試2...根據流
        FileInputStream is = null;  
        is = new FileInputStream("E:\\服務申請模板.xlsx");  
        final String fileType2 = getFileTypeByFileInputStream(is);  
        System.out.println(fileType2); 
    }
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章