[Python模塊學習]用imghdr模塊識別圖片格式

imghdr模塊

功能描述:imghdr模塊用於識別圖片的格式。它通過檢測文件的前幾個字節,從而判斷圖片的格式。


唯一一個API

imghdr.what(file, h=None)

第一個參數file可以是用rb模式打開的file對象或者表示路徑的字符串和PathLike對象。h參數是一段字節串。函數返回表示圖片格式的字符串。

>>> import imghdr
>>> imghdr.what('test.jpg')
'jpeg'

具體的返回值和描述如下:

返回值描述檢測方式
jpeg用JFIF或者Exif格式保存的JPEG圖片第7到第10個字節是b’JFIF’或者b’Exif’
png可移植網絡圖形格式(Portable Network Graphic Format)以字節串b’\x89PNG\r\n\x1a\n’開頭
gifGIF(Graphics Interchange Format)的87版本和89版本前6個字節爲b’GIF87a’或者b’GIF89a’
tiffTIFF(Tag Image File Format)的兩種字節順序前兩個字節爲b’MM’或者b’II’
rgbSGI ImgLib以字節串b’\x01\xda’開頭
pbmPortable Bitmap第1個字節爲b’P’,第2個字節爲b’1’或b’4’,第3個字節爲b’\t’或b’\n’或b’\r’
pgmPortable Graymap Files第1個字節爲b’P’,第2個字節爲b’2’或b’5’,第3個字節爲b’\t’或b’\n’或b’\r’
ppmPortable Pixmap Files第1個字節爲b’P’,第2個字節爲b’3’或b’6’,第3個字節爲b’\t’或b’\n’或b’\r’
rastSun Raster以字節串b’\x59\xA6\x6A\x95’開頭
xbmX Bitmap Files以字節串b’#define ‘開頭
bmpBitmap,Windows標準圖像文件格式以字節串b’BM’開頭
webp谷歌的WebP格式,Python3.5加入以字節串b’RIFF’開頭並且第9到第12個字節爲b’WEBP’
exrOpenEXR,Python3.5加入以字節串b’\x76\x2f\x31\x01’開頭

模塊內部缺陷

當h參數不爲空時,模塊會忽略掉file參數,直接檢測h參數,但此時file參數又是必須提供的,算是一個設計缺陷吧。博主個人感覺這個h參數根本沒有存在的意義,沒必要放在參數列表裏面。

>>> import imghdr
>>> imghdr.what('test.jpg', b'\x89PNG\r\n\x1a\n')
'png'
>>>

自定義檢測流程

imghdr內部使用了test_jpeg、test_png、test_gif等函數檢測文件的格式。模塊內部維護了一個函數列表imghdr.tests,每次調用what函數的時候,會按列表裏的順序調用檢測函數,當檢測函數返回結果時退出循環。用戶可以通過修改這個列表達到修改檢測流程的目的。同時,也可以自行添加檢測函數到列表裏面。

下面這個例子,博主添加了一個函數放在檢測流程的最後提示文件不是圖片:

>>> import imghdr
>>> def final(h, f):
...  print("This file isn\'t a image!")
...
>>> imghdr.tests.append(final)
>>> imghdr.what("imghdr.md")
This file isn't a image!

自行添加檢測函數需要接收兩個參數h和f,h是用來檢測的字節串,f是file對象。但是在模塊內部自帶的檢測函數都是沒用到這個f參數的…


命令行啓動imghdr模塊

博主讀源碼的時候發現了官方文檔裏面沒提到的兩個函數,提供了直接用命令行啓動imghdr模塊的方法。

只需要調用python -m imghdr [-r] file1 file2...就可以直接檢測文件的類型。file可以是文件也可以是文件夾。該命令默認只檢測文件夾下一層的文件類型,如果需要遞歸檢測,則加上-r參數。

每個文件以”文件名: 文件類型/None”的形式打印一行輸出結果。


總結:可能是因爲使用的人少的原因,imghdr這個模塊內部有挺多小問題,不過只要老老實實按照官方提供的文檔使用是不會出事的。博主後面試着改一下這個模塊然後pr上去。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章