第96天：圖像庫 PIL（一）

by 閒歡

Python 提供了 PIL（python image library）圖像庫，來滿足開發者處理圖像的功能，該庫提供了廣泛的文件格式支持，包括常見的 JPEG、PNG、GIF 等，它提供了圖像創建、圖像顯示、圖像處理等功能。

基本概念

要學習 PIL 圖像庫的使用，我們必須先來了解一些關於圖像的基本概念，包括深度（depth），通道（bands），模式（mode），座標系統（coordinate system）等。

圖像的深度

圖像中像素點佔得 bit 位數，就是圖像的深度，比如：

二值圖像：圖像的像素點不是0就是1 （圖像不是黑色就是白色），圖像像素點佔的位數就是1位，圖像的深度就是1，也稱作位圖。

灰度圖像：圖像的像素點位於0-255之間（0代表全黑，255代表全白，在0-255之間插入了255個等級的灰度）。2^8=255，圖像像素點佔的位數就是8位，圖像的深度是8。

依次類推，我們把計算機中存儲單個像素點所用的 bit 位稱爲圖像的深度。

圖像的通道

每張圖像都是有一個或者多個數據通道構成的，如 RGB 是基本的三原色（紅色、綠色和藍色），如果我們用8位代表一種顏色，那麼每種顏色的最大值是255，這樣，每個像素點的顏色值範圍就是（0-255, 0-255, 0-255）。這樣的圖像的通道就是3。而灰度圖像的通道數是1。

圖像的模式

圖像實際上是像素數據的矩形圖，圖像的模式定義了圖像中像素的類型和深度，每種類型代表不同的深度，在 PIL 中我們稱之爲圖像的模式。常見的模式有以下幾種：

1：1位像素，表示黑和白，佔8 bit ，在圖像表示中稱爲位圖。

L：表示黑白之間的灰度，佔8 bit 像素。

P：8位像素，使用調色版映射。

RGB：真彩色，佔用 3x8 位像素，其中 R 爲紅色，G 爲綠色，B爲藍色，三原色疊加形成的色彩變化，如三通道都爲0則代表黑色，都爲255則代表白色。

RGBA：爲帶透明蒙版的真彩色，其中的 A 爲 alpha 透明度，佔用 4x8 位像素

其他的還有 CMYK、 YCbCr、I、F等不常用的模式，這裏就不多做介紹了。

圖像的座標系

PIL 中圖像的座標是從左上角開始，向右下角延伸，以二元組（x，y）的形式傳遞，x 軸從左到右，y 軸從上到下，即左上角的座標爲 (0, 0)。那麼矩形用四元組表示就行，例如一個450 x 450 像素的矩形圖像可以表示爲 (0, 0, 450, 450)。

PIL 的安裝

和其他庫一樣，PIL 的安裝也很簡單：

pip3 install pillow

PIL 圖像模塊的功能

打開圖像

我們可以從本地目錄中打開文件，也可以從文件流中打開圖像。打開文件的方法爲：

Image.open(file,mode)

讀取圖像文件，mode 只能是 ‘r’，所以我們也可以省略這個參數。

from PIL import Image
from io import BytesIO
import requests

# 打開圖像文件
im = Image.open('cat.jpg')

# 從文件流中打開圖像
r = requests.get('http://f.hiphotos.baidu.com/image/pic/item/b151f8198618367aa7f3cc7424738bd4b31ce525.jpg')
im2 = Image.open(BytesIO(r.content))

# 展示圖像
im.show()
im2.show()

# 翻轉90度展示
im.rotate(90).show()

我們首先打開本目錄下的 cat.jpg 圖像，接着從百度圖片請求到一張圖片，使用文件流的方式打開。使用 show 方法可以展示圖像。我們也可以使用 rotate 方法來是圖像翻轉角度。運行程序，我們會看到彈出三張圖片，一張是 cat.jpg 對應的圖像，一張是百度圖片中的圖像，還有一種是將 cat.jpg 翻轉90度後展示的圖像。

創建圖像

Image.new(mode,size,color)

我們可以使用給定的模式、大小和顏色來創建新圖像。大小以（寬度，高度）的二元組形式給出，單位爲像素；顏色以單波段圖像的單個值和多波段圖像的元組（每個波段的一個值）給出，可以使用顏色名如 ‘red’ ，也可以受用16進制 '#FF0000' 或者使用數字表示（255,0,0）。

from PIL import Image

im = Image.new('RGB', (450, 450), (255, 0, 0))
im1 = Image.new('RGB', (450, 450), 'red')
im2 = Image.new('RGB', (450, 450), '#FF0000')
im.show()
im1.show()
im2.show()

上面例子中我們分別通過三種形式創建了 RGB 模式的大小爲 450x450 ，顏色爲紅色的圖像，最終的圖像效果是一樣的。

轉換格式

Image.save(file)

我們直接使用保存方法，修改保存的文件名就可以轉換圖像的格式。

from PIL import Image

# 加載 cat.jpg
im = Image.open('cat.jpg', 'r')

# 打印圖片類型
print(im.format)

# 保存爲 png 類型圖片
im.save('cat.png')

# 加載新保存的 png 類型圖片
im2 = Image.open('cat.png', 'r')

# 打印新保存圖片類型
print(im2.format)


# 輸出結果
JPEG
PNG

例子中我們先打開 cat.jpg 圖像，然後新保存一張類型爲 png 的圖像，通過打印我們可以看到兩者的格式。

創建縮略圖

Image.thumbnail(size, resample=3)

修改當前圖像製作成縮略圖，該縮略圖尺寸不大於給定的尺寸。這個方法會計算一個合適的縮略圖尺寸，使其符合當前圖像的寬高比，調用方法 draft() 配置文件讀取器，最後改變圖像的尺寸。

size 參數表示給定的最終縮略圖大小。

resample 參數是過濾器，只能是 NEAREST、BILINEAR、BICUBIC 或者 ANTIALIAS 之一。如果省略該變量，則默認爲 NEAREST。

注意：在當前PIL的版本中，濾波器 BILINEAR 和 BICUBIC 不能很好地適應縮略圖產生。用戶應該使用ANTIALIAS，圖像質量最好。如果處理速度比圖像質量更重要，可以選用其他濾波器。這個方法在原圖上進行修改。

from PIL import Image

# 加載圖像
im = Image.open('cat.png')

# 展示圖像
im.show()

# 圖像尺寸
size = 128, 128
# 縮放圖像
im.thumbnail(size, Image.ANTIALIAS)

# 展示圖像
im.show()

我們將一個 450x450 大小的圖像縮放成了 128x128 大小的圖像，程序運行的結果如下圖：

融合圖像

Image.blend(image1, image2, alpha)

將圖像 image1 和圖像 im2 根據 alpha 值進行融合，公式爲：

out = image1 * (1.0 - alpha) + image2 * alpha

image1 和 image2 表示兩個大小和模式相同的圖像， alpha 是介於 0 和 1 之間的值。如果 alpha 爲0，返回 image1 圖像，如果 alpha 爲1，返回 image2 圖像。

from PIL import Image

# 藍色圖像
image1 = Image.new('RGB', (128, 128), (0, 0, 255))
# 紅色圖像
image2=Image.new('RGB', (128, 128), (255, 0, 0))
# 取中間值
im = Image.blend(image1, image2, 0.5)
image1.show()
image2.show()
# 顯示紫色圖像
im.show()

我們將一張藍色圖像和一張紅色圖像進行融合，融合度爲兩張圖像各0.5，最終得到一張紫色圖像（因爲紅色疊加藍色會調和成紫色）。顯示圖像如下圖：

像素點處理

Image.eval(image, *args)

根據傳入的函數對圖像每個像素點進行處理。第一個參數 image 爲需要處理的圖像對象，第二個參數是函數對象，有一個整數作爲參數。

如果變量image所代表圖像有多個通道，那麼函數作用於每一個通道。注意：函數對每個像素點只處理一次，所以不能使用隨機組件和其他生成器。

from PIL import Image

im = Image.open('cat.jpg')
im.show()

# 將每個像素值翻倍（相當於亮度翻倍）
evl1 = Image.eval(im, lambda x: x*2)
evl1.show()

# 將每個像素值減半（相當於亮度減半）
evl2 = Image.eval(im, lambda x: x/2)
evl2.show()

我們分別對圖像進行像素值翻倍和減半處理，顯示效果如下圖：

合成圖像

Image.composite(image1, image2, mask)

使用給定的兩張圖像及 mask 圖像作爲透明度，創建出一張新的圖像。變量 mask 圖像的模式可以爲“1”，“L” 或者 “RGBA”。所有圖像必須有相同的尺寸。

from PIL import Image

# 打開 cat.png
image1 = Image.open('cat.png')

# 打開 flower.jpg
image2 = Image.open('flower.jpg')

# 分離image1的通道
r, g, b = image1.split()

# 合成圖像，獲得 cat + flower
im = Image.composite(image1, image2, mask=b)

image1.show()
image2.show()
im.show()

上面例子中我們將一張圖像貓（cat.png）和一張圖像花（flower.jpg），以圖像貓的一個通道構成的蒙版進行合成，就像 PS 一樣，我們最終得到貓+花的圖像，結果如下圖所示：

通過單通道創建圖像

Image.merge(mode,bands)

將一組單通道圖像合併成多通道圖像。參數 mode 爲輸出圖像的模式，bands 爲輸出圖像中每個通道的序列。

from PIL import Image

im = Image.open('cat.png')
# 將三個通道分開
im_split = im.split()

# 分別顯示三個單通道圖像
im_split[0].show()
im_split[1].show()
im_split[2].show()

# 將三個通道再次合併
im2 = Image.merge('RGB', im_split)
im2.show()

# 打開第二張圖像
im3 = Image.open('flower.jpg')
# 將第二張圖像的三個通道分開
im_split2 = im3.split()

# 將第二張圖像的第1個通道和第一張圖像的第2、3通道合成一張圖像
rgbs = [im_split2[0], im_split[1], im_split[2]]
im4 = Image.merge('RGB', rgbs)
im4.show()

上面例子中，我們先將 cat.jpg 圖像的三個通道分離成三張圖像，效果如下圖：

然後我們又將 flower.jpg 圖像的三個通道分離，最後分別取 flower.jpg 的 R 通道圖像和 cat.jpg 的 G 和 B 通道圖像合成一張新圖像，最終的效果如下圖：

總結

本節爲大家介紹了 Python pillow 庫中圖像有關的幾個基本概念，以及 PIL 模塊中處理圖像的幾個常見功能。掌握了這些功能後，我們可以打開、創建圖像，也可以對圖像做一些常見的如拆分、合成、融合等操作，這些都是圖像處理的基礎，需要大家好好理解和掌握。

文中示例代碼：python-100-days

參考資料

https://www.osgeo.cn/pillow/reference/

關注公衆號：python技術，回覆"python"一起學習交流

第96天：圖像庫 PIL（一）

基本概念

圖像的深度

圖像的通道

圖像的模式

圖像的座標系

PIL 的安裝

PIL 圖像模塊的功能

打開圖像

創建圖像

轉換格式

創建縮略圖

融合圖像

像素點處理

合成圖像

通過單通道創建圖像

總結

參考資料

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

權威數據庫市場排名出爐，騰訊爆出王炸！

崩潰的一天，西安一碼通崩潰背後的技術問題。

Tooool-程序員一站式導航網站來了

aiXcoder3.0呼之欲出，代碼補全 AI，帶你進入「個性化智能編程時代」

阿里雲盤正式上架，速度15MB/s！（附下載鏈接+邀請碼）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結