每到聖誕節的時候大家都會給自己的頭像戴上一個聖誕帽,這一般會用到PS,但是如果有的人不會PS怎麼辦呢,快來用python一件添加吧!(如果python也不會怎麼辦(+_+)?)
gitee項目地址
1.完整代碼
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
path_person = 'data/person.jpg'
path_hat = 'data/hat.jpg'
# 展示待處理圖片
img1 = mpimg.imread(path_person)
plt.axis('off')
plt.imshow(img1)
plt.show()
# 加載預訓練模型
import paddlehub as hub
model = hub.Module(name="ultra_light_fast_generic_face_detector_1mb_320")
input_dict = {'image': [path_person]}
results = model.face_detection(data=input_dict, visualization=True)
for result in results:
print(result)
# 預測結果展示
img = mpimg.imread("face_detector_320_predict_output/person.jpg")
plt.figure(figsize=(10,10))
plt.imshow(img)
plt.axis('off')
plt.show()
# 取出人臉關鍵點座標
left, right, top, bottom = int(result['data'][0]['left']), int(result['data'][0]['right']),int(result['data'][0]['top']), int(result['data'][0]['bottom'])
import cv2
hat=cv2.imread(path_hat)
# 用cv2.imread()讀到的圖像,是BGR三通道圖像,可以用cvtColor()函數轉換一下
hat_rgb=cv2.cvtColor(hat,cv2.COLOR_BGR2RGB)
plt.imshow(hat_rgb)
plt.show()
# 對帽子進行縮放
hat_h, hat_w, _ = hat.shape
face_w = right - left
factor = 1.5 #用來調整帽子的大小
ratio = face_w/hat_w
resized_hat_h = int(round(hat_h*ratio*factor))
resized_hat_w = int(round(hat_w*ratio*factor))
print(resized_hat_h, resized_hat_w)
resized_hat = cv2.resize(hat,(resized_hat_w,resized_hat_h))
# 讀取人物照片
person = cv2.imread(path_person)
person_rgb=cv2.cvtColor(person,cv2.COLOR_BGR2RGB)
# 對帽子進行二值化,確定掩膜
hat2gray = cv2.cvtColor(resized_hat, cv2.COLOR_BGR2GRAY) # 轉換爲灰度圖像
ret, mask = cv2.threshold(hat2gray, 250, 255, cv2.THRESH_BINARY) # 設置閾值,大於175的置爲255,小於175的置爲0
mask_inv = cv2.bitwise_not(mask)
# 確定帽子放置位置
dw = -50
dh = 10
mid_axis = int((right-left)/2)
roi = person[(top-resized_hat_h+dh):(top+dh), left+dw:left+resized_hat_w+dw]
print(roi.shape)
person_bg = cv2.bitwise_and(roi, roi, mask=mask) #刪除了ROI中的logo區域
hat_fg = cv2.bitwise_and(resized_hat, resized_hat, mask=mask_inv) #刪除了logo中的空白區域
dst = cv2.add(person_bg, hat_fg)
person[(top-resized_hat_h+dh):(top+dh), left+dw:left+resized_hat_w+dw] = dst
person_rgb=cv2.cvtColor(person,cv2.COLOR_BGR2RGB)
plt.imshow(person_rgb)
plt.show()
結果展示:
2.代碼詳解
這裏主要要講的就是PaddleHub的face_detection
函數,它的輸出是一個列表,列表裏只有一個對象,可以用for循環取出來,這個對象打印下來如下所示:
{'data': [{'left': 313.9062805175781, 'right': 547.9287109375, 'top': 496.75042724609375, 'bottom': 801.8109130859375,
'confidence': 0.9980539083480835}], 'path': 'data/person.jpg', 'save_path': 'face_detector_320_predict_output/person.jpg'}
裏面會有四個參數left
,right
,top
,bottom
。如果沒有接觸過圖像處理可能不太清楚它所表示的含義,看下面的圖像可以方便大家理解(圖片來源):
這四個數表示頭像檢測框的位置,瞭解PaddleHub的返回值含義了之後就好辦了,我們可以對聖誕帽進行處理。
聖誕帽處理的思想是:
- 以頭像檢測框的寬爲參照對聖誕帽進行等比例縮放,聖誕帽的寬和人臉檢測框的寬的比例可以自己定義,這裏我定義的是1:1;
- 將聖誕帽放置在人臉檢測框的正上方,這裏用到了掩膜操作,關於掩膜操作的詳細解釋參照我上一篇博客,介紹的非常詳細;
- 由於人臉角度的差異需要對聖誕帽進行細微調整,在確定聖誕帽放置位置時引入了和偏差量;
- 生成最終頭像,完成。
3.總結
- 在進行掩膜操作的時候我用到的是轉化爲灰度圖的方法,這樣做的弊端是聖誕帽有白色的部分,灰度閾值設置不當可能會造成聖誕帽掩膜製作不準確;
- 博客用到的是alpha通道法,該方法利用透明背景的聖誕帽頭像可以很準確的摳出聖誕帽,不用擔心閾值的問題,不過關於alpha通道的使用我當時沒有看懂,感興趣可以前往學習
- 當時由於時間倉促沒有考慮到人臉較高,添加聖誕帽後聖誕帽可能會超出圖像邊界的問題