使用PaddleHub給頭像添加聖誕帽

每到聖誕節的時候大家都會給自己的頭像戴上一個聖誕帽,這一般會用到PS,但是如果有的人不會PS怎麼辦呢,快來用python一件添加吧!(如果python也不會怎麼辦(+_+)?)
gitee項目地址

1.完整代碼

import matplotlib.pyplot as plt 
import matplotlib.image as mpimg

path_person = 'data/person.jpg'
path_hat = 'data/hat.jpg'

# 展示待處理圖片
img1 = mpimg.imread(path_person)
plt.axis('off') 
plt.imshow(img1)
plt.show()

# 加載預訓練模型
import paddlehub as hub
model = hub.Module(name="ultra_light_fast_generic_face_detector_1mb_320")

input_dict = {'image': [path_person]}

results = model.face_detection(data=input_dict, visualization=True)
for result in results:
    print(result)

# 預測結果展示
img = mpimg.imread("face_detector_320_predict_output/person.jpg")
plt.figure(figsize=(10,10))
plt.imshow(img) 
plt.axis('off') 
plt.show()

# 取出人臉關鍵點座標
left, right, top, bottom = int(result['data'][0]['left']), int(result['data'][0]['right']),int(result['data'][0]['top']), int(result['data'][0]['bottom'])

import cv2
hat=cv2.imread(path_hat)
# 用cv2.imread()讀到的圖像,是BGR三通道圖像,可以用cvtColor()函數轉換一下
hat_rgb=cv2.cvtColor(hat,cv2.COLOR_BGR2RGB)
plt.imshow(hat_rgb)
plt.show()

# 對帽子進行縮放
hat_h, hat_w, _ = hat.shape
face_w = right - left

factor = 1.5 #用來調整帽子的大小
ratio = face_w/hat_w
resized_hat_h = int(round(hat_h*ratio*factor))
resized_hat_w = int(round(hat_w*ratio*factor))
print(resized_hat_h, resized_hat_w)
resized_hat = cv2.resize(hat,(resized_hat_w,resized_hat_h))

# 讀取人物照片
person = cv2.imread(path_person)
person_rgb=cv2.cvtColor(person,cv2.COLOR_BGR2RGB)

# 對帽子進行二值化,確定掩膜
hat2gray = cv2.cvtColor(resized_hat, cv2.COLOR_BGR2GRAY)  # 轉換爲灰度圖像
ret, mask = cv2.threshold(hat2gray, 250, 255, cv2.THRESH_BINARY)  # 設置閾值,大於175的置爲255,小於175的置爲0
mask_inv = cv2.bitwise_not(mask)

# 確定帽子放置位置
dw = -50
dh = 10
mid_axis = int((right-left)/2)
roi = person[(top-resized_hat_h+dh):(top+dh), left+dw:left+resized_hat_w+dw]
print(roi.shape)
person_bg = cv2.bitwise_and(roi, roi, mask=mask)  #刪除了ROI中的logo區域
hat_fg = cv2.bitwise_and(resized_hat, resized_hat, mask=mask_inv) #刪除了logo中的空白區域

dst = cv2.add(person_bg, hat_fg)
person[(top-resized_hat_h+dh):(top+dh), left+dw:left+resized_hat_w+dw] = dst
person_rgb=cv2.cvtColor(person,cv2.COLOR_BGR2RGB)
plt.imshow(person_rgb)
plt.show()

結果展示:
運行結果

2.代碼詳解

這裏主要要講的就是PaddleHub的face_detection函數,它的輸出是一個列表,列表裏只有一個對象,可以用for循環取出來,這個對象打印下來如下所示:

{'data': [{'left': 313.9062805175781, 'right': 547.9287109375, 'top': 496.75042724609375, 'bottom': 801.8109130859375,
 'confidence': 0.9980539083480835}], 'path': 'data/person.jpg', 'save_path': 'face_detector_320_predict_output/person.jpg'}

裏面會有四個參數leftrighttopbottom。如果沒有接觸過圖像處理可能不太清楚它所表示的含義,看下面的圖像可以方便大家理解(圖片來源):
在這裏插入圖片描述
在這裏插入圖片描述
這四個數表示頭像檢測框的位置,瞭解PaddleHub的返回值含義了之後就好辦了,我們可以對聖誕帽進行處理。

聖誕帽處理的思想是:

  • 以頭像檢測框的寬爲參照對聖誕帽進行等比例縮放,聖誕帽的寬和人臉檢測框的寬的比例可以自己定義,這裏我定義的是1:1;
  • 將聖誕帽放置在人臉檢測框的正上方,這裏用到了掩膜操作,關於掩膜操作的詳細解釋參照我上一篇博客,介紹的非常詳細;
  • 由於人臉角度的差異需要對聖誕帽進行細微調整,在確定聖誕帽放置位置時引入了dwdwdhdh偏差量;
  • 生成最終頭像,完成。

3.總結

  • 在進行掩膜操作的時候我用到的是轉化爲灰度圖的方法,這樣做的弊端是聖誕帽有白色的部分,灰度閾值設置不當可能會造成聖誕帽掩膜製作不準確;
  • 博客用到的是alpha通道法,該方法利用透明背景的聖誕帽頭像可以很準確的摳出聖誕帽,不用擔心閾值的問題,不過關於alpha通道的使用我當時沒有看懂,感興趣可以前往學習
  • 當時由於時間倉促沒有考慮到人臉較高,添加聖誕帽後聖誕帽可能會超出圖像邊界的問題
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章