在使用Keras搭建驗證碼識別模型時,需要大量的驗證碼圖片。在這裏,使用captcha模塊生成驗證碼圖片,驗證碼圖片名稱爲驗證碼上顯示的字符串。
1 生成單張驗證碼圖片並顯示
生成一張驗證碼的代碼如下:
from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np
import random
import string
#characters爲驗證碼上的字符集,10個數字加26個大寫英文字母
#0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ str類型
characters=string.digits+string.ascii_uppercase
width,height,n_len,n_class=170,80,4,len(characters)
#設置驗證碼圖片的寬度widht和高度height
#除此之外還可以設置字體fonts和字體大小font_sizes
generator=ImageCaptcha(width=width,height=height)
#生成隨機的4個字符的字符串
random_str=''.join([random.choice(characters) for j in range(4)])
#生成驗證碼
img=generator.generate_image(random_str)
#顯示驗證碼圖片和驗證碼標題
plt.imshow(img)
plt.title(random_str)
plt.show()
程序運行結果爲:
2 驗證碼圖片的顯示與保存
上面代碼中生成的驗證碼是PIL圖像格式,因此也可以直接使用PIL自帶的show方法顯示圖片,save方法保存圖片
如下:
#顯示驗證碼
img.show()
#保存驗證碼
file_name=random_str+'.jpg'
img.save(file_name)
3 批量生成驗證碼樣本集
當我們在深度學習中,進行驗證碼進行字符識別,需要大量的圖片,因此我們可以批量生成大量的樣本。這裏以生成一萬張樣本爲例。
代碼如下:
from captcha.image import ImageCaptcha
import matplotlib.pyplot as plt
import numpy as np
import random
import string
from PIL import Image
#characters爲驗證碼上的字符集,10個數字加26個大寫英文字母
#0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ str類型
characters=string.digits+string.ascii_uppercase
width,height,n_len,n_class=170,80,4,len(characters)
#生成一萬張驗證碼
for i in range(10000):
generator=ImageCaptcha(width=width,height=height)
random_str=''.join([random.choice(characters) for j in range(4)])
img=generator.generate_image(random_str)
#將圖片保存在目錄yzm文件夾下
file_name='./yzm/'+random_str+'_'+str(i)+'.jpg'
img.save(file_name)
當程序執行完,會在文件夾yzm下生成一萬張驗證碼圖片