【含17w樣本】搜狗驗證碼識別

原創

2020-06-23 07:10

搜狗的驗證碼挺有趣的，干擾給滿分，今天不做方案，只做分享

【核心】重中之重：

樣本下載地址：[https://bbs.nightteam.cn/thread-149.htm](https://bbs.nightteam.cn/thread-149.htm)

一共17W樣本，性能再差的網絡也能識別的很好了

訓練並沒有什麼注意事項，但是印象中這個驗證碼發生過一次改動，尺寸修改，那麼如何應對這種變化而不用二次訓練呢？這纔是今天的主題

【提升模型的泛化能力——適應尺寸變化】

我們的樣本尺寸是單一的，通過觀察，我們得知，如果通過裁剪修改圖片比例容易丟失重要內容的像素，那麼我們可以反其道通過填充模擬：
下面列舉幾個方案：

方案一：

可以通過複製【紅色區域】向上延展圖片內容。——四個方向同理

方案二：
圖片拼接：怎麼說呢，我們可以手動篩選出部分字符，做一個圖像生成器，旋轉放大扭曲等等之後拼接於首位或末尾

方案三：
生成一部分尺寸不一，字體相近的驗證碼按一定的權重和樣本混合訓練

訓練流程

可以參見：
https://blog.csdn.net/kerlomz/article/details/86706542

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【源碼】某度貼吧驗證碼識別

【某度貼吧】驗證碼識別首先採集使用了【自研簡易驗證碼爬蟲框架】一般的驗證碼獲取流程分爲三大步驟前置請求, 獲取驗證碼相關參數驗證碼請求, 獲取驗證碼校驗請求, 通過官網判定驗證碼是否正確通過繼承 Project 類

2020-07-07 17:43:47

Java驗證碼實現-EasyCaptcha

驗證碼EasyCaptcha介紹 EasyCaptcha是一個Java圖形驗證碼庫，支持gif、中文、算術等類型，可用於Java Web、JavaSE等項目。使用 <dependency> <groupId>com.gi

不会就学吧

2020-07-07 16:19:56

Struts2Mvc驗證碼

在struts2中驗證碼無法在action中生成，只能通過servlet來生成。 1、創建驗證碼servlet import java.awt.Color; import java.awt.Font; import java.awt.Gr

麦田的一米阳光

2020-07-06 17:17:36

練習010

第 0010 題：使用 Python 生成類似於下圖中的字母驗證碼圖片 # -*- coding: utf-8 -*- from PIL import Image, ImageDraw, ImageFont, ImageFil

2020-07-06 00:34:10

登錄之手機快捷登錄（ActiveMQ+阿里大於）

ActiveMQ 簡介 ActiveMQ 是 Apache 旗下產品，是一款優秀的消息中間件。主要解決應用耦合，異步消息，流量削鋒等問題，實現高性能，高可用。你可以把 ActiveMQ 想象成一個大的容器，首先生產者把消息發送到

2020-07-05 22:58:21

iOS 手機短信驗證碼等待時間

標註：Object-C 語言需要實現的效果思路：紅色的是一個UIButton 灰色的是一個UILabel ，注意 button 和 label 的座標要一樣當點擊button的時候 label出

2020-07-05 21:41:17

利用kaptcha實現驗證碼(SpringMVC實現)

1.首先需要導入jar包 2.配置spring的配置文件applicationContext.xml  <bean id="captchaProducer" class="co

2020-07-05 02:22:03

創建隨機驗證碼

<pre name="code" class="java">package image; import java.awt.BasicStroke; import java.awt.Color; import java.awt.Font

2020-07-04 14:01:17

JavaWeb驗證碼

效果 JSP代碼 <div class="inputbox"> <label for="mima">驗證碼：</label> <input id="confirm" type="text" name="confir

2020-07-04 01:31:50

php繪圖技術製作驗證碼

checkcode.php 核心頁面 <?php session_start(); $checkcode=""; for($i=1;$i<=4;$i++){ $checkcode.=dechex(rand(1,15)); }

2020-07-03 09:06:59

DEV-Club 那樣的彩色校驗碼

要讀懂這些代碼主要是要了解ASP中操作二進制數據的對象ADODB.Stream！本程序主要用的就是Adodb.Stream，如果你有這個基礎，就可以進一步添加更多的功能如加入雜點，漸變底色，數字行列錯位，筆畫短點，提高被ocr識別的不可能

2020-07-03 03:53:54

突破目標網站的反爬蟲機制：Selenium策略分析

在當今信息爆炸的互聯網時代，獲取數據變得越來越重要，而網絡爬蟲成爲了一種常見的數據獲取工具。然而，隨着各大網站加強反爬蟲技術，爬蟲程序面臨着越來越多的挑戰。本文將以爬取百度搜索結果爲例，介紹如何使用Selenium結合一系列策略來突破目標

2024-05-16 00:10:51

自定義安全性高的驗證機制

由於科技手段的發達，圖片內容識別已經很先進，傳統的數字+字符驗證碼你在像客戶端展示的時候太迷糊了導致用戶體驗度差，用戶看不清換來換去消耗服務器性能，太明顯了跟沒設驗證碼的意義不大，因爲總有競爭者，別有用心者來搗亂，總會有智能識別驗

2020-07-06 22:45:47

tensorflow實戰之驗證碼識別

1.代碼: from captcha.image import ImageCaptcha import matplotlib.pyplot as plt from PIL import Image import random im

2020-07-03 15:38:34

基於attention機制實現 CRNN OCR文字識別

定義網絡結構實現 BahdanauAttention，其中socre的實現方法爲 perceptron 形式 class BahdanauAttention(tf.keras.Model): def __init__(sel

2020-07-08 12:23:28

24小時熱門文章

最新文章

最新評論文章