原创 【AI實戰】手把手教你深度學習文字識別(文字檢測篇:基於MSER, CTPN, SegLink, EAST等方法)

文字檢測是文字識別過程中的一個非常重要的環節,文字檢測的主要目標是將圖片中的文字區域位置檢測出來,以便於進行後面的文字識別,只有找到了文本所在區域,才能對其內容進行識別。 文字檢測的場景主要分爲兩種,一種是簡單場景,另一種是複雜場景。其

原创 【AI實戰】深度學習基礎環境搭建(Ubuntu + anaconda + tensorflow + GPU + PyCharm)

爲方便日常的深度學習模型開發與測試,本人在自己筆記本上搭建一個深度學習的基礎環境,便於學習AI使用。本人使用的筆記本配置是CPU爲8代i5,顯卡爲GTX1060,內存爲8G,基本上可滿足日常的AI研究與學習。下面將介紹基礎環境的搭建配置

原创 大話文本檢測經典模型:SegLink

在自然場景中,例如燈箱廣告牌、產品包裝盒、商標等,要檢測出其中的文字會面臨着各種複雜的情況,例如角度傾斜、變形等情況,這時就需要使用基於深度學習的方法進行文字檢測。在之前的文章中,介紹了基於卷積神經網絡和循環神經網絡的CTPN文本檢測方

原创 大話文本檢測經典模型:EAST

自然場景的文本檢測是當前深度學習的重要應用,在之前的文章中已經介紹了基於深度學習的文本檢測模型CTPN、SegLink(見文章:大話文本檢測經典模型CTPN、大話文本檢測經典模型SegLink)。典型的文本檢測模型一般是會分多個階段(m

原创 【AI實戰】手把手教你實現文字識別模型(入門篇:驗證碼識別)

文字識別在現實生活中有着非常重要的應用,主要由文字檢測、內容識別兩個關鍵步驟組成,在本博客之前的文章中已介紹了文字檢測、內容識別的經典模型原理(見文章:大話文本檢測經典模型:CTPN , 大話文本識別經典模型:CRNN),本文主要從實戰

原创 大話文本檢測經典模型:CTPN

文字識別是AI的一項重要應用,例如將包裝盒上的文字識別出來、將產品說明書上的文字識別出來、將大街上廣告牌的文字識別出來等等,在現實生活中能給我們帶來很大的便利,有着非常廣泛的應用。 一個簡單的文字識別流程如下: Step 1. 通過手

原创 大話文本識別經典模型:CRNN

在前一篇文章中(詳見本博客文章:大話文本檢測經典模型 CTPN),介紹了文字識別在現實生活中的廣泛應用,以及文字識別的簡單流程: 其中“文本檢測”、“文本識別”是其中兩個關鍵環節,“文本檢測”已經在前一篇文章中介紹了詳細的介紹,本文主

原创 【AI實戰】手把手教你訓練自己的目標檢測模型(SSD篇)

目標檢測是AI的一項重要應用,通過目標檢測模型能在圖像中把人、動物、汽車、飛機等目標物體檢測出來,甚至還能將物體的輪廓描繪出來,就像下面這張圖,是不是很酷炫呢,嘿嘿 在動手訓練自己的目標檢測模型之前,建議先了解一下目標檢測模型的原理(見

原创 27種深度學習的主流神經網絡

深度學習發展迅速,每天都會冒出不少新的神經網絡架構,像卷積神經網絡(CNN)、循環神經網絡(RNN)、長短時記憶網絡(LSTM)等等。對於從事AI的專業人士而言,要全面追蹤、瞭解這些新的架構非常費力。 ASIMOV Institute繪製

原创 【AI實戰】訓練第一個AI模型:MNIST手寫數字識別模型

在上篇文章中,我們已經把AI的基礎環境搭建好了(見文章:Ubuntu + conda + tensorflow + GPU + pycharm搭建AI基礎環境),接下來將基於tensorflow訓練第一個AI模型:MNIST手寫數字識別

原创 【AI實戰】快速掌握TensorFlow(四):損失函數

在前面的文章中,我們已經學習了TensorFlow激勵函數的操作使用方法(見文章:快速掌握TensorFlow(三)),今天我們將繼續學習TensorFlow。 本文主要是學習掌握TensorFlow的損失函數。 一、什麼是損失函數 損

原创 【AI實戰】快速掌握TensorFlow(二):計算圖、會話 原

在前面的文章中,我們已經完成了AI基礎環境的搭建(見文章:Ubuntu + Anaconda + TensorFlow + GPU + PyCharm搭建AI基礎環境),以及初步瞭解了TensorFlow的特點和基本操作(見文章:快速掌

原创 【AI實戰】動手訓練自己的目標檢測模型(YOLO篇)

在前面的文章中,已經介紹了基於SSD使用自己的數據訓練目標檢測模型(見文章:手把手教你訓練自己的目標檢測模型),本文將基於另一個目標檢測模型YOLO,介紹如何使用自己的數據進行訓練。   YOLO(You only look once)

原创 【AI實戰】動手實現人臉識別程序

人臉識別在現實生活中有非常廣泛的應用,例如iPhone X的識別人臉解鎖屏幕、人臉識別考勤機、人臉識別開門禁、刷臉坐高鐵,還有識別人臉虛擬化妝、美顏,甚至支付寶還推出了刷臉支付、建設銀行還實現了刷臉取錢……,可見人臉識別的用處非常廣。 

原创 【乾貨整理】CNN(卷積神經網絡)進化史

卷積神經網絡(CNN)近年來取得了長足的發展,是深度學習中的一顆耀眼明珠。CNN不僅能用來對圖像進行分類,還在圖像分割(目標檢測)任務中有着廣泛的應用。CNN已經成爲了圖像分類的黃金標準,一直在不斷的發展和改進。 劉昕博士總結了CNN