ocr中的densenet網絡訓練或者fine-tune

denseNetTrain

ocr中的densenet網絡訓練

簡介

原項目是:https://github.com/YCG09/chinese_ocr

這個只是提供原項目中的densenet網絡訓練用的。原項目中沒有fine-tune, 同時tensorboard使用時好像有點問題(不過使用tensorboard好像也看不到有用的信息)

環境部署

sh setup.sh # Linux環境用
  • 注:支持window和Ubuntu

1. 數據準備

數據集:https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密碼:lu7m)

  • 共約364萬張圖片,按照99:1劃分成訓練集和驗證集

  • 數據利用中文語料庫(新聞 + 文言文),通過字體、大小、灰度、模糊、透視、拉伸等變化隨機生成

  • 包含漢字、英文字母、數字和標點共5990個字符

  • 每個樣本固定10個字符,字符隨機截取自語料庫中的句子

  • 圖片分辨率統一爲280x32

  • 或者自己生成數據進行訓練,生成數據的工具:https://blog.csdn.net/qq_31112205/article/details/103653176

圖片解壓到相應的位置,注意路徑

2. 訓練

將train.py和fine_tune_train.py中路徑改成自己準備好的數據的位置

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章