“華爲雲杯”2019人工智能創新應用大賽賽後分享

“華爲雲杯”2019人工智能創新應用大賽

鏈接:官網

比賽介紹:“華爲雲杯”2019人工智能創新應用大賽,由西安國家民用航天產業基地管理委員會主辦、華爲公司承辦,以“AI在航天,鴻圖華構”爲主題,是面向全國的人工智能交流賽事。大賽目標是服務以及培養AI人才,構建“用得起、用的好、用得放心”的普惠AI生態,爲AI開發者提供一個交流學習、創新挑戰的平臺。參賽者基於華爲雲人工智能開發平臺ModelArts,根據組委會提供的西安景點、美食、民俗、特產、工藝品等圖像數據,進行圖像分類模型的開發。

比賽結果 線上測試97.7 (top 5%),共1775人蔘加

數據介紹:數據總共3731張,其中線上測試數據爲1000張
在這裏插入圖片描述
從圖中可以看數據很少,且類別不均衡
數據擴充,從百度爬取了一萬多張圖片,使用僞標籤法(Pseudo label)來擴充圖片,使用訓練好的模型來預測,閾值選擇爲97,將預測結果大於97的數據加入到訓練數據中

模型選擇
densenet201
efficientnet_b2
efficientnet_b3
efficientnet_b4

線上得分節點
densenet201 95.0 densenet201 95.4
efficientnet_b2 96.6 efficientnet_b2 97.6 efficinetnet_b2 97.7
efficientnet_b3 95.6 efficientnet_b3 96.0 efficientnet_b3 97.0
efficientnet_b4 97.5

訓練技巧
數據增強部分:
1.隨機裁剪 randomresizedcrop
2.隨機擦除 random erase
3.mixup
4.水平翻轉
5.歸一化
訓練策略:
學習率使用warmup+CosineAnnealingLR
採用多尺度訓練,分爲三段式,圖像大小依次遞增
優化器: sgd
損失函數:
SmoothCrossEntropyloss+mixup_loss

漲分點:加大圖片分辨率,標籤平滑(能抑制過擬合),mixup(在數據上進行正則),隨機擦除,多尺度訓練(增加的模型的泛化能力),數據清洗(數據是最重要的,一個好的數據集意味着你的起點比別人高很多)

關於其他方向的內容,可以訪問我的個人博客

代碼地址:github

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章