“華爲雲杯”2019人工智能創新應用大賽賽後分享

原創

2020-06-21 02:30

“華爲雲杯”2019人工智能創新應用大賽

比賽介紹：“華爲雲杯”2019人工智能創新應用大賽，由西安國家民用航天產業基地管理委員會主辦、華爲公司承辦，以“AI在航天，鴻圖華構”爲主題，是面向全國的人工智能交流賽事。大賽目標是服務以及培養AI人才，構建“用得起、用的好、用得放心”的普惠AI生態，爲AI開發者提供一個交流學習、創新挑戰的平臺。參賽者基於華爲雲人工智能開發平臺ModelArts，根據組委會提供的西安景點、美食、民俗、特產、工藝品等圖像數據，進行圖像分類模型的開發。

比賽結果線上測試97.7 (top 5%),共1775人蔘加

數據介紹：數據總共3731張，其中線上測試數據爲1000張

從圖中可以看數據很少，且類別不均衡
數據擴充，從百度爬取了一萬多張圖片，使用僞標籤法（Pseudo label)來擴充圖片，使用訓練好的模型來預測，閾值選擇爲97，將預測結果大於97的數據加入到訓練數據中

模型選擇
densenet201
efficientnet_b2
efficientnet_b3
efficientnet_b4
…
線上得分節點
densenet201 95.0 densenet201 95.4
efficientnet_b2 96.6 efficientnet_b2 97.6 efficinetnet_b2 97.7
efficientnet_b3 95.6 efficientnet_b3 96.0 efficientnet_b3 97.0
efficientnet_b4 97.5

訓練技巧
數據增強部分：
1.隨機裁剪 randomresizedcrop
2.隨機擦除 random erase
3.mixup
4.水平翻轉
5.歸一化
訓練策略：
學習率使用warmup+CosineAnnealingLR
採用多尺度訓練，分爲三段式，圖像大小依次遞增
優化器： sgd
損失函數：
SmoothCrossEntropyloss+mixup_loss

漲分點：加大圖片分辨率，標籤平滑(能抑制過擬合)，mixup(在數據上進行正則)，隨機擦除，多尺度訓練(增加的模型的泛化能力)，數據清洗（數據是最重要的，一個好的數據集意味着你的起點比別人高很多）

關於其他方向的內容,可以訪問我的個人博客

代碼地址：github

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

“華爲雲杯”2019人工智能創新應用大賽賽後分享

“華爲雲杯”2019人工智能創新應用大賽

代碼地址：github

ValueError: A `Concatenate` layer requires inputs with matching shapes except for the concat axis.

keras fitgenerator OSError: image file is truncated (1 bytes not processed)

keras打印train_loss,val_loss,train_acc,val_acc

conda太慢?，pip(離線)安裝pytorch指定版本

使用ssh和vscode進行遠程調試

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結