醫療AI落地利器:騰訊優圖開源業界首個3D醫療影像大數據預訓練模型

image

近日,騰訊優圖首個醫療AI深度學習預訓練模型MedicalNet正式對外開源。這也是全球第一個提供多種3D醫療影像專用預訓練模型的項目,將爲全球醫療AI發展提供基礎。

許多研究表明,深度學習的發展非常依賴數據量。自然圖像領域中存在着許多海量數據集,如ImageNet,MSCOCO。基於這些數據集產生的預訓練模型推動了分類、檢測、分割等應用的進步。不同於自然圖像,醫療影像大部分都是3D結構形態的,同時,由於數據獲取和標註難度大,數據量稀少,目前尚未存在海量數據集及對應的預訓練模型。

MedicalNet 是騰訊優圖首個專爲3D醫療影像在深度學習應用上所開發的一系列預訓練模型,爲任何3D醫療影像AI應用起到“打地基”的作用,加快模型收斂,減輕模型對數據量的依賴,MedicalNet具備以下特性:

  1. MedicalNet提供的預訓練網絡可遷移到任何3D醫療影像的AI應用中,包括但不限於分割、檢測、分類等任務;

  2. 尤其適用小數據醫療影像AI場景,能加快網絡收斂,提升網絡性能;

  3. 通過簡單配置少量接口參數值,即可進行微調訓練;

  4. 項目提供多卡訓練以及測試評估代碼,接口豐富,擴展性強;

  5. 提供不同深度3D ResNet預訓練模型,可供不同數據量級應用使用。

爲了產生3D醫療影像的預訓練模型,MedicalNet聚集多個來自不同3D醫療領域的語義分割小規模數據集,並提出了基於多分支解碼器的多域聯合訓練模型來解決數據集中的標註缺失問題。我們的預訓練模型可以遷移到任何3D醫療影像應用的深度學習模型中。整個系統的工作流程如下圖所示:

image

我們將MedicalNet模型遷移到預訓練時未接觸過的Visceral和LIDC數據集中,完成全新的肺部分割和肺結節分類任務,並與目前常用的從零訓練(train from scratch)以及Kinetics視頻3D預訓練模型在性能以及收斂速度上做了比較。在肺部分割應用上,相比於Train from Scratch,MedicalNet在Dice上有16%到33%幅度的提升,相比於Kinetics有4%到7%幅度的提升。在肺結節良惡性分類應用上,相比於Train from Scratch,MedicalNet有6%到23%幅度的預測正確率(Acc)提升,相比於Kinetics有7%到20%幅度的提升。

在收斂速度上,實驗證明,無論是在肺分割任務還是肺結節分類任務上,MedicalNet均能爲模型提供一個較低的初始化損失值,明顯加快損失下降速度,下圖爲MedicalNet性能的一個簡單示例,展示了在全器官分割應用中,不同預訓練方式在一定訓練迭代次數下的測試結果。可以看出,基於我們的預訓練模型(MedicalNet)的結果最接近標籤(ground truth),且遠優於從零訓練(train from scratch)的結果,更多細節請參考論文[footnoteRef:1]。

image

隨着人工智能的火熱化,醫療影像AI也成爲了當前各應用領域中最熱門的版塊。區別於其他人工智能應用,人工智能在醫療領域的應用門檻最高,最大的原因在於標註數據的匱乏。醫療影像數據的獲取通常需要經歷重重關卡,同時,由於領域的專一性,數據通常需要資深醫師標註,而每個3D數據的標註耗時耗力。在當前緊張的醫護資源下,醫療影像數據的獲取戰線將非常漫長,大大阻礙了應用落地的進程。再者,標註數據量相當有限,大部分醫療部門都需要面臨數據量稀少和深度學習之間的鴻溝

專有領域專有模型,MedicalNet相當於爲各個3D醫療影像應用準備了具備臨牀通用知識的數據庫。即使在小數據量中,該數據庫的有效特徵也能幫助落地應用取得較好的醫療檢測性能,這大大減輕醫療影像AI應用對數據量的依賴,進而實現落地需求並加快落地速度

騰訊優圖表示,MedicalNet是騰訊在醫療AI領域的首個開源項目,後續將繼續提供更多類型的模型,爲全球醫療AI的基礎建設助力。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章