目錄
1:INTRODUCTION
食管癌:食管癌是常見的消化道腫瘤,全世界每年約有30萬人死於食管癌。其發病率和死亡率各國差異很大。我國是世界上食管癌高發地區之一,每年平均病死約15萬人。男多於女,發病年齡多在40歲以上。同時,不同分期的術後存活率相差很大。初期術後五年存活率爲80%,而晚期術後五年存活率僅爲5-8%。同時不同分期的食管癌的治療方案也不同,因此對食管癌分期進行準確的預測至關重要。相對於傳統手術對腫瘤進行分期,使用影想進行分期時廉價的、無痛的,今天介紹一種使用發射組學與機器學習結合的方式對食管癌術前分期的方法。
2:MATERIALS
數據來源:廣東省人民醫院以及廣東省醫學科學院在2008到2016年就診的食管癌患者,一共有211例患者參與到這項研究中,其中有57例患者被排除,也就是這57位患者不滿足試驗要求。其中27人的臨牀資料不完整,其中有2人病理診斷爲非食管癌,3人不能確定等級,還有25人術前沒有進行Ct掃描。
下表是臨牀病理信息的統計表。
P-value值是推斷統計中的一項重要內容,是用於判斷原始假設是否正確的重要證據。其中計算p值的方式,當數值是連續的時候,比如:年齡、腫瘤體積我們用Mann-Whitney U test,當數值是離散的我們使用Chi-square test進行計算p-值。當p值小於0.05我們認爲該屬性具有統計學意義。R-socre是建立所選特徵的線性組合的預測函數。
3:METHODS
3.1:預處理
由於不同型號的機器拍出來的CT影像其中影像的強度是不同的,即使是相同的機器在不同時間由於溼度、溫度的影響,影像的質量也會不同,所以我們在提取特徵之前需要消除這些影響。我們對感興趣區域(ROI)進行歸一化處理,將圖像的灰度值歸一化到(μ–3σ, μ+3σ) 這個範圍內。其中μ代表:灰度的平均值。σ代表灰度的標準差。第二步,我們將圖像的像素的每一個比特值量化到灰度範圍內。
Range我們選擇8,16,32,64。I是原始roi的強度,那個符號是rio像素點的集合。
3.2:特徵提取
A圖是原始的Ct圖像,B圖是手工分割之後的CT圖像,C是提取的特徵圖。
提取到的特徵包括:
3.3特徵選擇
使用matlab進行特徵提取可以得到9790維特徵,我們使用intraclass correlation coefficient(ICC)進行計算特徵間的相關性係數,篩選出係數大於0.9的特徵,一共包括6140維特徵,再對6140維特徵進行進行計算相關性,篩選出218個特徵。最好使用lasso特徵選擇方法進行特徵選擇,選擇10個最重要的特徵。
4.RESULTS
根據選擇的特徵進行分類,並計算每個特徵的權重一次來計算Rad-score的值。根據值的不同對食管癌進行等級分類。如圖,當值0.054就是本實驗的一個分界線。
本實驗計算的Rad-score的公式:
Rad-score=0.218+0.252×Max_3D_diam
–0.02×Skewness+0.078×dmey_1_Inv_var –0.06×rbio1.1_1_IDMN –0.088×db10_2_GLN+0.062×bior5.5_2_HGZE+0.152×rbio1.1_5_LRHGLE
+0.1×rbio1.3_5_Busyness+ 0.15×rbio2.2_5_LRHGLE +0.39×rbio3.1_5_IMC1
表二是文章的對比試驗的統計表
NRI是淨重新分類改善指數。分類模型不僅可以用AUC進行評估,還可以使用NRI對模型準確性進行評估比較。同時有的時候AUC可能不能夠方便或直觀,此時NRI的價值就凸顯出來了。兩外當兩個模型的AUC沒有統計學差異的時候,此時NRI卻可以校驗出統計學差異。新、舊模型對於研究人羣的分類變化,就會發現有一部分研究對象,原本在舊模型中被錯分,但在新模型中得到了糾正,分入了正確的分組,同樣也有一部分研究對象,原本在舊模型中分類正確,但在新模型中卻被錯分,因此研究對象的分類在新、舊模型中會發生一定的變化,我們利用這種重新分類的現象,來計算淨重新分類指數NRI。
NRI = (靈敏度new + 特異度new)-(靈敏度old + 特異度old)
5:CONCLUSIONS
Therefore, as a noninvasive and quantitative method, radiomics approach has the potential to guide individua-lized treatment decisions by preoperative staging.
放射組學和機器學習能夠有效的對食管癌進行術前等級分類。
6:DISSCUSIONS