一種用於黑色素瘤預後的自動腫瘤浸潤淋巴細胞開源算法

介紹

惡性腫瘤的發展和進展需要與腫瘤微環境中的其他細胞(包括免疫細胞)相互作用。由於腫瘤細胞中改變的蛋白的表達,免疫系統能夠識別惡性腫瘤和誘導免疫應答,越來越多的證據表明,評估腫瘤浸潤淋巴細胞(TIL)在許多類型的腫瘤中具有預後意義。

最近的研究表明,在輔助治療的好處,免疫治療5例只有一個。這些研究顯示出明顯的毒性,包括五分之一的甲狀腺功能低下症和一百分之一的死亡,這些觀察結果值得采用預後測試,該測試可以確定哪些患者可以倖免。

傳統上,TILs在標準蘇木和曙紅(H&E)染色部分上的得分爲半定量,即不存在,無輕度或輕度。一些使用包括TIL分佈和密度8的四級分級系統。這些評分方法已經建立了很多年,但由於機構之間缺乏標準化以及對病理醫生之間的可重複性的關注,尚未在臨牀決策中得到廣泛採用。在乳腺癌,國際TIL工作組已經把認真抓好TIL的得分的標準化和出版由病理學家對HE切片的視覺評價做出了指導。儘管TIL指南的魯棒性已在國際環試驗中得到證明,但主觀方法不太可能足夠準確和可重現以用於選擇要從治療中倖免的患者。數字圖像分析(DIA)可能會提供解決此問題的方法。DIA可以促進複雜空間格局的分析,並可以提供嚴格的驗證的標準化指標。經典分割和神經網絡的方法已在各種DIA平臺廣泛應用於克服細胞分類挑戰。DIA平臺能夠評估TIL,但尚未發表任何研究來顯示自動TIL評分在黑色素瘤中的穩健性。因此,我們建立了一種算法(稱爲eTIL%),用於對黑素瘤H&E染色切片上的腫瘤浸潤淋巴細胞(TIL)進行基於圖像的自動評估。

結果

TMA隊列中自動TIL評分的性能交叉驗證後,Xtile中具有統計學意義的最佳閾值爲16.6%(p = 0.01)。

自動化的TIL評分算法顯示,與低eTIL%相比,高eTIL%的患者表現出明顯更好的疾病特異性總體生存率(Log rank p = 0.007;HR =0.420,CI = 0.220-0.802;圖 1a)。TILs評分較高與預後良好相關。相比之下,傳統的病理學家閱讀的TIL視覺評估(修改爲在TMA上評估)未能區分具有不同DSOS的患者隊列(對數秩p = 0.821;HR = 0.871,CI = 0.461–1.646;圖 1b)。)。使用定量熒光方法16也測試了同一隊列的CD4,CD8和CD20表達。這些結果表明,每種淋巴細胞亞型與eTIL%的相關性較弱(圖 1c–e),但是,儘管CD4趨於但未達到顯着水平,但均未預後。我們發現eTIL與CD4和CD8的總和之間存在顯着的相關性和公平相關性(Spearman r = 0.466,p <0.001)。使用隊列2和隊列3的TMA圖像中隊列1中定義的16.6%的切入點,eTIL%將患者分爲預後良好的子集(隊列2:對數等級p <0.001;HR = 0.397,CI = 0.242 –0.651;圖 2a;同類羣組3:對數排名p = 0.002;HR = 0.409,CI = 0.226-0.741;圖 2b)。臨牀病理因素在單因素分析中是預後的(補充表 1)。我們還調查了eTIL%與臨牀病理因素之間的關聯。#1,#2和#3隊列中沒有潰瘍且腫瘤深度較小的患者,eTIL%評分較高。在隊列#4中,eTIL%與任何臨牀病理因素之間未發現明顯關聯。

圖1:隊列1中的腫瘤浸潤淋巴細胞(TIL)得分。隊列#1 中自動TIL評分(a)和病理學家的TIL評分(b)的預後潛力。eTIL%評分與CD4陽性(+),CD8 +和CD20 +免疫細胞之間的相關性,通過定量免疫熒光(c – f)進行測量。

圖2:在三個獨立的隊列中驗證自動腫瘤浸潤淋巴細胞(TIL)算法。在隊列#2,#3和#4中對組織微陣列(TMA幻燈片)(a,b)和整個幻燈片(c,d)進行自動TIL評分的預後潛力。

整個幻燈片隊列中自動TIL評分的性能

在臨牀環境中,必須對整個組織切片進行評估。因此,我們將NN192算法應用於羣組2和羣組4的全幻燈片圖像的每個視場。再次eTIL%高,高於16.6%,在兩個隊列(隊列2:對數等級p <0.001;HR = 0.119,CI = 0.057-0.245,圖 2c)和隊列4中(對數等級p = 0.036;HR = 0.391,CI = 0.157-0.974;圖 2d)。所述ETIL%得分即使在調整了性別,年齡,潰瘍,階段(使用組織收集日期的系統併發),布瑞斯羅夫深度,克拉克水平後仍留在兩個隊列顯著,以及原發腫瘤的位置(表 1)。在eTIL%評分方面,我們發現相應的TMA和WSI病例之間存在顯着差異,並且重複性較低。

表1關於疾病特異性總體生存率的全滑動隊列2和4中eTIL%得分和臨牀病理因素的多元Cox迴歸分析。

討論

儘管早已承認,腫瘤浸潤淋巴細胞可能在黑色素瘤提供預後和預測信息,但還沒有被廣泛用於臨牀黑素瘤管理採取由於機構間的變異。可變性主要參與者包括分析前和分析步驟,也是最顯著,在得分缺乏可重複性的。爲了解決主觀差異的問題,已經發表了一些研究,提出使用卷積網絡對胃癌,乳腺癌,前列腺癌和結腸癌中基於圖像的免疫組化(IHC)染色切片進行TIL量化。但是,在這些研究中,TIL量化依賴於IHC標記(例如CD3和CD8)的檢測,在某些情況下,還取決於它們相對於腫瘤前緣的定位。在我們以前的工作中,我們顯示了CD8檢測的數字圖像分析與轉移性黑色素瘤中的抗PD-1反應相關,但沒有預後。此處,eTIL%的預後價值可能來自一系列淋巴細胞的結合以及通過相鄰黑素細胞數量的標準化而實現的結合。雖然TIL的亞型可能在免疫療法的預測中變得很重要,但也需要圖像分析,但eTIL%和定量CD8的組合可能是尋找可以在佐劑環境中避免進行免疫療法的患者的最佳方法。在我們的研究中,我們發現eTIL與CD4,CD8和CD20表達之間存在顯着的相關性,並且存在弱公平相關性。可能的解釋可能是腫瘤中的免疫異質性,因爲未在連續切片上進行HE和CD4,CD8,CD20 IF染色。另一個可能的解釋是CD4,CD8,在自動定量熒光研究過程中,CD20和CD20(免疫標記)得分的計算方式不同。關於免疫標誌物,以感興趣標誌物陽性細胞的數量相對於其被測量的細胞羣的百分比來計算分數,而eTIL%被定義爲(TILs / TILs +腫瘤細胞)×100。

TIL的檢測可能提供一種經濟高效且可靠的預後標誌物,尤其是在沒有其他分子檢測可用的情況下。在Heindl等人的最新研究中,在ER陽性(+)乳腺癌中研究了自動TIL評分的預後潛力。作者在H&E染色切片上對DIA使用了細胞分割分類方法,他們發現DIA獲得的免疫空間聚類評分與ER +乳腺癌內分泌治療後不良的無復發生存有關。在我們的研究中,我們使用了類似的方法,即無監督的核分割,然後進行基於神經網絡機器學習的細胞分類。基於分段的對象檢測的優勢在於,它需要相對較少的訓練集。在另一方面,分割的靈敏度和分類的準確性受到生物技術的圖像變化,這可能導致過度擬合對於訓練集。因此,我們在三個獨立的人羣中測試了我們算法的性能,這些人羣的診斷時間,組織準備時間以及在TMA和全玻片上進行的H&E染色均不同。我們在所有驗證集中發現了自動TIL評分的重大預後潛力。

這項工作有很多限制。最重要的是,所有隊列均被回顧性收集,包括最早可追溯至1990年代的腫瘤。儘管在免疫治療之前的治療在結局方面大致相同,但如臨牀試驗中所見,沒有一個隊列得到統一治療。另一個限制是,所有病例都是由一家掃描儀製造商進行掃描的,儘管在不同的機構和放大率下也是如此。雖然軟件算法NN192看起來具有同等的性能,但尚不清楚該算法是否會對來自其他掃描儀的圖像具有類似的性能。需要進一步的研究來驗證該算法在更多獨立隊列中的預後潛力,並確定圖像採集的技術要求。即使這是一個開放源代碼的軟件,因此可以廣泛使用,但在佐劑免疫治療人羣或臨牀實踐中使用eTIL%評分之前,必須進行質量控制和系統的性能評估。在我們的研究中,病理學家對這三種算法進行了質量控制,以對檢測到的細胞進行分類。儘管我們在這裏沒有嘗試驗證TMA技術,但是值得注意的是,我們發現TMA和整張幻燈片的eTIL%得分之間只有適度的相關性。這可能是由於這樣一個事實,即平均黑色素瘤整個玻片上分析的腫瘤面積比TMA點大20–25倍。然而,eTIL%是預後的,與對TMA或整張病例的評分無關。

總之,這項研究表明,自動TIL評分是黑色素瘤的可靠,獨立的預後指標。通過驗證,我們相信可以在免疫治療佐劑環境中對該方法進行測試,以定義可能免於接受治療的患者子集及其顯着毒性。

方法

患者隊列和組織準備

我們收集了641個黑色素瘤腫瘤,其中包括四個獨立的隊列,三個來自耶魯紐黑文醫院(YNHH),一個來自哥倫比亞大學歐文醫學中心(CUMC)。

訓練組隊列1由1993年至2005年之間診斷爲227例患者,中位隨訪時間爲44個月。

驗證集隊列2:1999年至2011年之間診斷爲137例患者,中位隨訪時間爲59.9個月;

隊列3:1981年至2010年之間診斷爲201例患者,中位隨訪時間爲79個月;

隊列4:76名來自CUMC的患者,在2000年至2012年之間被診斷,中位隨訪時間爲61.5個月(表 2))。

隊列1、2和3被評估爲組織微陣列(TMA)。病理學家根據H&E染色的載玻片選擇代表性的腫瘤區域。在每種情況下都打出重複的芯子(每個直徑0.6毫米)。在本研究中,對TMA的H&E染色部分進行了掃描以進行分析。對於隊列2和隊列4,對原始H&E幻燈片的每個字段進行了評估,得出平均評估面積爲7.46 mm 2和5.88 mm 2,而TMA點的平均評估面積爲0.28 mm 2。選擇由病理學家選擇的每位患者完整的載玻片進行研究。

表2患者的臨牀病理資料。

數字圖像分析(DIA)

在隊列#1,#2和#3中,使用Aperio ScanScope XT平臺以×20的分辨率對載玻片進行數字化處理,像素大小爲0.4986 µm×0.4986 µm。在第4組中,使用Aperio ScanScope XT平臺以×40的分辨率對載玻片進行數字化處理,像素大小爲0.2500 µm×0.2500 µm。

QuPath開源軟件平臺用於構建自動TIL評分算法。由於H&E染色的日期在各組之間和各組之內都不同,因此我們改進了每個數字化玻片的H&E染色估計(使用QuPath中的“估計染色向量”命令)。

我們使用細胞檢測通過以下設置分割圖像中的細胞:檢測圖像:蘇木精OD;要求的像素大小:0.5 µm;背景半徑:8 µm;過濾器中值半徑:0 µm;sigma:1.5 µm;最小單元面積:10 µm 2;最大單元面積:400 µm 2;閾值:0.1; 最大背景強度:2.細胞切片的質量控制由病理學家進行。爲了將檢測到的細胞分類爲腫瘤細胞,免疫細胞(TIL),基質細胞等(錯誤檢測,背景)(圖 3),我們使用神經網絡32作爲具有八個隱藏層(最大迭代次數:100)。分類中使用的功能在補充表2中進行了描述 。爲了幫助算法進行準確的分類,我們還添加了半徑爲25 µm和50 µm的平滑對象特徵,以補充單個單元格的現有測量值。爲了使訓練集達到最佳結果,需要進行多次輪優化,最終以一種名爲“ NN192”的算法完成,該算法計算機器定義的TIL的百分比,計算方法如下:(TIL / TIL +腫瘤細胞)×100,稱爲“ eTIL% ”。病理學家對分類檢測到的細胞的算法進行質量控制。在全玻片隊列(隊列2和隊列4)中,對整個腫瘤進行了分析,並根據病理學家的標記進行了定義。

黑色素瘤病例樣本的代表性圖片,其中顯示H&E圖像(縮放倍數:×20,a)和數字圖像分析(DIA)蒙版(b)。比例尺代表20 µm。使用NN192算法,分割顯示紅色表示腫瘤細胞,紫色標記免疫細胞,綠色表示基質細胞,黃色表示其他(錯誤的細胞檢測或未知或背景)。由於基質細胞和“其他”細胞很少見,因此包含了大箭頭以顯示示例細胞。

統計分析

論文或源碼數據集下載地址:關注“圖像算法”微信公衆號 回覆“細胞檢測”,爲了進行統計分析,使用了SPSS軟件。使用X-tile軟件確定TIL分數的統計顯着性臨界值,該軟件使用結果信息定義閾值。χ 2值計算人口的每一個可能的分裂和最佳截止(最高χ 2值)進行交叉驗證,以通過使用從訓練集得出的切點分析單獨的驗證集來評估統計顯着性。

執行Log-rank檢驗支持的Kaplan-Meier分析以評估預後潛力,爲了測試獨立的預後潛力,應用了多元Cox迴歸分析。疾病特異性總體生存期(DSOS)定義爲從腫瘤的初次診斷日期到黑素瘤引起的死亡日期之間的經過時間,或患者因非黑素瘤原因死亡或仍然活着而最後被檢查的時間。Mann-Whitney檢驗用於調查TIL評分與臨牀病理因素之間的關聯。爲了測試相應的TMA和有關TIL的全幻燈片案例之間的可重複性,散點圖和Wilcoxon符號秩檢驗支持類內相關性。在所有統計分析中,顯着性水平設置爲p <0.05。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章