本文由人工智能觀察編譯
譯者:Sandy
我們常說,眼睛是心靈之窗。但是,對於谷歌的研究人員來說,眼睛是一個人健康與否的標誌。目前,這個科技巨頭公司正在通過分析人類的視網膜照片,通過深度學習,對人的血壓、年齡以及吸菸情況進行預測。其初步結果顯示,機器可以通過這些信息預測心臟病的發生,從而做出有效的預防措施。
這項研究依賴於卷積神經網絡,這是一種深度學習算法,它改變了生物學家對圖像的分析。科學家們正藉助於這種方法來尋找基因組中的突變,並預測單個細胞的佈局變化。谷歌的方法在去年8月份發表的論文中已有所論述。可以說,這是新型深度學習應用的一部分,而這些應用使圖像處理變得更容易,甚至可以識別出被忽視的生物現象。
“以前,把機器學習應用到生物學的一些領域是不可能的,”加州山景城谷歌研究項目主任Philip Nelson說。“現在不僅僅實現了,更讓人高興的是,還可以看到人類未發現的東西。
卷積神經網絡使計算機能夠高效且全面地處理圖像,而且不需要將圖像分解成多個部分。得益於計算機計算能力與存儲技術的進步,這一方法在2012年左右獲得了初步成功。舉個例子,Facebook利用這類深度學習技術來識別照片中的人臉。
但是科學家們仍努力將這些網絡應用到生物學領域,部分原因在於各個領域之間的文化差異。Daphne Koller,谷歌母公司Alphabet旗下的生物科技公司Calico的首席計算官,表示:“讓一羣聰明的生物學家和一羣同樣聰明的計算機科學家在同一個房間裏活動,他們會用兩種不同的語言及思維方式進行交流。”
科學家還必須確定哪些類型的研究可以通過網絡進行,而這些網絡必須接受大量的圖像訓練才能進行預測。當谷歌希望利用深入的學習來發現基因組中的突變時,科學家們不得不將DNA的字母序列轉換成計算機可以識別的圖像。
然後,他們在DNA 片段上訓練神經網絡,這些片段已與參考基因組對齊,並且其突變已知。最終的結果是DeepVariant(深度變異),這是12月發佈的一個工具,可以發現DNA序列的小變化。至少在測試中,DeepVariant的表現和傳統工具一樣好。
來自西雅圖艾倫研究所的細胞生物學家們,正在使用卷積神經網絡,將光學顯微鏡下捕獲到的細胞的平坦灰色圖像轉換成3D圖像,其中一些細胞的細胞器被標記爲彩色。
這種方法消除了對細胞進行染色的需要——這個過程需要更多的時間以及更復雜的實驗設備,而且還可能會損壞細胞。上個月,該小組公佈了一項先進技術的細節,該技術可以使用一些數據(如細胞的輪廓等)預測更多細胞部分的形態和位置。
美國哈佛-麻省理工博德研究所(Broad Institute of MIT and Harvard)成像平臺主任Anne Carpenter說:
“現在大家看到的是機器學習能夠完成與成像有關的生物學任務,這是前所未有的轉變。”
2015年,她的跨學科團隊開始使用卷積神經網絡處理細胞圖像; 現在, Carpenter表示,神經網絡正在處理其研究中心約15%的圖像數據。在她看來,未來幾年內,這種方法將成爲其研究中心的主要數據處理模式。
有些人一想到用卷積神經網絡分析圖像可能會在無意中揭示一些微妙的生物現象,由此可能會引出一些從未考慮過的問題,就會感到興奮。Nelson說:“科學中最有趣的一句話不是‘找到了!’,而是‘那很奇怪,怎麼回事?’。”
艾倫研究所的執行董事Rick Horwitz表示,這種偶然的發現可以推動疾病研究的發展。他認爲,如果深度學習能夠揭示單個細胞中的癌症徵兆,這會有助於研究人員改進腫瘤分類。反過來,同時,也有可能帶來癌症擴散的新假說。
此外,生物學其他機器學習專家已經將目光投向了其他領域,儘管卷積神經網絡已經應用於圖像處理。“圖像很重要,但化學和分子數據也同樣重要。”
來自德國環境衛生研究中心的計算生物學家Alex Wolf說。Wolf 希望對神經網絡進行調整,以便它能夠用於分析基因表達。他說:“我認爲在未來幾年內,這項技術會有很大突破,進而使得生物學家可以對神經網絡技術有更廣泛的應用。”