以雲戰“疫”,這次阿里雲又讓人們驚了……

近日,阿里雲對外宣佈其容器服務調度GPU雲服務器啓動加速計算,最快只需60秒即可完成新冠病毒的核酸對比工作;同時將向醫療科研機構、疾控中心等一線病毒研究機構免費開放基因計算服務,技術可大幅提升宏基因組測序、疫苗研發相關的處理效率。

基於此,晶少專程採訪了阿里雲基因計算服務AGS負責人、高級技術專家李鵬,集中呈現針對GPU和容器技術大幅提升核酸比對速度的有關細節以及關於阿里雲基因計算服務(AGS)的諸多信息。

據晶少了解,本次阿里雲基因計算服務AGS病毒比對能力-mNGS宏基因組比對從設計、研發、驗證到最終上線只用了短短20幾天,但李鵬所在團隊卻每天肩負着艱苦卓絕的工作。很關鍵的一個出發點在於,除了提供針對新冠肺炎病毒中mNGS宏基因組測序數據的快速比對能力之外,更重要的是讓研究機構更專注業務創新,而不是數據本身的重複處理工作,這其中就涉及到了生物類型計算解決方案所具有的鮮明特殊性。

晶少:生物計算解決方案有一定的特殊性,相比其他類型的技術解決方案有何不同?

阿里雲基因計算服務AGS負責人、高級技術專家李鵬:不同於常規的計算,基因計算對海量數據計算和存儲能力有很高的要求,主要通過容器計算的自動伸縮特性和阿里雲ECS自動伸縮能力的打通,這才能讓AGS具備大規模調度雲上計算資源的能力。具體來說通過特定算法對基因數據進行合理切分後,可實現大規模的並行計算以及處理TB級別的樣本數據。

過去的基因計算服務以集羣化,混合雲,彈性爲主的AGS工作流服務。但在走過的兩年時間裏,阿里雲提供了基於容器混合雲的基因計算方案,整體技術是混合雲架構下的雲原生容器,達成雲上雲下資源一體,跨地域集羣統一管理。2020年,在以往技術沉澱基礎上,阿里雲升級了AGS的能力,用公共雲API化服務做到即開即用、用完即走,以這次的病毒檢測爲例,在提供了自定義病毒庫靈活性的基礎上又使得調用的無服務化,一次調用即能產出比對的最終數據結果並返給用戶。

實時熒光定量PCR(RT-PCR)和病原宏基因測序(mNGS)是最早用於確診新冠病毒感染的方法。由於兩項技術各有優劣,聯合使用方能實現互補。

RT-PCR是目前新冠病毒的核酸檢測主流方法,成本較低,操作簡便。現已有衆多新冠病毒RT-PCR試劑盒可選,但由於病毒濃度和試劑盒質量問題,其結果出現假陰性較高,導致醫生和患者往往需要重複多次檢測和長時間等待檢測結果。

mNGS的技術優勢可通過一次檢測便能排查所有已知的病原體,有效避免重複採樣的麻煩操作,以及多次檢測篩查所需大量樣本難以實現的問題。當病毒經過數代傳播,還會產生變異,mNGS也是較爲有效的追蹤方案,配合病毒庫可精準確定病毒的代際關係,甚至找到病毒源發地。基於mNGS基因序列比對的分析方式,一旦病原體的基因組已知,通過更新數據庫,就可實現高效準確檢測出相似病毒的功能,同時對新型病毒以外的其他病原及混合感染進行綜合鑑定。但mNGS的缺點是成本較高,需要測序儀和專業的生信分析,並且操作複雜、檢測時間相對較長,因此無法實現大範圍推廣和快速診斷。

如今通過使用阿里雲容器服務,科研人員只需在阿里雲上通過命令行AGS rna-mapping API 啓動比對過程,隨即阿里雲容器服務調度GPU雲服務器啓動加速計算,60秒內即可得到高質量匹配reads的數據和初步質量報告,爲多種病原體檢測和進一步的新冠病毒蛋白質研究及變異研究提供快速準確的數據支撐。

基於此我們發現,本次阿里雲方面提供的雲服務與以往顯著不同,“全套”思想貫穿其中,也就是說所使用的機構不再需要購買額外計算資源,更不用關心如何搭建集羣以及考慮算法和網絡等諸多問題,只需將數據放入對象存儲中並上傳,等待授權完成後即可調用雲服務來處理數據,產出結果並生成有關報告,“既開即用、用完即走”的特質表現突出。

另外AGS在處理測序儀下機數據的比對、排序、變異檢測等環節擁有目前雲上最快的加速比,可以達到普通CPU處理速度的百倍,同時又保持了BWA/GATK等主流金標準軟件的精度和召回率,大幅度降低了計算的成本,性價比十分可觀,也足見其技術探索的功底深厚,但究竟是何種機緣促成了容器技術與基因計算間的火花迸發?

晶少:何時何種契機開始針對容器技術加速基因計算做有關探索的?這種API調用更多意味着什麼?

阿里雲基因計算服務AGS負責人、高級技術專家李鵬:我們觀察到,容器技術一方面在數據分拆、質量控制、Call 變異提供了標準化流程化、加速、彈性、鑑權、觀測、度量等能力;另一方面,高價值挖掘需要藉助容器化的機器學習平臺和並行框架完成大規模線性代數計算建立模型,實現精準醫療。過去的兩年中,AGS一直在行業裏通過集羣化、混合雲,彈性爲主的AGS工作流服務方式幫助大型的基因測序企業完成當日處理100TB以上的數據的,1年數十PB數據的處理任務,成果顯著。

而這種API化的嘗試確實能夠有效幫助用戶擺脫集羣的複雜性,資源創建和維護的代價,以極少的存儲成本就可以完成任意數量的按需計算需求,成本支出只需要按照處理的數據量和計算量來支付, 實現真正的無服務化和Pay as you go。

有消息表明,阿里雲其實早在疫情嚴峻階段就宣佈向新冠疫苗研發科研機構免費提供一切AI算力,目前已收到了包括浙江大學醫學院、GHDDI全球健康藥物研發中心、清華大學醫學院、北京大學醫學院等國內外數十家權威科研機構的申請,第一批申請的算力資源已部署上線、不斷爲疫苗研發提速加碼,但箇中情況具體如何呢?

晶少:目前對外申請算力部署的整體情況如何?效果怎樣?後續的服務支持有哪些具體方面?未來在助力疫苗藥品研製方向有何規劃?

阿里雲基因計算服務AGS負責人、高級技術專家李鵬:目前AGS已經開通了國內的多個地區的服務,特別是北京、深圳、杭州等都有大型基因公司開始生產使用;另外國外的多個地區也開通了服務,例如法蘭克福等疫情重災區也可以訪問到AGS服務。

晶少:新冠狀病毒疫情發生後,爲了幫助抗攻擊疫情,阿里雲免費向全球公共科研機構提供高性能計算、SCC 超級計算集羣和 CPU/GPU 機器、雲超算及 AI 等技術,包括助力在E-HPC雲超算上進行藥物研發等,這與AGS關係如何?AGS在阿里雲技術的對外輸出中佔據了何種位置或者扮演了怎樣的角色?

阿里雲基因計算服務AGS負責人、高級技術專家李鵬:AGS主要定位於公有云的開箱即用的Serverless服務,提供給各個生態夥伴,例如基因公司、研究機構、學校等PaaS服務,是可以被集成在各種雲端SaaS應用中來實現效率的百倍提升和成本的大幅縮減。當然E-HPC也是阿里雲中很有優勢的產品線,主要面向科研機構做高分子分析等高性能計算,當然科研機構、疾控中心可以同時使用AGS和E-HPC來形成科研項目互補,並不衝突。

採訪接近尾聲,可以想見的一點,未來AGS基因計算會繼續朝着Serverless與按量付費、按需彈性的持續被集成的路線發展,有幸提供各種人類基因組、動植物以及病毒等基因的加速處理雲服務。總體來看隨着測序成本、計算成本以及分析成本的持續下降,人們有理由相信基因測序和精準醫療在不遠的將來將進入到普通人的常規健康服務列表中,人類對自身基因認知的深入必然推動壽命提升以及戰勝各種疾病的可能,雲計算服務AGS會推動國內乃至世界範圍內普惠精準醫療早日到來。

戰疫之下,究竟還有哪些黑科技亟待被髮掘?我們更多隻需拭目以待!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章