新藥研發(fā)是關系著人類生命健康的事業(yè),是一項艱巨且風險極高的工作,需要多學科之間的相互合作。近日,人工智能平臺公司商湯科技SenseTime公布了以原創(chuàng)AI技術賦能新藥研發(fā)和精準醫(yī)學的多項最新重磅研究成果。此次商湯進軍AI新藥研發(fā),其主要的應用場景有哪些?在這個方向,商湯又有怎樣的發(fā)展優(yōu)勢?對此,商湯科技副總裁、研究院副院長張少霆接受了媒體專訪。
△商湯科技副總裁、商湯科技研究院副院長張少霆
問:我們看到商湯智慧健康團隊在上周發(fā)布了以AI助力藥物研發(fā)及精準醫(yī)學多個環(huán)節(jié)的研究進展,能否簡單概括下商湯此次四項研究的主要內容,以及在藥物研發(fā)流程中的應用場景?
答:此次針對新藥研發(fā)及精準醫(yī)學的多項最新重磅研究成果標志著商湯智慧健康希望通過沉淀多年的原創(chuàng)AI技術能力,全面深入發(fā)掘化合物、蛋白、細胞系和臨床大數據中的潛在規(guī)律。相關研究進展涉及蛋白質相互作用、癌癥藥物反應、基于病理圖像的基因突變預測、和藥物重定向等四個方向。
從應用場景的角度來看,此次研究覆蓋了從藥物發(fā)現、臨床前研究、臨床試驗、新藥上市后等多個藥物研發(fā)環(huán)節(jié),目標是通過AI加速新藥研究和上市流程,縮短新藥研發(fā)周期、降低藥品研發(fā)成本、提高新藥研發(fā)成功率。目前,相關的研究成果已經在《自然精準腫瘤學》(Nature Precision Oncology)、《生物信息學》(Bioinformatics)、和國際人工智能聯合會議(IJCAI)等國際頂尖期刊及會議上發(fā)表。
問:在此之前,商湯智慧健康的主要方向是圍繞醫(yī)學影像人工智能分析領域,現在也開拓了AI+藥物研發(fā)的方向。目前整體來看,商湯智慧健康業(yè)務布局是怎樣的?
答:首先,商湯作為全球領先的人工智能平臺公司,在很多基礎AI技術方面,尤其是計算機視覺方向有著深厚的原創(chuàng)技術積累。因此,為了充分發(fā)揮技術優(yōu)勢,商湯智慧健康業(yè)務很自然地以醫(yī)療影像AI產品為起點,并于2018年發(fā)布了SenseCare?智慧診療平臺,目標是打造一個“全棧式”的醫(yī)療影像智能分析平臺。目前,該平臺已經覆蓋了包括心臟、肝臟、肺部、頭頸在內的人體10余個重點部位和器官,能夠為影像科、病理科、肝外科等臨床方向提供覆蓋診斷、治療、康復完整工作流的AI智能應用,助力提高醫(yī)生的診療效率和精度。
在平臺落地的過程中,我們不僅與上海瑞金醫(yī)院、四川華西醫(yī)院、浙江邵逸夫醫(yī)院等頂尖醫(yī)院建立合作,同時還發(fā)現基層地區(qū)醫(yī)療資源相對跟不上的問題。所以商湯也正在推行“醫(yī)療新基建”的落地,通過區(qū)域級云化服務的形式,將頭部醫(yī)院的經驗通過AI學習和轉化,沉淀到腰部或基層的醫(yī)療機構,實現醫(yī)療遠程化、智能化,推動醫(yī)聯體和分級診療的落地進程。其中,在去年舉行的中華醫(yī)學會第27次全國放射學學術大會商湯論壇上,浙江邵逸夫醫(yī)院放射科主任胡紅杰教授提到,“AI技術的應用不僅為醫(yī)生減少了機械性工作量,更重要的是能夠對關鍵指征進行準確提示,降低漏診、誤診的風險,加速醫(yī)生在肝臟疾病上的閱片經驗積累?!?/p>
與此同時,在醫(yī)療影像智能分析產品的落地過程中,我們會不斷發(fā)現客戶的一些延伸需求,比如通過病理圖像延伸到基因數據的分析,從基因又延伸到藥物分析相關的需求,甚至有時候是多模態(tài)數據分析的需求,場景就從臨床醫(yī)學逐漸延伸到基礎醫(yī)學。同時團隊擁有的很多基礎算法能力,比如計算機視覺、自然語言處理、知識圖譜、數據挖掘等,在這個“跨界“的過程中又可以通用,比如卷積神經網絡算法既可以用在醫(yī)療影像的分析上,又可以適配到基因數據的分析上。自然而然,就逐漸發(fā)展形成了商湯智慧健康臨床醫(yī)學影像分析、大數據分析、藥物研發(fā)三位一體的業(yè)務布局。其實早在2018年,我們就已經開始了基因相關的分析業(yè)務。這些方向互相依賴、互相聯動,可以說商湯智慧健康團隊內部形成了一個自主創(chuàng)新的良性循環(huán)業(yè)務微生態(tài)。
△圖片來自視覺中國
問:AI+藥物研發(fā)和AI+醫(yī)學影像,最大的不同點是什么?
答:不同點主要有兩個方面:
從應用層面來看,AI+醫(yī)學影像的主要研究目的,是幫助在日常工作中通過使用醫(yī)學影像進行診療的醫(yī)生提升工作效率或者精度,解決他們能做卻費力、或者需要對較低年資醫(yī)生進行培訓的問題,比如AI輔助診療能夠幫助醫(yī)生進行肺部CT的診斷、或者輔助肝臟外科醫(yī)生進行基于CT的三維術前規(guī)劃。然而,在藥物研發(fā)領域,AI要解決的問題更具前瞻性,多是行業(yè)目前還不能解決的問題或是還未被發(fā)現的前沿領域,例如AI輔助新靶點的定位、蛋白與藥物的全新相互作用關系的發(fā)現等等。在這類場景下,AI要解決的是在茫茫未知銀河中人類相對沒有經驗的問題,因而研發(fā)的未知性和潛力也更大。
從技術層面來看,醫(yī)學影像相對而言數據模態(tài)比較簡單,不管是X-ray、CT、MRI還是病理,都是分析二維或三維的圖像數據,用的大多是行業(yè)內比較成熟的卷積神經網絡來訓練。然而,對于藥物研發(fā)而言,數據復雜度會大幅上升,研究的是分子、蛋白、藥物等多種對象,以及對象與對象間的相互連接關系,是一個復雜的網狀結構。在這樣的背景下,我們多采用的是圖神經網絡,這個技術以往較多用在分析社交網絡的復雜海量數據。對于圖神經網絡這個技術分支,我們做了很多創(chuàng)新嘗試,比如在針對臨床前蛋白藥物關系的研究中,我們將藥物分子的各個原子看作節(jié)點,將藥物分子視為一個圖,運用圖神經網絡進行微觀層次的建模;針對老藥新用的問題上,我們又把分子、蛋白、疾病看成不同的節(jié)點,通過進行宏觀網絡建模,研究相互間的復雜關系。
問:商湯智慧健康在AI+藥物研發(fā)這個新方向上有什么優(yōu)勢?
答:商湯的優(yōu)勢在于“更快、更高、更強”。
更快,體現在算力、算法和平臺三者的有效聯接。藥物、基因等生物組學的數據規(guī)模非常大,對于計算資源要求極高,如何加速對海量大數據的計算和建模,能夠直接影響AI+藥物研發(fā)的效率。商湯前瞻性打造的新型人工智能基礎設施——SenseCore商湯AI大裝置,能夠打通算力、算法和平臺,大幅降低人工智能生產要素價格,實現高效率、低成本、規(guī)?;腁I創(chuàng)新和落地。商湯AI大裝置算力層以商湯智算中心為基礎,該中心是目前亞洲最大的人工智能算力中心,總算力可達3,740 Petaflops(1 Petaflop等于每秒1千萬億次浮點運算),1天內可處理時長23,600年的視頻,能夠提供強大的算力基礎,支撐對海量數據和算法模型的分析、訓練和推理。
更高,體現在算法能力上。商湯有著業(yè)界頂尖的原創(chuàng)算法能力,在過去六年中,商湯科技共發(fā)表440多篇關于深度學習和計算機視覺的研究論文,排名全球第一,領先微軟,谷歌,Facebook,及其他科技公司、領先的研究型大學,而這其中的很多基礎算法是通用的,可以應用在藥物AI研究。此外,在全球知名知識產權媒體IPRDaily公布的2020全球智慧醫(yī)療-AI醫(yī)學影像輔助診斷發(fā)明專利排行榜中,商湯也以536件公開專利申請數量位居全球第五,其中也包含多項基因分析、藥物研發(fā)相關的專利。具體到研究過程,例如我們在做一個AI基因分析項目時,需要處理的患者全基因組數據包含的位點達30億個,每個位點一般會測幾十次,所以單個患者的數據可能就會達到100G之多,傳統方法的計算時間長達十個小時。在商湯超高性能的算力基礎之上,我們也通過原創(chuàng)的算法將計算時間縮短到十幾分鐘,將計算效率提升超過27倍,極大的提升了建模、數據處理的效率,從而可以快速推動藥物研發(fā)務進展。
更強,體現在商湯智慧健康的復合型人才上。團隊除了有一眾AI頂尖研發(fā)人員之外,也有諸多生物+AI交叉背景的人才,包括生物學博士、藥學+AI博士的復合型人才、以及曾就職于斯坦福大學生物醫(yī)學信息實驗室的資深科學家。這樣的團隊有著擁抱變化、不斷學習的能力,使得我們在每進行一個新項目時都能夠快速獲取domain knowledge(領域知識),從而保證對于復雜場景下問題的清晰梳理和技術創(chuàng)新。
問:商湯智慧健康在AI+藥物研發(fā)的過程中遇到過哪些挑戰(zhàn)?是如何克服的?
答:商湯在AI+藥物研發(fā)中遇到的挑戰(zhàn)非常多樣。首先,最大的困難還是領域知識的獲取。藥物研發(fā)領域的細分方向非常的龐雜,覆蓋分子、蛋白、藥物等等,每個方向的AI研究都有著獨特的需求和背景知識,所以需要我們的研發(fā)人員與客戶和領域專家保持密切的溝通合作,將領域知識和需求轉化為可以用AI解決的技術思路。
其次,是數據稀缺和AI模型泛化性的問題。相對于醫(yī)學影像數據,藥物研發(fā)領域因為細分程度更高,針對某個長尾問題的數據更加稀缺。再延伸一步,也會涉及到如何將基于有數據的問題A訓練的模型應用推廣到問題B上,例如如何基于已知分子的binding affinity(鍵合力)預測未知分子,這其中可能面臨分子結構高度相似但是生物活性完全不同的情況。這就對于如何基于少量數據,訓練出高性能且具有高度泛化性的模型提出了較大挑戰(zhàn)。在實際落地合作中,我們也遇到了類似情況,比如商湯在和某藥企合作關于某特定靶標的抑制劑AI篩選時發(fā)現,沒有任何一個公開大型數據庫包含該類靶標的數據,甚至類似的蛋白質也非常少,這對算法訓練來說是個很大的困難。不過,我們就這個問題進行針對性開發(fā)的模型所得出的預測結果,與最終的實驗室驗證結果保持了高度一致性,這也再次驗證了商湯的算法能力。
問:商湯智慧健康在AI+藥物研發(fā)這個方向的落地情況如何?未來的計劃如何?
答:其實商湯智慧健康從2018年就已經開始了相關準備和布局,目前商湯也已經和國內外多家新藥研發(fā)公司、知名藥企和基因公司開展了商業(yè)合作,在藥物靶標相互作用、用藥推薦、用藥風險分析、基因自動分析與報告生成等諸多方向利用AI技術賦能業(yè)務合作伙伴。未來,我們希望能拓展與更多上下游企業(yè)、研究機構以及高校的合作,用AI加速上游研發(fā)領域的前瞻探索、同時賦能下游生產環(huán)節(jié)的效率,為藥物研究、精準醫(yī)療領域帶來更多的智慧賦能。
文章來源于網絡,所有權歸原作者所有,大道家園只作為存儲空間,如有侵權請聯系我們進行刪除。
本文地址:http://www.soujuw.cn/guoxue/128707.html.
聲明: 我們致力于保護作者版權,注重分享,被刊用文章因無法核實真實出處,未能及時與作者取得聯系,或有版權異議的,請聯系管理員,我們會立即處理,本站部分文字與圖片資源來自于網絡,轉載是出于傳遞更多信息之目的,若有來源標注錯誤或侵犯了您的合法權益,請立即通知我們(管理員郵箱:602607956@qq.com),情況屬實,我們會第一時間予以刪除,并同時向您表示歉意,謝謝!