Nat Commun | 基于化學微擾轉錄組自監(jiān)督表征學習的藥物篩選

文章來源:上海藥物研究所  |  發(fā)布時間:2024-07-01  |  【打印】 【關閉

  

2024年6月25日,中國科學院上海藥物研究所鄭明月課題組在Nature Communications期刊發(fā)表題為“Deep representation learning of chemical-induced transcriptional profile for phenotype-based drug discovery”的研究論文。該研究提出基于自監(jiān)督表征學習的深度生成模型TranSiGen,學習化學微擾轉錄組表征用于藥物表型篩選。

基于表型的篩選是藥物研發(fā)中的重要方法之一,側重于化合物的更全面的細胞響應,提供對疾病機制更全面的理解,并有可能發(fā)現(xiàn)新的藥物作用機制和治療機會。高通量RNA測序技術促進了大規(guī)模微擾轉錄組的產(chǎn)生。雖然化學微擾轉錄組能夠提供對藥物作用機制更全面的理解,化合物和細胞系組合的復雜性限制了通過高通量實驗進行徹底的探索。已有研究者利用大量公共數(shù)據(jù)構建深度學習模型用于預測微擾轉錄組,然而轉錄組數(shù)據(jù)中固有的高噪聲往往掩蓋了真正的擾動信號,使得現(xiàn)有模型難以從中提取有意義的信息。

圖1.TranSiGen架構和下游應用

在該項研究中,研究團隊提出基于變分自編碼器的TranSiGen模型,利用自監(jiān)督表征學習進行轉錄譜的去噪和重建,并且用于推斷新的微擾轉錄譜(圖1)。TranSiGen同時學習三個分布,包括沒有擾動的本底譜、化學微擾轉錄譜以及它們之間的映射關系。這種自監(jiān)督方法有效地減少了數(shù)據(jù)中的噪聲,并揭示了潛在的擾動信號。廣泛的評估表明,TranSiGen在推斷本底譜、化學微擾轉錄譜以及相應的差異基因表達(DEGs)方面優(yōu)于現(xiàn)有模型。作為一種統(tǒng)一的表型信息表征方式,TranSiGen推斷的差異基因表達可以有效地捕獲細胞和化合物的特征。

圖2.基于表型的藥物重定向

此外,TranSiGen表征在各種下游任務中展現(xiàn)出了有效性,包括基于配體的虛擬篩選、藥物響應預測和基于表型的藥物重定向。利用TranSiGen進行抗胰腺癌活性化合物虛擬篩選(圖2),體外實驗驗證結果展現(xiàn)出高命中率,這一結果顯示了TranSiGen在藥物篩選方面的潛力。

本研究引入深度生成模型TranSiGen,旨在通過自監(jiān)督表征學習克服轉錄譜中固有噪聲和混雜因素的局限,提供了一種標準化方法來表征與細胞環(huán)境和化合物效應相關的表型信息。TranSiGen表征在各種下游任務中證實了其有效性,并在基于表型的藥物重定向及體外驗證中展現(xiàn)了其在現(xiàn)實世界藥物發(fā)現(xiàn)場景中的前景。

上海藥物所博士童筱雛為論文的第一作者。上海藥物所藥物發(fā)現(xiàn)與設計中心(DDDC)鄭明月研究員、李敘潼副研究員與張素林副研究員為論文通訊作者。本研究得到了國家自然科學基金、國家重點研發(fā)計劃、上海藥物所與上海中醫(yī)藥大學中醫(yī)藥創(chuàng)新團隊聯(lián)合研究項目、中國科學院青年創(chuàng)新促進會會員項目以及上海市科技重大專項資助。感謝國家蛋白質科學研究(上海)設施規(guī)?;鞍踪|制備系統(tǒng)工作人員提供的技術支持和幫助。

全文鏈接:https://doi.org/10.1038/s41467-024-49620-3