營(yíng)養(yǎng)與健康所生物醫(yī)學(xué)大數(shù)據(jù)中心合作發(fā)布合成生物學(xué)元件與數(shù)據(jù)庫(kù)

文章來(lái)源:上海營(yíng)養(yǎng)與健康研究所  |  發(fā)布時(shí)間:2024-10-11  |  【打印】 【關(guān)閉

  

10月3日,國(guó)際學(xué)術(shù)期刊Nucleic Acids Research在線發(fā)表了中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心張國(guó)慶研究員與中國(guó)科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心周志華研究組的合作論文“RDBSB: a database for catalytic bioparts with experimental evidence”。該研究構(gòu)建了首個(gè)面向合成生物學(xué)設(shè)計(jì)的催化元件數(shù)據(jù)庫(kù)RDBSB,提供了83,193個(gè)具有實(shí)驗(yàn)證據(jù)的催化元件在線查詢平臺(tái)(https://www.biosino.org/rdbsb),同時(shí)還提供了PathFinder工具,可以根據(jù)底物和目標(biāo)產(chǎn)物設(shè)計(jì)相應(yīng)的合成途徑,并能完整復(fù)現(xiàn)例如晚期肝細(xì)胞癌的治療藥物淫羊藿素和棉鈴蟲(chóng)性信息素的人工合成途徑設(shè)計(jì)過(guò)程。

催化元件是設(shè)計(jì)、構(gòu)建和優(yōu)化特定代謝途徑乃至生命系統(tǒng)的基礎(chǔ),一個(gè)可靠的、經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的催化元件數(shù)據(jù)庫(kù)對(duì)于設(shè)計(jì)和優(yōu)化這些生命系統(tǒng)至關(guān)重要。而現(xiàn)有的生物元件庫(kù)缺乏底盤(pán)、催化反應(yīng)最佳pH和溫度等對(duì)合成過(guò)程至關(guān)重要的信息。為了填補(bǔ)這一空白,研究團(tuán)隊(duì)從各種數(shù)據(jù)庫(kù)整合了總計(jì)390,708個(gè)催化元件,通過(guò)審編后得到了83,193個(gè)有實(shí)驗(yàn)驗(yàn)證的催化元件,包含大量的轉(zhuǎn)移酶、水解酶和氧化還原酶(圖1A)。其中,3200個(gè)催化元件包括最適催化反應(yīng)溫度(20°C至40°C)、最適pH值(6-9)等關(guān)鍵信息(圖1B)。這些催化元件大部分來(lái)源于細(xì)菌、后生動(dòng)物和植物(圖1C)。

基于此,研究團(tuán)隊(duì)設(shè)計(jì)并構(gòu)建了合成生物學(xué)元件和數(shù)據(jù)庫(kù)(以下簡(jiǎn)稱RDBSB),在線提供系統(tǒng)審編的定性和定量催化信息,包括元件的活性、底物、催化反應(yīng)最佳pH值和溫度以及底盤(pán)特異性等關(guān)鍵參數(shù)。平臺(tái)還提供了包括MapView、AlphaFold、PVQD和PathFinder等在內(nèi)的豐富的在線元件和途徑設(shè)計(jì)工具。通過(guò)RDBSB,用戶不僅可以在線搜索并查閱催化元件詳細(xì)的定性和定量信息及其對(duì)應(yīng)的參考文獻(xiàn),還可以提交新的催化元件,促進(jìn)數(shù)據(jù)的快速共享與利用。截至目前,RDBSB已為一千多個(gè)催化元件共享提供了支撐。該數(shù)據(jù)庫(kù)將極大豐富合成生物學(xué)途徑設(shè)計(jì)的可用資源,為研究人員提供必要的工具。

中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所生物醫(yī)學(xué)大數(shù)據(jù)中心高級(jí)工程師劉婉、博士研究生莊心昊、中國(guó)科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心副研究員王平平為論文共同第一作者。中國(guó)科學(xué)院上海營(yíng)養(yǎng)與健康研究所張國(guó)慶研究員和中國(guó)科學(xué)院分子植物科學(xué)卓越創(chuàng)新中心周志華研究員、嚴(yán)興研究員為論文共同通訊作者。該研究得到了科技部國(guó)家重點(diǎn)研發(fā)計(jì)劃、中國(guó)科學(xué)院戰(zhàn)略性生物資源服務(wù)網(wǎng)絡(luò)計(jì)劃等項(xiàng)目的支持。

文章鏈接:https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gkae844

圖1:RDBSB數(shù)據(jù)概況。(A)催化元件在ENZYME數(shù)據(jù)庫(kù)分類的分布情況。(B)經(jīng)實(shí)驗(yàn)驗(yàn)證的催化元件在酶類別、底盤(pán)、最佳pH值和最佳溫度的分布。(C)根據(jù)NCBI分類法分類的元件來(lái)源生物的分布情況。

圖2:RDBSB在線分析和設(shè)計(jì)功能。(A)GmOMT2的MapView示例。視圖提供催化元件、底盤(pán)、物種和化合物之間的關(guān)系。(B)利用PVQD和AlphaFold對(duì)GmOMT2進(jìn)行三維構(gòu)象和結(jié)構(gòu)預(yù)測(cè)。(C)PathFinder復(fù)現(xiàn)人工生物合成途徑設(shè)計(jì)的實(shí)例:酵母中晚期肝細(xì)胞癌治療藥物淫羊藿素的人工合成途徑和棉鈴蟲(chóng)性信息素的人工合成途徑。