近日,中國科學院上海營養(yǎng)與健康研究所建立了端到端篩選目標酶的多任務計算框架,提高了功能酶的預測與發(fā)現(xiàn)效率,并應用于真菌毒素降解酶的挖掘。
近年來,深度學習在酶的結(jié)構、功能與性質(zhì)的大規(guī)模預測方面取得了進展。然而,由于缺乏面向多模態(tài)輸入和多任務輸出的統(tǒng)一建模能力,現(xiàn)有方法難以滿足高性能功能酶篩選的需求。針對這一挑戰(zhàn),研究團隊設計并開發(fā)了CACLENS框架,將CGC門控機制、對比學習與交叉注意力等方法深度融合,構建出可同時執(zhí)行多項預測任務的一體化酶篩選平臺。
CACLENS能夠以較低的計算成本同時完成反應類型分類、酶EC號預測與反應可行性評估三項關鍵任務,并在多個任務上展現(xiàn)出優(yōu)勢。具體而言:在反應類型分類中,清洗處理ADP/ATP/H+等常見輔因子后,模型性能優(yōu)于現(xiàn)有方法;在EC號預測方面,整體表現(xiàn)超過主流模型CLEAN;在反應可行性評估中,即使采用偏向ESP與EnzRank的評估策略,CACLENS仍取得更佳結(jié)果,并能穩(wěn)健處理未見過或與訓練集序列相似度較低的酶。
針對真菌毒素玉米赤霉烯酮(ZEN),研究以CACLENS的多任務聯(lián)合預測結(jié)果為基礎,在大規(guī)模序列空間中篩選出10個潛在降解酶候選體。研究通過基因合成、異源表達與純化獲得相應酶蛋白,并對其降解性能開展實驗驗證。結(jié)果表明,約一半的候選酶具有對ZEN的催化活性,其中ZD4與ZD7能夠在體外體系中降解超過90%的ZEN。
整體來看,CACLENS在三項任務中均展現(xiàn)出預測能力,證明其在功能酶篩選方面具有應用潛力。這一成果為多領域的新型功能酶挖掘提供了技術支撐,并為未來構建智能化酶工程設計平臺、深入挖掘真菌毒素降解新酶奠定了基礎。
相關研究成果在線發(fā)表在《先進科學》(Advanced Science)上。研究工作得到國家自然科學基金和國家重點研發(fā)計劃等的支持。

基于多任務模型的新功能酶智能挖掘與篩選框架

ZEN與ZOL及其降解產(chǎn)物的色譜圖
