亚洲乱码一区AV春药高潮,亚洲成人色区,亚洲中文久久精品无码浏不卡,男插女高潮一区二区,久久久久性色AV毛片特级

芬蘭Kibron專(zhuān)注表面張力儀測量技術(shù),快速精準測量動(dòng)靜態(tài)表面張力

熱線(xiàn):021-66110810,66110819,66110690,13564362870 Email: info@vizai.cn

合作客戶(hù)/

拜耳公司.jpg

拜耳公司

同濟大學(xué)

同濟大學(xué)

聯(lián)合大學(xué).jpg

聯(lián)合大學(xué)

寶潔公司

美國保潔

強生=

美國強生

瑞士羅氏

瑞士羅氏

當前位置首頁(yè) > 新聞中心

使用深度學(xué)習方法高通量預測代謝酶的 kcat,或揭開(kāi)細胞工廠(chǎng)秘密

來(lái)源:ScienceAI 瀏覽 801 次 發(fā)布時(shí)間:2022-09-14

酶周轉數(kcat)是了解細胞代謝、蛋白質(zhì)組分配和生理多樣性的關(guān)鍵,但實(shí)驗測量的kcat數據往往稀疏且嘈雜。

查爾姆斯理工大學(xué)(Chalmers University of Technology)的研究團隊提供了一種深度學(xué)習方法(DLKcat),用于僅根據底物結構和蛋白質(zhì)序列對來(lái)自任何生物體的代謝酶進(jìn)行高通量kcat預測。DLKcat可以捕獲突變酶的kcat變化并識別對kcat值有強烈影響的氨基酸殘基。研究人員應用這種方法來(lái)預測300多種酵母物種的基因組規模kcat值。


此外,該團隊設計了一個(gè)貝葉斯管道,以根據預測的kcat值參數化酶約束的基因組規模代謝模型。由此產(chǎn)生的模型在預測表型和蛋白質(zhì)組方面優(yōu)于先前管道中相應的原始酶約束基因組規模代謝模型,并使研究人員能夠解釋表型差異。DLKcat和酶約束的基因組規模代謝模型構建管道是揭示酶動(dòng)力學(xué)和生理多樣性的全球趨勢,并進(jìn)一步闡明大規模細胞代謝的寶貴工具。


該研究以「Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction」為題,于2022年6月16日發(fā)布在《Nature Catalysis》。

酶轉換數(kcat)定義了反應的最大化學(xué)轉化率,是了解特定生物體的新陳代謝、蛋白質(zhì)組分配、生長(cháng)和生理學(xué)的關(guān)鍵參數。酶數據庫BRENDA和SABIO-RK中有大量可用的kcat值集合,然而,與現有的各種生物體和代謝酶相比,這些值仍然稀少,這主要是因為缺乏用于kcat測量的高通量方法。


此外,由于不同的測定條件(例如pH值、輔因子可用性和實(shí)驗方法),實(shí)驗測量的kcat值具有相當大的可變性??傊?,稀疏的收集和相當大的噪聲限制了kcat數據在全局分析中的使用,并可能掩蓋酶進(jìn)化趨勢。


特別是酶約束的基因組規模代謝模型(ecGEM),其中全細胞代謝網(wǎng)絡(luò )受到酶催化能力的約束,因此能夠準確模擬最大生長(cháng)能力、代謝變化和蛋白質(zhì)組分配,特別依賴(lài)于基因組-縮放kcat值。在過(guò)去的十年中,ecGEM(或遵循酶約束概念的模型)已分別針對幾種經(jīng)過(guò)充分研究的生物體開(kāi)發(fā),包括大腸桿菌、釀酒酵母、中國倉鼠卵巢細胞和智人。由于kcat測量的局限性和依賴(lài)酶委員會(huì )(EC)編號注釋來(lái)搜索這些已開(kāi)發(fā)管道中的kcat值,為研究較少的生物體重建ecGEM或為多種生物體進(jìn)行大規模重建仍然是一個(gè)挑戰。


此外,即使對于那些經(jīng)過(guò)充分研究的生物,kcat的覆蓋范圍也遠未完成。在釀酒酵母ecGEM中,只有5%的酶促反應在BRENDA中具有完全匹配的kcat值。當數據缺失時(shí),以前的ecGEM重建流程通常假設kcat值來(lái)自類(lèi)似的底物、反應或其他生物,這可能導致模型預測偏離實(shí)驗觀(guān)察。明確要求獲得大規模的kcat值以提高模型準確性并產(chǎn)生更可靠的表型模擬。


深度學(xué)習已被應用并在模擬化學(xué)空間、基因表達、酶相關(guān)參數(如酶親和力和EC數)方面表現出出色的性能。此前,有研究人員采用機器學(xué)習方法,根據從蛋白質(zhì)結構中獲得的平均代謝通量和催化位點(diǎn)等特征來(lái)預測大腸桿菌kcat值。然而,這些特征通常很難獲得,這使得這種方法只能應用于研究最充分的生物體,如大腸桿菌。


在這里,查爾姆斯理工大學(xué)(Chalmers University of Technology)的研究團隊提出了深度學(xué)習方法DLKcat來(lái)預測所有代謝酶與其底物的kcat值,只需要底物SMILES信息和酶的蛋白質(zhì)序列作為輸入,從而為任何物種產(chǎn)生通用的kcat預測工具。

圖示:用于ecGEM參數化的kcat深度學(xué)習。(來(lái)源:論文)


DLKcat可以捕獲kcat向精確的單個(gè)氨基酸替代方向的變化,從而能夠計算注意力權重,從而識別對酶活性產(chǎn)生重大影響的氨基酸殘基。氨基酸取代是酶進(jìn)化領(lǐng)域的一項強大技術(shù),通常用于探測酶催化機制。特別是,大多數替代實(shí)驗在底物結合位點(diǎn)區域進(jìn)行誘變,因為假設結合區域將對催化活性產(chǎn)生很大影響。然而,據報道,偏遠地區會(huì )對催化活性產(chǎn)生深遠影響。


研究人員不僅確定了人PNP酶肌苷結合區域中氨基酸殘基的高關(guān)注權重,而且還確定了具有高關(guān)注權重的各種非結合殘基位點(diǎn),這表明這些殘基也可能對催化活性產(chǎn)生重大影響,值得進(jìn)一步驗證。DLKcat因此可以作為蛋白質(zhì)工程工具箱的重要組成部分。


預測的基因組規模的kcat譜可以促進(jìn)酶約束代謝模型的重建,從策劃和自動(dòng)生成的基本(非ec)GEM中。事實(shí)證明,深度學(xué)習預測的kcat過(guò)程比匹配來(lái)自BRENDA和SABIO-RK數據庫的體外kcat值更全面但仍然實(shí)用;這在GECKO和MOMENT等原始ecGEM重建管道中很常見(jiàn)。


通過(guò)不依賴(lài)EC編號注釋?zhuān)珼LKcat還能夠預測同工酶特異性kcat值,而SMILES的使用避免了原始ecGEM重建管道可能遇到的GEM和BRENDA之間底物命名不統一的問(wèn)題。隨后可以通過(guò)貝葉斯方法將DL-ecGEM調整為現有的實(shí)驗生長(cháng)數據,該方法產(chǎn)生具有生理相關(guān)解空間的后均值ecGEM。結合起來(lái),當前基于DLKcat的管道因此適用于幾乎任何生物體的ecGEM重建,其中蛋白質(zhì)序列FASTA文件和基本GEM可用。他們的管道因此提高了適用性,與以前構建的原始ecGEM相比,它甚至提高了具有酶促約束的反應數量。

圖示:kcat預測的深度學(xué)習模型性能。(來(lái)源:論文)


盡管基于DLKcat的管道產(chǎn)生的ecGEM性能優(yōu)于原始ecGEM,但仍然存在各種挑戰。例如,雖然深度學(xué)習模型可以將混雜酶的替代物與隨機選擇的底物區分開(kāi)來(lái),但它仍然預測了可能過(guò)高的隨機底物的動(dòng)力學(xué)活性水平。


這種行為可以通過(guò)負面數據的有限可用性來(lái)解釋?zhuān)好?底物對沒(méi)有產(chǎn)生催化作用的情況。增加對陰性數據集的報告,其中酶-底物對的未檢測到的活性由酶數據庫報告和收集,可以增強未來(lái)深度學(xué)習模型在定義真陰性方面的能力。


此外,DLKcat并未考慮pH和溫度等環(huán)境因素的影響,但將DLKcat與其他新興機器學(xué)習工具(例如酶的最佳溫度預測)相結合,將有助于未來(lái)研究環(huán)境參數對酶活性的影響。


另一個(gè)挑戰涉及涉及多種底物和由異聚酶復合物催化的反應??梢詾榇祟?lèi)反應定義的多底物SMILES和蛋白質(zhì)序列都可以與DLKcat一起發(fā)揮作用,從而為一個(gè)反應產(chǎn)生多個(gè)預測的kcat值。目前在這些情況下,研究人員會(huì )選擇最大kcat值,但最好設計一種方法來(lái)預測每種多底物和異聚酶的一個(gè)kcat值。

圖示:用于預測和解釋突變酶kcat的深度學(xué)習模型。(來(lái)源:論文)


此外,DLKcat衍生的DL-ecGEM和后驗均值ecGEM繼承了基本GEM的局限性,其中基于約束的建模的核心穩態(tài)假設允許人們確定代謝通量,但不容易考慮調節行為。雖然ecGEM極大地將基于約束的模型的解空間減少到細胞可行容量,但kcat并不是決定反應速率的唯一動(dòng)力學(xué)參數,例如,親和常數起著(zhù)重要的作用。然而,由于基于約束的模型無(wú)法預測內部代謝物濃度,因此目前無(wú)法輕易考慮這些參數的影響。


盡管如此,kcat值也是其他資源分配模型中的重要參數,例如蛋白質(zhì)組約束的GEM和代謝/大分子表達模型。盡管改進(jìn)的預測和更多的應用,如何定義kcat值也仍然是重建這些模型的挑戰。這種資源分配模型和ecGEM都認為細胞需要將其有限的蛋白質(zhì)組分配到不同的途徑以實(shí)現更快的生長(cháng)或更好的適應度,而每個(gè)反應的蛋白質(zhì)組成本同樣由酶的通量和動(dòng)力學(xué)速率定義。


因此,這些模型的代謝部分的深度學(xué)習預測kcat值可以提高其質(zhì)量和性能,盡管無(wú)法從DLKcat獲得在這些模型公式中確定的其他具有挑戰性的動(dòng)力學(xué)參數,例如核糖體催化率。此外,特別關(guān)注描述酶動(dòng)力學(xué)的模型公式可以受益于深度學(xué)習預測的kcat值,因此DLKcat方法可以在建模領(lǐng)域找到廣泛的應用。


總之,DLKcat產(chǎn)生了現實(shí)的kcat值,可用于指導未來(lái)的基因工程、了解酶進(jìn)化和重建ecGEM以預測代謝通量和表型。除此之外,這種基于深度學(xué)習的kcat預測工具的許多其他潛在用途,例如基因組挖掘和全基因組關(guān)聯(lián)研究分析中的工具。開(kāi)發(fā)的自動(dòng)貝葉斯ecGEM重建管道將有助于進(jìn)一步用于ecGEM重建,用于組學(xué)數據合并和分析。


論文鏈接:https://www.nature.com/articles/s41929-022-00798-z