咨詢熱線:025-58361106-801   Email: info@njpeptide.com

中文      English

總機(jī):025-58361106-801

傳真:025-58361107-806

Email:info@njpeptide.com

地址:南京市化學(xué)工業(yè)園區(qū)方水路158號三樓


最新資訊

您當(dāng)前的位置:首頁 > 關(guān)于我們 > 最新資訊



《合成生物學(xué)》|  蛋白質(zhì)計算設(shè)計:方法和應(yīng)用展望

合成生物學(xué), 2021, 2(1): 15-32 doi: 10.12211/2096-8280.2020-067

特約評述


蛋白質(zhì)計算設(shè)計:方法和應(yīng)用展望

操帆, 陳耀晞, 繆陽洋, 張璐, 劉海燕

中國科學(xué)技術(shù)大學(xué)生命科學(xué)學(xué)院,安徽 合肥  230026

Computational protein design: perspectives in methods and applications

CAO Fan, CHEN Yaoxi, MIAO Yangyang, ZHANG Lu, LIU Haiyan

School of Life Sciences,University of Science and Technology of China,Hefei 230026,Anhui,China

摘要

蛋白質(zhì)計算設(shè)計是指通過計算理性地確定蛋白質(zhì)的氨基酸序列,實現(xiàn)預(yù)設(shè)的結(jié)構(gòu)和功能。蛋白質(zhì)計算設(shè)計已逐漸形成了一套系統(tǒng)的方法,得到越來越多的實驗驗證。這些方法既可用于從頭設(shè)計蛋白,也可以用于既有蛋白的理性改造,具有廣泛應(yīng)用前景,是合成生物學(xué)的重要使能技術(shù)之一。本文簡要回顧蛋白質(zhì)計算設(shè)計方法的歷史,并從蛋白質(zhì)能量計算方法、氨基酸序列自動優(yōu)化、從頭設(shè)計主鏈結(jié)構(gòu)、設(shè)計新的分子間識別界面以及負(fù)設(shè)計等方面介紹蛋白質(zhì)計算設(shè)計的基本方法和思路,還舉例討論了提高結(jié)構(gòu)穩(wěn)定性、構(gòu)造新的分子界面等設(shè)計方法在酶、疫苗、自組裝蛋白質(zhì)材料等領(lǐng)域的應(yīng)用,最后分析了蛋白質(zhì)計算設(shè)計方法設(shè)計精度不足、難刻畫極性相互作用的缺點以及需要考慮非水溶劑環(huán)境、界面設(shè)計優(yōu)化等亟待解決的問題,展望了蛋白質(zhì)計算設(shè)計方法未來在合成生物學(xué)領(lǐng)域如生物感受器、邏輯門設(shè)計等,醫(yī)學(xué)領(lǐng)域如抗體、疫苗設(shè)計等的應(yīng)用前景。

關(guān)鍵詞: 蛋白質(zhì) ; 計算設(shè)計方法 ; 氨基酸序列 ; 多肽主鏈結(jié)構(gòu) ; 分子間識別界面

Abstract

In computational protein design, the amino acid sequence of a protein is rationally chosen through computations so that the resulting molecule is of desired structure and function. Systematic methods for computational protein design have been developed and validated in increasing number of experiments. Exhibiting strong potential for broad applications, computational protein design has been considered as an important enabling technology for Synthetic Biology. Here we briefly review the history of methods for computational design, which are divided into three sections about heuristic design that based on rules, automatic optimization of amino acid sequences, and de novo main chain design respectively. In the next chapter, we introduce the basic approaches and strategies in details. In proteins energy calculation methods, we introduce physical energy terms and statistical energy terms. Based on these energy calculation methods, we introduce sequence and structure design methods including automated optimization of amino acid sequences, de novo design of polypeptide backbones (with fragment assembling method or sequence independent backbone potentials), designing new interfaces for inter-molecule recognition such as protein-ligand interfaces and protein-protein interfaces, and the concept of negative design. Besides the history and detail of computational protein design methods that mentioned above, we also briefly discuss examples of using computational protein design to support application studies, including enhancing protein structural stability and redesign or de novo design of enzymes, vaccines and protein materials that related to interfaces design. These examples not only present current studies using the computational protein design methods, but also enlighten us on more broader applications in the future. Finally, we analyze some problems that need to be solved in the protein computational design method, such as inefficient in design accuracy, difficulty in characterizing polar interactions, and the need to consider the environment of non-aqueous solvents. We also discuss some aspects of possible application in synthetic biology like biological logic gates design and biosensor design, and application prospects in the medical field such as antibodies, vaccine design, etc.

Keywords: protein ; methods for computational design ; amino acid sequences ; polypeptide backbone structure ; interface of intermolecular recognition

PDF (2838KB) 元數(shù)據(jù) 多維度評價 相關(guān)文章 導(dǎo)出 EndNoteRisBibtex  收藏本文

本文引用格式

操帆, 陳耀晞, 繆陽洋, 張璐, 劉海燕. 蛋白質(zhì)計算設(shè)計:方法和應(yīng)用展望合成生物學(xué)[J], 2021, 2(1): 15-32 doi:10.12211/2096-8280.2020-067

CAO Fan, CHEN Yaoxi, MIAO Yangyang, ZHANG Lu, LIU Haiyan. Computational protein design: perspectives in methods and applicationsSynthetic Biology Journal[J], 2021, 2(1): 15-32 doi:10.12211/2096-8280.2020-067


蛋白質(zhì)是執(zhí)行生物功能的主要生物大分子,也是用于構(gòu)筑合成生物系統(tǒng)的主要元件。大多數(shù)蛋白質(zhì)的功能取決于它們的特定三維空間結(jié)構(gòu)和特異性分子間相互作用。氨基酸序列決定了蛋白質(zhì)三維結(jié)構(gòu)和相互作用,從而決定蛋白質(zhì)功能。天然蛋白質(zhì)的氨基酸序列經(jīng)過了進(jìn)化的長期選擇,適應(yīng)了相應(yīng)有機(jī)體的功能需求。在合成生物學(xué)中,當(dāng)天然蛋白被轉(zhuǎn)用于其他目的時,其性質(zhì)和功能很可能達(dá)不到要求,有時甚至找不到可用的天然蛋白。因此,對天然蛋白的性質(zhì)和功能進(jìn)行定向改造,乃至創(chuàng)造有新功能的人工蛋白,對合成生物學(xué)具有重要意義1-5。傳統(tǒng)蛋白質(zhì)工程技術(shù)如定向進(jìn)化6對天然蛋白序列進(jìn)行小的擾動,本質(zhì)是一種試錯方法,在不采用高通量篩選手段時效率很低,且難以創(chuàng)造出具有新結(jié)構(gòu)和新功能的蛋白。因此,經(jīng)驗的或計算的蛋白質(zhì)理性設(shè)計成為了改造乃至創(chuàng)造新蛋白質(zhì)的手段。其中,依賴經(jīng)驗知識以及進(jìn)化信息等7的理性設(shè)計在改造蛋白質(zhì)方面確實有一些成功案例,但是難以解決復(fù)雜的蛋白質(zhì)的工程問題。蛋白質(zhì)計算設(shè)計,即從結(jié)構(gòu)功能的需求出發(fā),通過計算手段確定氨基酸序列8-11,既可以用于蛋白質(zhì)從頭設(shè)計,也更多地被應(yīng)用于既有蛋白質(zhì)的改造設(shè)計,是亟待推動的發(fā)展方向。目前,以蛋白質(zhì)從頭設(shè)計為目標(biāo)開發(fā)的一些計算方法已被越來越廣泛應(yīng)用于蛋白質(zhì)工程改造中。有報道表明,在蛋白質(zhì)相互作用界面改造中,通過計算設(shè)計技術(shù)的恰當(dāng)應(yīng)用,可以把實驗試錯范圍縮小3~4個數(shù)量級12。目前,計算設(shè)計方法還有巨大的發(fā)展空間,且相關(guān)研究隊伍也日益擴(kuò)大。計算方法不僅會在對天然蛋白的理性改造中得到廣泛實際應(yīng)用,按需定制的人工設(shè)計蛋白的實際應(yīng)用也有可能在未來5~10年內(nèi)普遍實現(xiàn)。

本文主要目的是介紹目前已采用和正在發(fā)展中的蛋白質(zhì)計算設(shè)計方法的基本原理,面臨的主要問題和解決思路、方法,以及尚待解決的一些問題和可能的研究方案。盡管這些方法的最終發(fā)展目標(biāo)是蛋白質(zhì)按需從頭設(shè)計,它們也易于被調(diào)整用于蛋白質(zhì)理性改造。在下文中,本文作者首先簡要回顧蛋白質(zhì)計算設(shè)計的發(fā)展歷史,認(rèn)識該領(lǐng)域現(xiàn)狀和整體發(fā)展方向;隨后主要圍繞蛋白質(zhì)從頭計算設(shè)計,介紹其基本方法和原理;并匯集總結(jié)一些具體應(yīng)用成果,討論蛋白質(zhì)從頭計算設(shè)計應(yīng)用的主要思路;最后對方法發(fā)展和應(yīng)用的趨勢進(jìn)行簡要展望。

1 蛋白質(zhì)計算設(shè)計的歷史

本節(jié)主要從設(shè)計策略的角度,對采用不同類型策略的方法分別概述。盡管多種方法被首次報道的時間較早(如20世紀(jì)80年代出現(xiàn)的基于規(guī)則的啟發(fā)式設(shè)計方法、20世紀(jì)90年代出現(xiàn)的通過自動優(yōu)化能量函數(shù)進(jìn)行序列設(shè)計的方法),但直到今天它們?nèi)栽诔掷m(xù)的應(yīng)用、驗證和完善中。對相關(guān)時間順序感興趣的讀者可參考其他綜述13。

1.1 基于規(guī)則的啟發(fā)式設(shè)計

最早被提出的蛋白質(zhì)設(shè)計方案受到了特殊的、高度規(guī)則的多肽結(jié)構(gòu)的序列變化規(guī)律的啟發(fā)14-16。多肽主鏈高度規(guī)則的局部結(jié)構(gòu)模式包括α-螺旋、β-片層等二級結(jié)構(gòu)單元。多個二級結(jié)構(gòu)單元之間能夠以特殊方式相互堆積擴(kuò)展成更大的三維結(jié)構(gòu)單元,如超二級結(jié)構(gòu)motif、多螺旋束等。與之對應(yīng)的氨基酸序列上,不同性質(zhì)氨基酸呈現(xiàn)特殊的排列模式,如圖1中反平行螺旋上A、D位置由疏水氨基酸占據(jù),其余位置則多被親水氨基酸占據(jù);β-肽段上親、疏水氨基酸周期性地相間排列,以使疏水側(cè)鏈埋于蛋白質(zhì)內(nèi)部,親水側(cè)鏈暴露在溶劑中?;谶@種排列模式設(shè)計氨基酸序列的啟發(fā)式方法被成功應(yīng)用于設(shè)計各類螺旋束結(jié)構(gòu)17-18、超二級結(jié)構(gòu)motif19等,其中發(fā)展較為系統(tǒng)的是多螺旋束設(shè)計。為了更系統(tǒng)地刻畫多螺旋束中不同螺旋間堆積結(jié)構(gòu)可能的變化,Grigoryan和De Grado等20建立了精細(xì)的經(jīng)驗數(shù)學(xué)公式來定義螺旋間距、扭轉(zhuǎn)角、相對平移等幾何參數(shù)間的相互依賴關(guān)系,用于設(shè)計不同數(shù)目和排列的理想螺旋束結(jié)構(gòu)。這類設(shè)計方法也存在著明顯的局限,首先它受限于特殊、有限的主鏈結(jié)構(gòu)類型;此外,僅僅通過區(qū)分殘基親、疏水性等經(jīng)驗來選擇殘基類型得到的設(shè)計結(jié)果具有很大的不確定性,由于沒有控制殘基之間特異性的空間堆積和氫鍵相互作用等,最終獲得能特異性折疊序列的成功率并不高。

圖1

圖1   形成規(guī)則空間結(jié)構(gòu)的多肽鏈的氨基酸序列變化規(guī)律示例

Fig. 1   Examples of changes in the amino acids sequence of a polypeptide chain forming a regular spatial structure(Hydrophilic and hydrophobic amino acids are alternated in a periodic pattern)


1.2 通過自動優(yōu)化能量函數(shù)進(jìn)行的序列設(shè)計

20世紀(jì)90年代后期,隨著分子力學(xué)能量函數(shù)、氨基酸側(cè)鏈構(gòu)象庫、優(yōu)化算法等的發(fā)展,Dahiyat等21首先實現(xiàn)了用自動優(yōu)化的方法來設(shè)計氨基酸序列。在此類算法中,主鏈骨架是被事先給定的(如來源于天然蛋白質(zhì)結(jié)構(gòu)),且可被假設(shè)為固定不變。設(shè)計中需要通過計算來確定的未知量包括每個主鏈位置上的氨基酸殘基類型以及其側(cè)鏈構(gòu)象。這些未知量的所有容許取值(即氨基酸側(cè)鏈類型及其構(gòu)象狀態(tài)的可能組合)構(gòu)成了氨基酸序列和側(cè)鏈構(gòu)象空間。定義在該空間上的能量函數(shù)則被用于評估特定序列和構(gòu)象組合的好壞。定義了主鏈結(jié)構(gòu)和能量函數(shù)后,設(shè)計者通過特殊的算法在序列和側(cè)鏈構(gòu)象的未知量空間中自動搜索,找出能量盡可能低的解,得到設(shè)計結(jié)果。圖2簡要演示了這一設(shè)計過程,對于左側(cè)輸入的目標(biāo)主鏈結(jié)構(gòu),通過搜索序列和側(cè)鏈構(gòu)象空間,找到具有最低能量的序列,認(rèn)為它們就是最可能形成目標(biāo)結(jié)構(gòu)的序列。值得一提的是,實現(xiàn)這類設(shè)計算法的關(guān)鍵技巧之一,是將本來連續(xù)變化的側(cè)鏈構(gòu)象離散表示為可數(shù)的有限種可能狀態(tài)(稱為rotamer)。設(shè)計算法的另一關(guān)鍵是能量函數(shù)。從原理上,如果能找到普適的能量函數(shù),基于能量函數(shù)自動優(yōu)化的設(shè)計方法就能被廣泛應(yīng)用于不同結(jié)構(gòu)類型蛋白的設(shè)計。因此,從被提出至今,通過優(yōu)化能量函數(shù)進(jìn)行自動設(shè)計逐漸成為蛋白計算設(shè)計的主流策略,而相應(yīng)的能量函數(shù)22-24和優(yōu)化算法25-26等得到持續(xù)的發(fā)展。到目前為止,至少兩套能量函數(shù)(Rosetta能量函數(shù)25以及本文作者課題組建立的ABACUS統(tǒng)計能量函數(shù)27-28)都已被實驗反復(fù)驗證能以很高的成功率進(jìn)行氨基酸序列從頭設(shè)計。以天然主鏈結(jié)構(gòu)為設(shè)計目標(biāo),用ABACUS進(jìn)行氨基酸序列全自動設(shè)計得到的人工蛋白往往具有遠(yuǎn)超天然蛋白的高熱穩(wěn)定性27。

圖2

圖2   給定主鏈優(yōu)化氨基酸序列和側(cè)鏈構(gòu)象

Fig. 2   Optimization of amino acids sequences and side-chain conformations for a given backbone(For the input target backbone structures, the sequences with the lowest energies were found by searching the sequence andside chain conformational space, considering them the most likely to form the target structures)


為了把計算量控制在可行范圍內(nèi),在優(yōu)化氨基酸側(cè)鏈類型和構(gòu)象時,主鏈結(jié)構(gòu)一般被假設(shè)為固定不變的。如果主鏈結(jié)構(gòu)也被作為未知量與序列、側(cè)鏈同時被優(yōu)化,盡管物理層面上更合理,但計算層面上,變量空間維度會過高,使得計算無法完成。另外,對主鏈結(jié)構(gòu)難以進(jìn)行合理的離散采樣,對其進(jìn)行優(yōu)化比固定主鏈優(yōu)化側(cè)鏈類型和rotamer的組合要困難得多。為了在一定程度上考慮主鏈柔性,研究者提出了不同的方案,其基本思路都是對多種互有差別的主鏈結(jié)構(gòu)進(jìn)行序列設(shè)計。應(yīng)用最多的方案是在序列空間和主鏈結(jié)構(gòu)空間的優(yōu)化交替迭代進(jìn)行,這是多數(shù)Rosetta Design應(yīng)用中采取的方法29。另一種方案是對多個主鏈結(jié)構(gòu)的集合(主鏈系綜)同時優(yōu)化氨基酸序列30。研究者提出了不同方法產(chǎn)生主鏈結(jié)構(gòu)系綜,以盡可能合理再現(xiàn)在天然同源蛋白中觀察到的序列差異引起的主鏈結(jié)構(gòu)的可能變化,如所謂的“backrub”運動31等。值得指出的是,這些方案不是對主鏈構(gòu)象空間進(jìn)行大范圍采樣。它們?nèi)匀恍枰獜囊粋€與最終結(jié)構(gòu)非常接近的初始主鏈結(jié)構(gòu)模型出發(fā)。最終結(jié)構(gòu)只是初始主鏈附近的小幅度變化(主鏈原子均方根位移最大在1~1.5 ?左右)。是否以這種方式處理主鏈柔性似乎對主要基于統(tǒng)計能量函數(shù)的ABACUS方法的設(shè)計成功率影響較小32。

1.3 多肽主鏈結(jié)構(gòu)的從頭設(shè)計

真正的從頭蛋白質(zhì)設(shè)計不應(yīng)僅限于用天然主鏈結(jié)構(gòu)作為設(shè)計目標(biāo)。滿足最基本化學(xué)要求(共價構(gòu)型正確、原子間無空間沖突)的可能主鏈構(gòu)象是非常多樣的。其中占比非常少的構(gòu)象才具有所謂的“可設(shè)計性”,即存在氨基酸序列,能自發(fā)穩(wěn)定地折疊成這種構(gòu)象。從頭設(shè)計的主鏈結(jié)構(gòu)必須具有高“可設(shè)計性”。如何保證這一點,到目前為止,還沒有經(jīng)實驗充分驗證的普適方案。目前成功例子最多的,是通過引入結(jié)構(gòu)預(yù)測中使用的算法來形成問題特異的啟發(fā)式方案。這類方案的基本步驟為:定義要設(shè)計的目標(biāo)主鏈結(jié)構(gòu)的基本框架(二級結(jié)構(gòu)單元的組成、大致相對位置等),產(chǎn)生對主鏈結(jié)構(gòu)的約束條件;再把天然蛋白質(zhì)中的主鏈結(jié)構(gòu)片段和二級結(jié)構(gòu)元素拼接成滿足約束條件的初始結(jié)構(gòu);進(jìn)而用結(jié)構(gòu)預(yù)測中使用的能量函數(shù)、構(gòu)象采樣方法進(jìn)行結(jié)構(gòu)優(yōu)化,進(jìn)入主鏈結(jié)構(gòu)/序列設(shè)計的優(yōu)化循環(huán)。為提高人工構(gòu)建主鏈結(jié)構(gòu)的可設(shè)計性,Koga等33分析了二級結(jié)構(gòu)模式和三級結(jié)構(gòu)模體之間的關(guān)聯(lián)性,統(tǒng)計了不同空間連接方式的二級結(jié)構(gòu)單元間環(huán)區(qū)長度和構(gòu)象分布,提出了如何設(shè)計環(huán)區(qū)長度和構(gòu)象的經(jīng)驗規(guī)則。目前用這種方法人工設(shè)計的主鏈結(jié)構(gòu)在二級結(jié)構(gòu)及其連接區(qū)等局部結(jié)構(gòu)特征上大多具有理想的結(jié)構(gòu)模式,缺乏天然蛋白展示出的主鏈結(jié)構(gòu)的豐富多樣性34。此外,主鏈結(jié)構(gòu)優(yōu)化時使用全原子能量函數(shù),依賴于側(cè)鏈類型和構(gòu)象,故而通過主鏈優(yōu)化-序列優(yōu)化迭代的方式進(jìn)行設(shè)計。除了利用天然主鏈結(jié)構(gòu)和序列片段拼接設(shè)計人工蛋白外,F(xiàn)rappier和Mackenzie等還提出通過分析天然蛋白三維結(jié)構(gòu)數(shù)據(jù)庫,定義空間相鄰的多個短片段構(gòu)成的三維結(jié)構(gòu)單元(稱為TERM),用TERM的組合來進(jìn)行蛋白質(zhì)設(shè)計35-36。另一可能的解決方案是構(gòu)建不依賴于側(cè)鏈類型的主鏈能量模型,直接通過主鏈能量優(yōu)化進(jìn)行主鏈設(shè)計3437-38。

2 蛋白質(zhì)從頭設(shè)計的計算方法

本節(jié)從以下四個方面來介紹蛋白質(zhì)從頭設(shè)計的計算方法:氨基酸序列設(shè)計;主鏈結(jié)構(gòu)設(shè)計;蛋白質(zhì)分子間相互作用界面設(shè)計;以及負(fù)設(shè)計。前兩個方面前文已提到;通過針對性調(diào)整序列和結(jié)構(gòu)設(shè)計方法,可為蛋白質(zhì)設(shè)計新的分子間相互作用界面,從而實現(xiàn)新的功能;負(fù)設(shè)計是一種概念性的設(shè)計思路,將在本節(jié)最后予以補(bǔ)充。

2.1 氨基酸序列設(shè)計方法

對于在給定目標(biāo)主鏈結(jié)構(gòu)下進(jìn)行序列設(shè)計的問題,我們通過定義能量作為序列的函數(shù),把序列設(shè)計問題轉(zhuǎn)化為在序列空間中找到能量最低的序列的最優(yōu)化問題(圖2)。這里,能量函數(shù)是優(yōu)化問題的目標(biāo)函數(shù),它定量評估不同序列與給定目標(biāo)主鏈結(jié)構(gòu)匹配的程度:能量越低的序列越有可能穩(wěn)定地形成與目標(biāo)一致的主鏈結(jié)構(gòu)。

2.1.1 序列設(shè)計的能量函數(shù)

序列設(shè)計的能量函數(shù)具有經(jīng)驗的數(shù)學(xué)形式,其中既有基于物理原理的能量項,也有通過對蛋白質(zhì)數(shù)據(jù)庫進(jìn)行統(tǒng)計分析得到的能量項。以現(xiàn)在應(yīng)用成功的例子最多、使用最廣泛的蛋白質(zhì)設(shè)計軟件Rosetta25為例,其能量函數(shù)是刻畫不同物理相互作用的能量項和部分統(tǒng)計能量項的線性組合,?total=?????(??,???)。該函數(shù)中的不同能量項是基于對各種分子相互作用、對蛋白質(zhì)折疊的重要性的分析和既有認(rèn)識經(jīng)驗性地提出來的。其中物理能量項主要包括共價結(jié)構(gòu)、范德華相互作用、靜電相互作用和氫鍵、溶劑化自由能等。此外,總能量中還包括依賴于主鏈二面角、rotamer類型等的統(tǒng)計能量項。

(1) 物理能量項

用于刻畫蛋白質(zhì)等生物大分子體系的物理能量項可分為共價相互作用能量項(鍵長、鍵角、二面角等)和非共價相互作用能量項(范德華相互作用、靜電相互作用,溶劑化自由能、氫鍵等)兩類(圖3)。在序列設(shè)計中,鍵長、鍵角以及決定立體構(gòu)型的非正常二面角等幾何性質(zhì)通常保持固定不變,共價相互作用能量項可視為常數(shù)??勺兊奈锢砟芰宽椫校兜氯A相互作用能量項是隨原子間距離而變化的短程排斥和長程色散吸引的加和。Rosetta使用了吸引和排斥可拆分加權(quán)的Lennard-Jones勢來計算范德華相互作用能量。靜電項刻畫帶電的極性官能團(tuán)之間的庫侖相互作用,Rosetta使用最初來自CHARMM分子力場的原子電荷分布來計算靜電能,并通過組優(yōu)化進(jìn)行了調(diào)整。氫鍵是親核重原子將電子密度提供給極性氫時形成的部分共價相互作用。Rosetta使用了靜電模型和特殊的氫鍵模型來計算氫鍵的能量,并且該能量被細(xì)分為不同的類型分別計算:長距離主鏈氫鍵、短距離主鏈氫鍵、主鏈和側(cè)鏈原子之間的氫鍵、側(cè)鏈之間的氫鍵。溶劑效應(yīng)在決定蛋白質(zhì)構(gòu)象時發(fā)揮了至關(guān)重要的作用。分子能量函數(shù)中常用的溶劑模型分為顯式溶劑模型和隱式溶劑模型39。顯式溶劑模型需要對每個溶劑分子的原子空間位置進(jìn)行采樣并據(jù)此計算溶質(zhì)-溶劑原子間的相互作用。由于計算量較大,顯式溶劑模型對序列設(shè)計是不合適的。隱式溶劑模型則通過定義只依賴于溶質(zhì)結(jié)構(gòu)坐標(biāo)的有效溶劑化自由能來處理溶劑效應(yīng)。Rosetta中使用的Lazaridis-Karplus(LK)隱式高斯排除模型40,溶劑化自由能包括各向同性的溶劑化能量以及各向異性的溶劑化自由能兩部分,分別刻畫非極性和極性溶劑化效應(yīng)。

圖3

圖3   物理能量項

Fig. 3   Physical energy terms(Physical energy functions are generally constructed from the addition of covalent interaction terms as well as non covalent interaction terms)


(2)統(tǒng)計能量項

統(tǒng)計能量項是對數(shù)據(jù)進(jìn)行統(tǒng)計分析得到的概率分布進(jìn)行轉(zhuǎn)化后得到的(圖4),通過對數(shù)據(jù)庫中不同的構(gòu)型變量分布進(jìn)行統(tǒng)計分析,將其出現(xiàn)的概率轉(zhuǎn)換為能量,對依賴于多個幾何變量的高維統(tǒng)計能量項(例如依賴于構(gòu)象和環(huán)境的主鏈位點之間的相互作用),需要發(fā)展特殊的技術(shù),才能恰當(dāng)?shù)毓烙嫸嗑S概率密度,從而得到合理的統(tǒng)計能量函數(shù)??梢詮膬蓚€不同角度來理解序列設(shè)計的統(tǒng)計能量項。一是從統(tǒng)計熱力學(xué)角度,在平衡態(tài),物理系統(tǒng)處于不同微觀狀態(tài)的概率服從玻爾茲曼分布,?(?)exp (-???B?)。其中r代表微觀狀態(tài)的坐標(biāo),??代表微觀狀態(tài)的能量,?B?是玻爾茲曼常數(shù)乘以環(huán)境的熱力學(xué)溫度。因此,我們可以根據(jù)數(shù)據(jù)集合中的概率分布反推出相互作用??=-?B?ln??+數(shù)。另一個角度則可從純統(tǒng)計學(xué)角度出發(fā),假設(shè)給定主鏈結(jié)構(gòu)后氨基酸序列分布可記為條件概率P(sequence|backone),序列設(shè)計要解決的問題是尋找讓該條件概率最大的序列。如果我們定義統(tǒng)計能量?=-ln (?),則概率最大化等價于能量最小化。

圖4

圖4   不同類型的統(tǒng)計能量項

Fig. 4   Statistical energy terms of various types(Different statistical energy functions are obtained by transforming the probability distributions obtained from statistical analysis of different kinds of data)


需要注意到,無論是微觀狀態(tài)的概率P?,還是條件概率P(sequence|backone),都是非常高維的函數(shù),其變量的各個分量之間高度互相依賴。是無法從數(shù)據(jù)集中直接估計出這樣的高維概率分布的。通過應(yīng)用玻爾茲曼分布的反轉(zhuǎn),我們把對概率分布的估計轉(zhuǎn)化成對自由度之間相互作用的估計,從而可以在統(tǒng)計時對自由度之間的耦合分類處理,只保留較低階的耦合對總能量的貢獻(xiàn),以把問題復(fù)雜程度控制在可處理范圍內(nèi)。換一種說法,全序列的總能量,被分解為由序列上每個位點的殘基類型分別決定的單殘基能量,以及刻畫殘基間兩兩相互作用的殘基間相互作用項。依賴于兩個以上位點的殘基的更高階能量項,則會被忽略。

這樣的殘基類型依賴的統(tǒng)計能量,可以和物理能量項加權(quán)組合起來,用于彌補(bǔ)物理能量項的不足。Rosetta總能量中就使用了多個這樣的單殘基統(tǒng)計能量項,包括反映Ramachandran主鏈二面角對殘基類型影響的能量項、側(cè)鏈構(gòu)象依賴的能量項等。此外,Rosetta還使用幾何參數(shù)的統(tǒng)計概率分布來計算半胱氨酸形成的二硫鍵的能量。值得注意的是,在用這種方法考慮統(tǒng)計能量項時,我們假設(shè)了不同結(jié)構(gòu)特征(如主鏈二面角、溶劑暴露程度、二級結(jié)構(gòu)類型等)對殘基類型的影響是相互獨立、可互相加和的。這個假設(shè)實際上是不成立的,它對統(tǒng)計能量函數(shù)帶來的不利影響可能比較大。

本文作者課題組提出的ABACUS方法27-28,使用了主要基于統(tǒng)計能量項的能量模型來進(jìn)行序列設(shè)計。其主鏈結(jié)構(gòu)依賴的能量被分解為單殘基項和殘基間兩兩相互作用項的加和。這兩類能量項都是通過直接統(tǒng)計在給定主鏈結(jié)構(gòu)特征的前提下的氨基酸側(cè)鏈類型或類型組合的概率分布得到的。不同于以往的統(tǒng)計能量項,ABACUS把不同結(jié)構(gòu)特征組合起來,作為決定氨基酸類型概率分布的聯(lián)合條件,單殘基能量項由氨基酸所在位置的二級結(jié)構(gòu)類型、Ramachandran主鏈二面角、溶劑可及性面積這些特征同時決定;而殘基間相互作用項則在同時考慮兩個主鏈位點的上述結(jié)構(gòu)特征之外,還考慮位點間的相對位置(包括距離和取向),把所有結(jié)構(gòu)特征作為影響殘基類型組合概率的聯(lián)合條件。除主鏈依賴的殘基類型能量外,ABACUS總能量中還包括了主鏈構(gòu)象依賴的rotamer能量以及原子間空間堆積能量。它們是通過對天然蛋白側(cè)鏈構(gòu)象分布、原子間距離分布分別進(jìn)行統(tǒng)計得到的。

(3) 確定不同能量項的權(quán)重

上述把不同類型能量項組合起來構(gòu)成總能量的方案是一種經(jīng)驗選擇。參與組合的不同能量項可能反復(fù)、冗余地包括了同一物理因素的貢獻(xiàn)(比如除范德華相互作用外,主鏈構(gòu)象、側(cè)鏈構(gòu)象等能量項也會包括范德華相互作用的貢獻(xiàn))。對各能量項引入待定權(quán)重能一定程度抵消這種冗余計算的不利影響。另外,把這些權(quán)重作為可調(diào)參數(shù)來擬合實驗數(shù)據(jù),我們還可能把實驗數(shù)據(jù)中包含的一些其他信息籠統(tǒng)地引入模型中,從而改善模型。目前,用實驗數(shù)據(jù)訓(xùn)練優(yōu)化權(quán)重最有效的方法是最大化天然序列恢復(fù)比例。其基本思想是使用能量函數(shù)重新設(shè)計天然蛋白質(zhì)的序列,檢查各位點重新設(shè)計的氨基酸殘基類型與天然殘基類型是否一致。在實際應(yīng)用時,我們可以基于待優(yōu)化的權(quán)重的特點對這一基本思路進(jìn)行調(diào)整。例如:保持氨基酸序列不變,只優(yōu)化各位點的rotamer類型,檢查預(yù)測的側(cè)鏈構(gòu)象和天然構(gòu)象的偏差;只重設(shè)計一個位點的殘基類型,保持其他位點的天然殘基類型不變(單位點設(shè)計),等等。

2.1.2 序列和側(cè)鏈構(gòu)象空間的搜索和優(yōu)化算法

定義能量函數(shù)后,序列設(shè)計的下一步是確定總能量最低(或盡可能低)的氨基酸序列。由于總能量還依賴于側(cè)鏈構(gòu)象,該搜索優(yōu)化過程同時確定側(cè)鏈類型和rotamer。現(xiàn)在已經(jīng)有多種方法來解決此問題,包括確定性優(yōu)化算法(例如死端消除、平均場優(yōu)化)以及隨機(jī)優(yōu)化算法(如模擬退火、遺傳算法)41

確定性優(yōu)化算法可以解決全局最小的問題。但是蛋白質(zhì)設(shè)計搜索空間沿多個維度(即序列空間,側(cè)鏈構(gòu)象空間,骨架構(gòu)象空間)迅速增大、物理模型可能太復(fù)雜等,可能導(dǎo)致確定性優(yōu)化算法無法應(yīng)用。確定性優(yōu)化算法例如死端消除法經(jīng)常應(yīng)用于較小的蛋白質(zhì)或少數(shù)位點的氨基酸殘基類型優(yōu)化問題。但是確定性優(yōu)化算法在最近也有一些大的改進(jìn),例如蛋白質(zhì)設(shè)計的CLEVER算法42,該算法建立在Keating實驗室以前開發(fā)的簇擴(kuò)展算法43的基礎(chǔ)上。用于蛋白質(zhì)設(shè)計的簇擴(kuò)展是一種將復(fù)雜的三維原子級能量函數(shù)(是原子坐標(biāo)的函數(shù))映射到僅依賴于序列的簡單線性函數(shù)的技術(shù)。因此,簇擴(kuò)展將輸入的物理能量模型映射為一個簡單得多的模型,然后可以使用整數(shù)線性規(guī)劃求解器來有效地找到新模型中的最佳序列。蛋白質(zhì)設(shè)計軟件OSPRREY3.0使用基于成本函數(shù)網(wǎng)絡(luò)(CFN)處理的最先進(jìn)組合優(yōu)化技術(shù),使找到全局最小序列的計算過程加速了幾個數(shù)量級44

相對于確定性優(yōu)化算法,隨機(jī)優(yōu)化算法實現(xiàn)更為簡單。盡管隨機(jī)優(yōu)化只是找到能量盡可能低的序列,不保證得到全局最優(yōu)解,但考慮到能量函數(shù)本身并不是百分之百準(zhǔn)確,并且能正確折疊成目標(biāo)結(jié)構(gòu)的序列不唯一,隨機(jī)優(yōu)化找到的低能量序列和真正的全局能量最低序列實際上是同等有效的。用Monte Carlo模擬退火進(jìn)行隨機(jī)優(yōu)化的簡單算法為:從隨機(jī)選擇的初始序列出發(fā);計算當(dāng)前序列能量,每步隨機(jī)突變一個或多個位點的殘基,計算能量變化;根據(jù)能量變化值和Metropolis判據(jù)決定接受或拒絕突變;反復(fù)迭代該步驟,至能量不再降低。使用Metropolis判據(jù)導(dǎo)致降低能量的突變均會被接受,而使能量升高的突變有一定概率會被接受。該判據(jù)中使用“溫度”作為參數(shù)來度量能量變化的大小。選擇高溫參數(shù)時能量被容許發(fā)生大的漲落,而低溫時能量降低到局部極小值附近后漲落很小。在模擬退火優(yōu)化中,模擬從高溫開始,以消除初始序列中大范圍的不合理成分,然后逐步降低溫度,以更精確地確定能量極小序列。

2.1.3 考慮主鏈結(jié)構(gòu)的柔性

相似但不完全一樣的氨基酸序列折疊形成的穩(wěn)定主鏈結(jié)構(gòu)也是相近的,但不完全一樣。在序列設(shè)計中考慮主鏈骨架柔性,可能可以增加設(shè)計結(jié)果的多樣性,找到更多能滿足設(shè)計目標(biāo)的結(jié)果。另外,由于能量計算依賴于結(jié)構(gòu),如果能精細(xì)處理與序列改變相對應(yīng)的主鏈結(jié)構(gòu)變化,可以更精確地計算給定氨基酸序列的能量。后者對準(zhǔn)確設(shè)計分子間相互作用界面可能非常重要,因為對分子間特異性識別非常重要的氫鍵、鹽橋等特異性相互作用更精細(xì)地依賴于三維結(jié)構(gòu)。目前還沒有各方面都比較好的處理主鏈結(jié)構(gòu)柔性的方法,現(xiàn)有處理方法可分為考慮單一主鏈構(gòu)象態(tài)的柔性擾動的方法,以及基于多主鏈結(jié)構(gòu)設(shè)計序列的方法。

(1)考慮對單一主鏈構(gòu)象態(tài)柔性擾動的方法

受實驗觀察到的蛋白質(zhì)晶體結(jié)構(gòu)中主鏈構(gòu)象局部漲落模式的啟發(fā),Davis等31提出了一種主鏈原子協(xié)同變化模式,稱為backrub。在該模式下,相鄰三個殘基的主鏈原子的坐標(biāo)變化依賴于同一個參數(shù)。在Rosetta全原子力場的背景下,Smith等45研究了使用backrub move來進(jìn)行構(gòu)象采樣的方法。Frappier等35也同樣利用這一方法來設(shè)計與特定配體結(jié)合的蛋白質(zhì)。在設(shè)計過程中,他們考慮配體相對于蛋白質(zhì)的可能旋轉(zhuǎn)和平移,同時考慮蛋白質(zhì)主鏈原子的協(xié)同運動,將這些對蛋白質(zhì)和配體坐標(biāo)的操作結(jié)合起來,稱之為coupled moves。為了考慮氨基酸側(cè)鏈的改變,他們根據(jù)主鏈構(gòu)象變化,計算移動的主鏈片段上每個潛在突變或側(cè)鏈構(gòu)象的能量變化,根據(jù)Boltzmann分布計算每個潛在突變或側(cè)鏈構(gòu)象的概率,用于選擇側(cè)鏈構(gòu)象。

(2)基于多主鏈結(jié)構(gòu)設(shè)計序列的方法

這類方法常常被稱為基于結(jié)構(gòu)系綜的設(shè)計方法,這里“系綜”是指多個主鏈結(jié)構(gòu)的集合。按統(tǒng)計熱力學(xué)理論,同樣的序列能夠形成的主鏈結(jié)構(gòu)并不是唯一的,只是不同的主鏈結(jié)構(gòu)具有不同的概率。系綜方法用多個主鏈結(jié)構(gòu)來代表目標(biāo)結(jié)構(gòu)的概率分布,同時優(yōu)化序列處于多個目標(biāo)結(jié)構(gòu)狀態(tài)的能量,因此又被稱為多狀態(tài)設(shè)計。由于計算量較大,可包含在系綜中的主鏈構(gòu)象數(shù)目一般不能太多。在蛋白質(zhì)與小分子配體界面設(shè)計中,基于對結(jié)構(gòu)柔性的考慮,Lanouette等46通過構(gòu)建主鏈結(jié)構(gòu)系綜進(jìn)行多狀態(tài)設(shè)計來預(yù)測SMYD2蛋白的底物識別空間。除此之外,Hilpert等47開發(fā)了一種新的多特異性算法,即設(shè)計能與不同配體分子結(jié)合的單個目標(biāo)蛋白。在該算法中,處于復(fù)合物狀態(tài)的蛋白質(zhì)剛開始被冗余設(shè)計為具有不同的序列;隨著設(shè)計推進(jìn),越來越多的位置被根據(jù)前期設(shè)計結(jié)果約束為相同的殘基類型占據(jù),從而使設(shè)計結(jié)果逐步收斂到單一序列;最后通過貪婪選擇算法(greedy selection algorithm)進(jìn)行最終單一序列優(yōu)化。

2.2 主鏈結(jié)構(gòu)設(shè)計方法

主鏈結(jié)構(gòu)設(shè)計方法可分為兩大類(圖5)。一類是啟發(fā)式的主鏈設(shè)計方法,它使用天然片段進(jìn)行拼接,拼接時可用參數(shù)化的模型去約束整體結(jié)構(gòu),搭建出原子水平的主鏈模型,然后再用原子水平的能量函數(shù)進(jìn)行主鏈優(yōu)化。因為使用原子水平的能量函數(shù),優(yōu)化時需要考慮側(cè)鏈的原子,所以是在預(yù)設(shè)側(cè)鏈的基礎(chǔ)上進(jìn)行迭代設(shè)計。另一類是使用不依賴于側(cè)鏈的能量函數(shù)進(jìn)行主鏈設(shè)計方法,這類方法可用于在序列待定的條件下進(jìn)行主鏈結(jié)構(gòu)的采樣和優(yōu)化。

圖5

圖5   兩種主鏈設(shè)計策略

Fig. 5   Two backbone design strategies(Up, Splicing with the native fragment into a new backbone. Down, Main chain design methods for optimizing statistical energy functions)


2.2.1 啟發(fā)式的主鏈設(shè)計方法

保證主鏈的局部結(jié)構(gòu)具有高“可設(shè)計性”的一種常用方法是用天然存在的蛋白質(zhì)片段來拼接組裝新的主鏈48,除了提供良好的二級結(jié)構(gòu)之外,這些片段還可以包含在二級結(jié)構(gòu)的起始和終止處高可設(shè)計性的結(jié)構(gòu)模式。此外,對結(jié)構(gòu)單元之間的堆積可采用參數(shù)化的模型:通過少量的參數(shù)來描述經(jīng)驗觀察到的各類蛋白質(zhì)結(jié)構(gòu)單元之間的堆積特征,用于對片段拼接產(chǎn)生的主鏈結(jié)構(gòu)進(jìn)行約束?;谔囟ńY(jié)構(gòu)的參數(shù)化模型,可以快速生成大量蛋白質(zhì)骨架。值得一提的是,這種方法對于卷曲螺旋蛋白(由圍繞超螺旋中心軸的兩個或多個α-螺旋組成)的設(shè)計特別適用,最新應(yīng)用包括跨膜蛋白4950和α-螺旋桶51的從頭設(shè)計等。這種啟發(fā)式的主鏈設(shè)計方法的優(yōu)點在于簡明,適用于設(shè)計理想的主鏈結(jié)構(gòu)。然而也正因為使用了天然結(jié)構(gòu)片段,它難以用于設(shè)計復(fù)雜的、非理想的主鏈結(jié)構(gòu)。

Rosetta作為一種啟發(fā)式的主鏈設(shè)計方法使用了序列能量和主鏈能量相耦合的全原子能量函數(shù),這意味著只有在假設(shè)序列已給定時才能進(jìn)行主鏈設(shè)計與優(yōu)化,因此Rosetta實際采用預(yù)定序列的迭代策略(假定序列-優(yōu)化主鏈-重新設(shè)計序列-優(yōu)化主鏈)進(jìn)行優(yōu)化,這增加了對計算量的要求。

2.2.2 使用不依賴于側(cè)鏈的能量函數(shù)進(jìn)行主鏈設(shè)計

根據(jù)上述關(guān)于啟發(fā)式的主鏈設(shè)計方法的分析,若能設(shè)計出一個通用的不依賴于側(cè)鏈的主鏈能量函數(shù),則在設(shè)計主鏈時將會更加自由。構(gòu)建這類能量模型的途徑之一是將前述統(tǒng)計能量函數(shù)的原理應(yīng)用于天然蛋白結(jié)構(gòu)數(shù)據(jù)庫。早期,MacDonald等52發(fā)展了基于α-C原子的能量函數(shù)來模擬主鏈的局部構(gòu)象(即一段連續(xù)殘基的主鏈構(gòu)象)。在不依賴側(cè)鏈的條件下,此能量函數(shù)的一些低能量結(jié)構(gòu)仍與實驗結(jié)構(gòu)相似,說明能量高低能在一定程度上反映可設(shè)計性高低。該模型在描述序列上距離較遠(yuǎn)的主鏈堆積時使用了非常簡單的函數(shù),因此其用于優(yōu)化完整主鏈時結(jié)果與實際主鏈結(jié)構(gòu)的差別比較大,不適用于下一步的序列設(shè)計。我們在稍早的工作中,報道了一種稱為tetraBASE的統(tǒng)計能量,可以用于優(yōu)化二級結(jié)構(gòu)單元之間的主鏈堆積11。 該能量模型假設(shè)這種空間堆積相互作用依賴于二級結(jié)構(gòu)類型、殘基主鏈的相對取向以及原子間距離。計算結(jié)果表明,在不指定二級結(jié)構(gòu)單元的氨基酸序列的情況下,通過Monte Carlo模擬退火優(yōu)化不同二級結(jié)構(gòu)單元之間的相對位置,可以原子水平均方誤差1.5~2.5 ?(1?=10-10 m)的精度再現(xiàn)天然蛋白中二級結(jié)構(gòu)的三維排列。這說明基于優(yōu)化統(tǒng)計能量函數(shù)得到高可設(shè)計性的原子水平的三維主鏈結(jié)構(gòu)模型是可能的。然而,tetraBASE能量函數(shù)不是連續(xù)、解析可導(dǎo)的,它也不包含描述二級結(jié)構(gòu)單元內(nèi)部柔性或環(huán)區(qū)構(gòu)象的能量項,用它還無法實現(xiàn)主鏈完全柔性的構(gòu)象設(shè)計。最近,我們建立了一套完整描述柔性主鏈結(jié)構(gòu)的統(tǒng)計能量函數(shù),其中側(cè)鏈主要作為空間位阻的保持者參與其中,因此只需使用簡化的序列即可進(jìn)行主鏈的采樣和優(yōu)化。我們把這個模型稱為SCUBA(side chain unspecialized backbone arrangement,待發(fā)表)。SCUBA使用神經(jīng)網(wǎng)絡(luò)能量項來反映在高可設(shè)計性結(jié)構(gòu)中多種幾何結(jié)構(gòu)參數(shù)間的相互依賴關(guān)系,同時保證能量對原子坐標(biāo)是連續(xù)解析可導(dǎo)的,從而適用于隨機(jī)動力學(xué)模擬等成熟的分子構(gòu)象模擬采樣方法。在初步驗證中,我們已得到一例實例,用SCUBA設(shè)計主鏈后再用ABACUS進(jìn)行序列設(shè)計,得到的蛋白質(zhì)實驗結(jié)構(gòu)符合預(yù)期(待發(fā)表)。SCUBA提供了一種新的、在序列全部或部分待定的情況下對高可設(shè)計性主鏈結(jié)構(gòu)進(jìn)行采樣和優(yōu)化的方法。用SCUBA進(jìn)行結(jié)構(gòu)設(shè)計可充分考慮主鏈柔性,從而可能推動配體結(jié)合蛋白、酶、蛋白相互作用界面設(shè)計等功能蛋白設(shè)計的發(fā)展。

2.3 蛋白質(zhì)分子間相互作用界面的設(shè)計方法

一種蛋白質(zhì)的功能在很大程度上是由它與其他特定蛋白質(zhì)或特定小分子的特異性識別所決定的。把蛋白質(zhì)從頭設(shè)計的基本算法進(jìn)行一些針對性的調(diào)整后,可應(yīng)用于設(shè)計特異的分子間相互作用。目前已有一些設(shè)計成功的例子報道,盡管大多數(shù)從頭設(shè)計的分子相互作用的親和力相對于天然相互作用而言還不是太高。

2.3.1 設(shè)計蛋白質(zhì)-蛋白質(zhì)間的相互作用界面

這類界面一般位于蛋白質(zhì)表面。設(shè)計的基本步驟如圖6所示,首先設(shè)計與目標(biāo)受體(綠色)形成復(fù)合物的配體蛋白的主鏈構(gòu)象(紅色),再設(shè)計和優(yōu)化配體蛋白界面的殘基類型,從而得到最終設(shè)計結(jié)果(藍(lán)色)。設(shè)計復(fù)合物主鏈結(jié)構(gòu)時,要考慮的首要特性是兩個表面幾何形狀的互補(bǔ)性。如果要從頭設(shè)計新的相互作用界面,這個性質(zhì)可在表面殘基類型待定的前提下,用來指導(dǎo)分子對接等算法,確定兩個分子主鏈骨架之間的相對位置和取向,即復(fù)合物的主鏈結(jié)構(gòu)。如果是對已有復(fù)合物界面進(jìn)行序列重設(shè)計,則可以使用原始復(fù)合物的主鏈結(jié)構(gòu)??傮w而言,復(fù)合物主鏈結(jié)構(gòu)設(shè)計采用啟發(fā)式分子對接的方案居多,盡管目前采用這些方案能得到的界面往往達(dá)不到預(yù)期的相互作用密度53

圖6

圖6   蛋白質(zhì)-蛋白質(zhì)界面設(shè)計的基本步驟

Fig. 6   Basic steps of protein-protein interface design[The backbone conformation of the ligand protein (red) in complex with the target receptor (green) is first designed,then the residue types at the ligand protein interface are designed and optimized, resulting in the final design result (blue)]


在確定復(fù)合物主鏈結(jié)構(gòu)后,可以用自動優(yōu)化的方法重新設(shè)計界面處的氨基酸序列18。界面序列設(shè)計的一個主要困難是界面殘基間的相互作用既包括疏水相互作用,也存在大量氫鍵、鹽橋等極性相互作用。其中疏水相互作用對親和力的絕對貢獻(xiàn)很大,但缺乏特異性。而極性相互作用是保證相互作用特異性的主要因素。關(guān)于蛋白質(zhì)分子間界面殘基分布的一個流行的模型是“O型環(huán)”,環(huán)的中心是疏水殘基緊密堆積形成的核,該核被極性相互作用殘基環(huán)繞。目前,對殘基間極性相互作用設(shè)計的準(zhǔn)確度還不高。如何利用界面的各類序列特征從頭設(shè)計親和力和特異性媲美天然界面的人工蛋白相互作用界面,仍然是十分大的挑戰(zhàn)。另一種設(shè)計思路,是把天然蛋白質(zhì)復(fù)合物中反復(fù)出現(xiàn)的界面結(jié)構(gòu)模式“移植”到其他表面。比較典型的是平行或反平行堆積的螺旋產(chǎn)生的蛋白界面。這樣的界面多肽主鏈結(jié)構(gòu)規(guī)則,殘基側(cè)鏈間形成的規(guī)則氫鍵網(wǎng)絡(luò)被成功“移植”的可能性更高。

2.3.2 設(shè)計小分子配體識別口袋

對酶、別構(gòu)蛋白等,小分子配體結(jié)合口袋是其功能中心。特異性識別口袋的設(shè)計是功能蛋白質(zhì)設(shè)計的重點。一種“由內(nèi)向外”(inside-out)的基本設(shè)計思路是9:首先設(shè)計一個或多個由圍繞目標(biāo)配體的孤立殘基組成的虛擬口袋結(jié)構(gòu),這些殘基的位置和構(gòu)象使其能夠以最有利的方式與配體發(fā)生相互作用;下一步是用虛擬口袋篩選能夠提供這樣一個口袋結(jié)構(gòu)的蛋白質(zhì)骨架(RosettaMatch算法假設(shè)給定主鏈骨架不變,找到能與構(gòu)成虛擬口袋的殘基位置達(dá)到最佳幾何匹配的一組骨架位點54);接著,通過篩選大量主鏈骨架,得到最佳匹配的主鏈骨架以及相應(yīng)的口袋殘基定位組合;最后,把虛擬口袋轉(zhuǎn)移到篩選出的蛋白骨架中后,可對口袋附近的殘基再進(jìn)行重新設(shè)計和優(yōu)化。

2.3.3 設(shè)計氫鍵網(wǎng)絡(luò)

無論是蛋白質(zhì)-蛋白質(zhì)相互作用界面還是小分子結(jié)合口袋,分子間氫鍵網(wǎng)絡(luò)對在保證高親和力的同時維持相互作用的高特異性具有重要意義。氫鍵網(wǎng)絡(luò)設(shè)計的困難之一是其形成需要多個位點的殘基類型和側(cè)鏈構(gòu)象的協(xié)同變化。Boyken等55在2016年開發(fā)出一種計算方法HBNet更充分地組合搜索殘基類型和側(cè)鏈構(gòu)象,以快速枚舉基于給定主鏈結(jié)構(gòu)可能實現(xiàn)的所有側(cè)鏈氫鍵網(wǎng)絡(luò)。HBNet首先對所有極性側(cè)鏈對應(yīng)的所有構(gòu)象(rotamer)之間的氫鍵和空間排斥相互作用進(jìn)行預(yù)先計算。HBNet的方法在2018年得到了改進(jìn)形成MC HBNet56,使氫鍵網(wǎng)絡(luò)的設(shè)計與計算速度更快。序列設(shè)計中保持主鏈結(jié)構(gòu)固定對設(shè)計氫鍵網(wǎng)絡(luò)有不利影響,未來可結(jié)合考慮主鏈柔性的設(shè)計技術(shù)來進(jìn)行氫鍵網(wǎng)絡(luò)設(shè)計。

2.4 負(fù)設(shè)計方法

蛋白質(zhì)結(jié)構(gòu)和功能并不直接取決于與單一結(jié)構(gòu)狀態(tài)對應(yīng)的絕對自由能,而是取決于目標(biāo)狀態(tài)相對于其他狀態(tài)的自由能差。例如,蛋白質(zhì)折疊的穩(wěn)定性取決于正確折疊態(tài)相對于非折疊態(tài)、錯誤折疊態(tài)、聚集態(tài)等的自由能差;分子間結(jié)合的親和力取決于結(jié)合態(tài)相對于游離態(tài)的自由能差,等等。由于技術(shù)上的因素,絕大多數(shù)蛋白質(zhì)計算設(shè)計僅考慮在目標(biāo)結(jié)構(gòu)狀態(tài)下去優(yōu)化氨基酸序列,以盡可能降低目標(biāo)結(jié)構(gòu)狀態(tài)的自由能。這種聚焦于提高目標(biāo)結(jié)構(gòu)狀態(tài)穩(wěn)定性的設(shè)計思路被稱為正設(shè)計(圖7)。另一種可能的設(shè)計思路,則是提高目標(biāo)狀態(tài)之外其他結(jié)構(gòu)狀態(tài)的自由能,降低它們相對于目標(biāo)結(jié)構(gòu)的穩(wěn)定性。這種思路被稱為負(fù)設(shè)計(圖7)。負(fù)設(shè)計機(jī)制被認(rèn)為在天然蛋白質(zhì)序列進(jìn)化過程中普遍存在57。如果要在蛋白質(zhì)設(shè)計中自動地考慮負(fù)設(shè)計,需要進(jìn)行多狀態(tài)設(shè)計,并引入目標(biāo)狀態(tài)之外的結(jié)構(gòu)狀態(tài),通過改變序列使設(shè)計蛋白的目標(biāo)結(jié)構(gòu)和可能的競爭結(jié)構(gòu)有明顯的能量差距,這樣設(shè)計出的氨基酸序列可以很容易地折疊為目標(biāo)結(jié)構(gòu)。而且僅僅關(guān)注目標(biāo)結(jié)構(gòu)并通過改變序列降低其能量有時可能不會改善目標(biāo)蛋白質(zhì)結(jié)構(gòu)的折疊性,例如對于能量簡并的競爭結(jié)構(gòu)(蛋白質(zhì)-蛋白質(zhì)相互作用和螺旋低聚體)很容易產(chǎn)生的情況。所以需要考慮在降低目標(biāo)結(jié)構(gòu)能量的同時盡量提高其與其他狀態(tài)結(jié)構(gòu)的能量差距。

圖7

圖7   正設(shè)計與負(fù)設(shè)計

Fig. 7   Positive design versus negative design(Positive design only considers decreasing target state energy and does not consider other states. Negative design then needs to raise the energy of the other states so that their energy differences from the target state increase)


Hallen等38在2017年提出了一種多態(tài)蛋白質(zhì)設(shè)計的通用程序,使用一個“適應(yīng)度函數(shù)”來根據(jù)序列滿足特定設(shè)計任務(wù)目標(biāo)的程度來對多態(tài)蛋白質(zhì)進(jìn)行排名。通過首先將單個序列匹配到多個狀態(tài),計算該序列在每個狀態(tài)上的能量,之后將這些能量合并以產(chǎn)生單個值,來評估適應(yīng)度函數(shù)。通過每次迭代的多態(tài)設(shè)計,降低目標(biāo)構(gòu)象態(tài)的能量,擴(kuò)大非目標(biāo)態(tài)構(gòu)象集的能量,最終達(dá)到多態(tài)設(shè)計的準(zhǔn)確性。在2017年他們又將多種多態(tài)設(shè)計方法與Rosetta結(jié)合形成“Rosetta:MSF”,一種用于多狀態(tài)計算蛋白質(zhì)設(shè)計的模塊化框架58。對有些問題,例如相互作用界面設(shè)計,基于多態(tài)設(shè)計引入負(fù)設(shè)計有一定的可行性。例如,為了增加蛋白質(zhì)-蛋白質(zhì)相互作用的特異性,可以利用負(fù)設(shè)計并懲罰那些有利于不良相互作用的序列。但是,需要考慮的蛋白質(zhì)分子可能結(jié)構(gòu)狀態(tài)常常太多,這種顯式考慮非目標(biāo)狀態(tài)進(jìn)行負(fù)設(shè)計的方法至今沒有較理想的策略,沒有得到廣泛應(yīng)用。盡管如此,負(fù)設(shè)計作為一種概念和思想,仍然可以用來定性分析和比較不同的正設(shè)計結(jié)果。例如,全疏水的界面和親/疏水組合的界面相比,后者可能功能上更優(yōu);實際上并非所有蛋白質(zhì)設(shè)計任務(wù)都可以通過優(yōu)化單個結(jié)構(gòu)的序列來建模。

3 蛋白質(zhì)計算設(shè)計應(yīng)用

隨著蛋白質(zhì)計算設(shè)計技術(shù)的發(fā)展,在合成生物學(xué)、生物醫(yī)學(xué)等領(lǐng)域逐步出現(xiàn)了相關(guān)的應(yīng)用。本節(jié)中我們不區(qū)分從頭設(shè)計和既有蛋白質(zhì)改造,主要按設(shè)計目的不同分以下三類介紹不同的應(yīng)用研究:通過蛋白質(zhì)設(shè)計提高目標(biāo)結(jié)構(gòu)的穩(wěn)定性;設(shè)計特異性的蛋白質(zhì)小分子相互作用(包括酶活性中心);設(shè)計蛋白質(zhì)分子間的特異性識別。

3.1 目標(biāo)結(jié)構(gòu)穩(wěn)定性的提升

基于能量函數(shù)優(yōu)化序列,常常獲得結(jié)構(gòu)穩(wěn)定性非常高的設(shè)計蛋白。因此,蛋白質(zhì)計算設(shè)計被用于指導(dǎo)蛋白質(zhì)工程,改善天然蛋白的結(jié)構(gòu)穩(wěn)定性。另一個應(yīng)用是疫苗設(shè)計,通過設(shè)計額外的主鏈骨架來維持抗原肽段的已知三維空間構(gòu)象。此外,還可以通過序列重設(shè)計提高蛋白質(zhì)在特定環(huán)境條件下的結(jié)構(gòu)穩(wěn)定性,如將膜蛋白改造為水溶性蛋白。以下將這幾類應(yīng)用分別舉例說明。

Mu等3利用Wijma等59提出的FRESCO方案來提高酶穩(wěn)定性。以黑曲霉葡萄糖氧化酶為突變對象,不僅根據(jù)FRESCO方案,使用FoldX和Rosetta_ddg計算能量,還利用ABACUS進(jìn)行能量計算,通過設(shè)定閾值來尋找遠(yuǎn)離活性位點的潛在穩(wěn)定性突變位點。隨后通過人工觀察和分子動力學(xué)模擬來篩選突變集合,將提升穩(wěn)定性的突變選項整合起來,最終得到多個穩(wěn)定突變體。與野生型相比,突變體能夠耐受更廣泛的溫度和pH范圍,并且顯示出的催化活性更高,最好的突變體耐受溫度較野生型提高了8.5 ℃,該突變體也在野生型會快速失活的pH6.0和pH7.0展現(xiàn)了更好的耐受性。Correia等60利用已知抗原結(jié)構(gòu)來定義疫苗的功能構(gòu)象,設(shè)計了穩(wěn)定該構(gòu)象的目標(biāo)拓?fù)浣Y(jié)構(gòu),而后用基于片段組裝的方法從頭設(shè)計出符合該拓?fù)浣Y(jié)構(gòu)的骨架,經(jīng)過多輪的序列設(shè)計和主鏈優(yōu)化的迭代,最終篩選出合理的結(jié)果并進(jìn)行了實驗驗證。Marcandalli等61通過設(shè)計蛋白質(zhì)自組裝納米顆粒作為骨架來固定并呈遞病毒性糖蛋白抗原復(fù)合物,從而在可控密度的條件下呈遞此病毒抗原,實現(xiàn)疫苗的定制設(shè)計。Sesterhenn等62建立了TopoBuilder系統(tǒng),借此來從頭設(shè)計能穩(wěn)定復(fù)雜結(jié)構(gòu)模體的蛋白質(zhì)。通過這個系統(tǒng),他們設(shè)計了能同時呈遞三種抗原的蛋白,其設(shè)計方法為:針對不同的且結(jié)構(gòu)復(fù)雜的抗原位點,首先在二維空間上列舉適合的蛋白拓?fù)浣Y(jié)構(gòu),并使用理想的二級結(jié)構(gòu)單元和參數(shù)化設(shè)置將此二維空間投影至三維空間。通過這種方式,即可在不依賴模板的條件下設(shè)計所需的主鏈結(jié)構(gòu)。

膜蛋白難以表達(dá),且難以獲得高分辨晶體結(jié)構(gòu),Slovic等63對鉀離子通道蛋白的表面進(jìn)行位點突變設(shè)計,得到了其水溶性類似物。熒光蛋白的寡聚化是熒光蛋白應(yīng)用的重要障礙,Wannier等64通過表面突變設(shè)計和主鏈依賴的側(cè)鏈rotamer采樣優(yōu)化,得到了保持光強(qiáng)、不易聚集的紅色熒光蛋白。

3.2 蛋白質(zhì)-小分子相互作用的設(shè)計

通過重設(shè)計小分子結(jié)合界面,可以獲得新的酶等催化元件、轉(zhuǎn)錄因子、熒光蛋白等化學(xué)感受元件。Banda-Vazquez等65通過口袋遷移(將一個天然口袋移植到另一個主鏈骨架上)和基于統(tǒng)計配對位置的搜索方法(獲得與口袋殘基突變關(guān)聯(lián)但遠(yuǎn)離口袋的殘基),對小分子結(jié)合蛋白LAOBP進(jìn)行重設(shè)計,使其成為谷氨酰胺的結(jié)合蛋白。Glasgow等66參考了天然法尼基焦磷酸鹽(FPP)-蛋白復(fù)合物模板,人工篩選了FPP的結(jié)合口袋模體(僅包含4個殘基),而后通過與大量骨架界面對接、柔性骨架(骨架系綜法)優(yōu)化和序列設(shè)計的方法,設(shè)計了被FPP調(diào)節(jié)的生物效應(yīng)器。為了設(shè)計能與高度缺電子的卟啉分子結(jié)合的非天然蛋白,Polizzi等67通過數(shù)學(xué)參數(shù)化模型從頭建立了反平行卷曲螺旋主鏈,并利用骨架系綜法進(jìn)行了柔性骨架設(shè)計??紤]到除了口袋位點以外,蛋白質(zhì)核心區(qū)域的殘基也可能會對其結(jié)合功能有影響,作者對所有內(nèi)部殘基和口袋位點進(jìn)行了序列重設(shè)計,而非僅設(shè)計第一、二殼層的接觸殘基,最終設(shè)計出了高度熱穩(wěn)定的卟啉結(jié)合蛋白PS1。Dou等68在使用參數(shù)化方法首次成功從頭設(shè)計β-桶蛋白的基礎(chǔ)上,將其空腔與生色團(tuán)3,5-二氟-4-羥基亞芐基-咪唑啉酮進(jìn)行對接設(shè)計,得到了從頭設(shè)計的熒光蛋白。Li等4通過底物結(jié)合口袋的重設(shè)計,將芽孢桿菌YM55-1天冬氨酸酶狹窄的催化底物范圍拓展到作為互補(bǔ)氫胺化反應(yīng),且對底物耐受性最高達(dá)到300g/L,定向改變了芽孢桿菌YM55-1天冬氨酸酶的催化功能。

3.3 蛋白分子間的特異性識別設(shè)計

Leaver-Fay等69、Froning70提出了設(shè)計雙特異性抗體的方法,使用多狀態(tài)設(shè)計策略,并考慮引入非目標(biāo)狀態(tài)進(jìn)行負(fù)設(shè)計。Silva等71從頭設(shè)計了一個有著天然細(xì)胞因子結(jié)合位點,然而拓?fù)浣Y(jié)構(gòu)和序列都不同于天然蛋白的人工細(xì)胞因子,此設(shè)計蛋白只結(jié)合天然白細(xì)胞介素-2的部分受體,卻不結(jié)合其他受體,隔絕了對部分下游細(xì)胞信號的影響。Chen等72通過用參數(shù)化的方法從頭設(shè)計螺旋主鏈骨架,并建立氫鍵網(wǎng)絡(luò)、環(huán)區(qū)的連接,進(jìn)行序列優(yōu)化,獲得多組具有特異性異源二聚能力的蛋白對,并用它們構(gòu)建了蛋白質(zhì)邏輯門73。Langan等74針對信號通路中天然存在的相互作用蛋白,將控制蛋白功能的“籠子”、“插銷”和“鑰匙”分別設(shè)計于蛋白相互作用界面上,通過界面設(shè)計實現(xiàn)了調(diào)節(jié)某對蛋白相互作用的人工蛋白開關(guān)設(shè)計,并把這一設(shè)計用于內(nèi)源性信號通路的反饋控制75

蛋白質(zhì)分子間的特異性識別設(shè)計也牽涉到組裝體的設(shè)計,其可以應(yīng)用于新材料領(lǐng)域。Shen等76進(jìn)行了蛋白質(zhì)自組裝體的從頭設(shè)計,使其可以聚集成微米級的細(xì)絲。他們首先建立了一個纖維片段,隨后通過旋轉(zhuǎn)平移形成參數(shù)化的螺旋結(jié)構(gòu),再在這個骨架基礎(chǔ)上進(jìn)行序列設(shè)計。根據(jù)纖維片段和旋轉(zhuǎn)平移等參數(shù)的變化,可以形成大量不同的蛋白,這一設(shè)計策略有助于推動一系列多尺度超材料的制造。King等77更新了Rosetta的對稱建??蚣躷cdock,用來模擬高度有序?qū)ΨQ的蛋白質(zhì)支架對的對接,依據(jù)每一個對接構(gòu)型對界面設(shè)計的實用性打分,最后使用負(fù)染電鏡等手段對設(shè)計出的蛋白質(zhì)的組裝狀態(tài)進(jìn)行X射線晶體學(xué)分析,結(jié)果表明設(shè)計出的組裝體材料與理論值的RMSD偏差在0.5~1.2 ?,證明了這種方法對界面幾何形狀有著精確的控制,并且能夠高精度地設(shè)計具有多種納米級特征的雙組分蛋白質(zhì)納米材料。Fallas等78采用類似于軟質(zhì)心模型的Monte Carlo Sampling,首先生成用于對接的主鏈模型,然后使用骨架原子的坐標(biāo)和二級結(jié)構(gòu)元件來對蛋白質(zhì)-蛋白質(zhì)對接進(jìn)行打分,最后使用全原子Rosetta Design25計算優(yōu)化蛋白質(zhì)-蛋白質(zhì)界面序列,結(jié)果表明所設(shè)計的蛋白質(zhì)在溶液中穩(wěn)定地形成均聚物。

4 展 望

蛋白質(zhì)計算設(shè)計把我們對蛋白質(zhì)序列-結(jié)構(gòu)-功能關(guān)系的生物物理認(rèn)識和數(shù)學(xué)模型、計算方法等綜合在一起,逐漸形成了一套系統(tǒng)的理論和方法學(xué),并得到越來越多的實驗驗證,展示出廣泛應(yīng)用前景,是合成生物學(xué)的重要使能技術(shù)之一。

蛋白質(zhì)計算設(shè)計的發(fā)展和應(yīng)用仍然處于初級階段。從方法上來講,主鏈結(jié)構(gòu)和功能的從頭設(shè)計的效果還有很大提升空間。已有的關(guān)于主鏈的設(shè)計方法,一般是基于天然片段進(jìn)行主鏈設(shè)計,亦或是對規(guī)則結(jié)構(gòu)進(jìn)行參數(shù)化設(shè)計。而當(dāng)前的能量函數(shù)還不能完全做到主鏈的全自動從頭設(shè)計,對極性相互作用的定量刻畫還不夠準(zhǔn)確?;趓otamer的構(gòu)象表示方法為極性相互作用的定量化帶來困難:離散rotamer對側(cè)鏈原子位置引入較大誤差,不能準(zhǔn)確地進(jìn)行氫鍵網(wǎng)絡(luò)設(shè)計。未來方法進(jìn)一步發(fā)展的關(guān)鍵包括對主鏈設(shè)計能量模型和側(cè)鏈極性相互作用模型的改進(jìn)。

由于蛋白質(zhì)并非孤立存在的,這既體現(xiàn)為蛋白質(zhì)的功能往往與其他生物分子(如磷脂雙分子層)互作有關(guān),也體現(xiàn)為細(xì)胞內(nèi)外環(huán)境(如pH)為蛋白質(zhì)提供的復(fù)雜溶劑環(huán)境。而目前的設(shè)計方法中,往往是將其他小分子視做剛體進(jìn)行對接,并將蛋白質(zhì)周圍環(huán)境進(jìn)行簡化估計。盡管這些簡化模型是出于對效率的考量,它們在實際應(yīng)用中對成功率的影響也是不能忽視的。目前已有關(guān)于將pH79-80、磷脂雙分子層22,81-83等方面因素引入蛋白質(zhì)設(shè)計的分析。這些嘗試有望拓寬蛋白質(zhì)計算設(shè)計方法的應(yīng)用領(lǐng)域,也有望提高蛋白質(zhì)設(shè)計的合理性和成功率。此外,如何在蛋白質(zhì)計算設(shè)計的整體框架中考慮和處理負(fù)設(shè)計,也是未來方法研究的要點之一。

同時,由于蛋白質(zhì)-蛋白質(zhì)界面的形狀和化學(xué)特征的極端多樣性,確定蛋白質(zhì)的識別位點和能量熱點的簡單策略一般不會很有效84。因此,建立起氫鍵和靜電相互作用易于計算的描述,對于蛋白質(zhì)-蛋白質(zhì)界面的能量函數(shù)的充分建模非常重要。一個相關(guān)的挑戰(zhàn)是建立合理的水分子模型,這些水分子通常在蛋白質(zhì)界面上形成水介導(dǎo)氫鍵的延伸網(wǎng)絡(luò),而標(biāo)準(zhǔn)的隱式溶劑化模型無法捕捉到這些網(wǎng)絡(luò)85。除了能量函數(shù),在主鏈柔韌性的建模方面也存在缺陷。解決這些問題對于基于結(jié)構(gòu)的蛋白質(zhì)相互作用特異性的深刻理解和預(yù)測至關(guān)重要。因此還需要通過更精確的建模技術(shù)生成詳細(xì)和精確的結(jié)構(gòu)模型來模擬界面85


《合成生物學(xué)》|蛋白質(zhì)計算設(shè)計:方法和應(yīng)用展望


參考文獻(xiàn) 
[1]
KUHLMAN B, BRADLEY P.
Advances in protein structure prediction and design


[J]. Nature Reviews Molecular Cell Biology, 2019, 20(11): 681-697.
[本文引用: 1]


[2]
HUANG P S, BOYKEN S E, BAKER D.
The coming of age of de novo protein design


[J]. Nature, 2016, 537(7620): 320-327.


[3]
MU Q, CUI Y, TIAN Y, et al.
Thermostability improvement of the glucose oxidase from Aspergillus niger for efficient gluconic acid production via computational design


[J]. International Journal of Biological Macromolecules, 2019, 136: 1060-1068.
[本文引用: 1]


[4]
LI R, WIJMA H J, SONG L, et al.
Computational redesign of enzymes for regio- and enantioselective hydroamination


[J]. Nature Chemical Biology, 2018, 14(7): 664-670.
[本文引用: 1]


[5]
ZHAN J, DING B, MA R, et al.
Develop reusable and combinable designs for transcriptional logic gates


[J]. Molecular Systems Biology, 2010, 6: 388.
[本文引用: 1]


[6]
PACKER M S, LIU D R.
Methods for the directed evolution of proteins


[J]. Nature Reviews Genetics, 2015, 16(7): 379-394.
[本文引用: 1]


[7]
LIU Y, YAN Z, LU X, et al.
Improving the catalytic activity of isopentenyl phosphate kinase through protein coevolution analysis


[J]. Scientific Reports, 2016, 6: 24117.
[本文引用: 1]


[8]
COLUZZA I.
Computational protein design: a review


[J]. Journal of Physics-Condensed Matter, 2017, 29(14): 143001.
[本文引用: 1]


[9]
KISS G, CELEBI-OLCUM N, MORETTI R, et al.
Computational enzyme design


[J]. Angewandte Chemie International Edition, 2013, 52(22): 5700-5725.
[本文引用: 1]


[10]
GOLDENZWEIG A, FLEISHMAN S J.
Principles of protein stability and their application in computational design


[J]. Annual Review of Biochemistry, 2018, 87: 105-129.


[11]
BARAN D, PSZOLLA M G, LAPIDOTH G D, et al.
Principles for computational design of binding antibodies


[J]. Proceedings of the National Academy of Sciences of the United States of America, 2017, 114(41): 10900-10905.
[本文引用: 2]


[12]
SUN M G, SEO M H, NIM S, et al.
Protein engineering by highly parallel screening of computationally designed variants


[J]. Science Advances, 2016, 2(7): e1600692.
[本文引用: 1]


[13]
KORENDOVYCH I V, DEGRADO W F.
De novo protein design, a retrospective


[J]. Quarterly Reviews of Biophysics, 2020, 53:e3.
[本文引用: 1]


[14]
LUPAS A N, BASSLER J.
Coiled coils - a model system for the 21st century


[J]. Trends in Biochemical Sciences, 2017, 42(2): 130-140.
[本文引用: 1]


[15]
HARBURY P B, PLECS J J, TIDOR B, et al.
High-resolution protein design with backbone freedom


[J]. Science, 1998, 282(5393): 1462-1467.


[16]
HUANG P S, OBERDORFER G, XU C, et al.
High thermodynamic stability of parametrically designed helical bundles


[J]. Science, 2014, 346(6208): 481-485.
[本文引用: 1]


[17]
MURPHY G S, SATHYAMOORTHY B, DER B S, et al.
Computational de novo design of a four-helix bundle protein-DND_4HB


[J]. Protein Science, 2015, 24(4): 434-445.
[本文引用: 1]


[18]
JOH N H, WANG T, BHATE M P, et al.
De novo design of a transmembrane Zn(2)(+)-transporting four-helix bundle


[J]. Science, 2014, 346(6216): 1520-1524.
[本文引用: 2]


[19]
LIANG H, CHEN H, FAN K, et al.
De novo design of a beta alpha beta motif


[J]. Angewandte Chemie International Edition, 2009, 48(18): 3301-3303.
[本文引用: 1]


[20]
GRIGORYAN G, DE GRADO W F.
Probing designability via a generalized model of helical bundle geometry


[J]. Journal of Molecular Biology, 2011, 405(4): 1079-1100.
[本文引用: 1]


[21]
DAHIYAT B I, SARISKY C A, MAYO S L.
De novo protein design: towards fully automated sequence selection


[J]. Journal of Molecular Biology, 1997, 273(4): 789-796.
[本文引用: 1]


[22]
LAZARIDIS T, KARPLUS M.
Effective energy functions for protein structure prediction


[J]. Current Opinion in Structural Biology, 2000, 10(2): 139-145.
[本文引用: 2]


[23]
PARK H, BRADLEY P, GREISEN P, JR., et al.
Simultaneous optimization of biomolecular energy functions on features from small molecules and macromolecules


[J]. Journal of Chemical Theory and Computation, 2016, 12(12): 6201-6212.


[24]
HUANG J, RAUSCHER S, NAWROCKI G, et al.
CHARMM36m: an improved force field for folded and intrinsically disordered proteins


[J]. Nature Methods, 2017, 14(1): 71-73.
[本文引用: 1]


[25]
ALFORD R F, LEAVER-FAY A, JELIAZKOV J R, et al.
The rosetta all-atom energy function for macromolecular modeling and design


[J]. Journal of Chemical Theory and Computation, 2017, 13(6): 3031-3048.
[本文引用: 4]


[26]
BOAS F E, HARBURY P B.
Potential energy functions for protein design


[J]. Current Opinion in Structural Biology, 2007, 17(2): 199-204.
[本文引用: 1]


[27]
XIONG P, WANG M, ZHOU X Q, et al.
Protein design with a comprehensive statistical energy function and boosted by experimental selection for foldability


[J]. Nature Communications, 2014, 5: 5330.
[本文引用: 3]


[28]
XIONG P, HU X H, HUANG B, et al.
Increasing the efficiency and accuracy of the ABACUS protein sequence design method


[J]. Bioinformatics, 2020, 36(1): 136-144.
[本文引用: 2]


[29]
KUHLMAN B, DANTAS G, IRETON G C, et al.
Design of a novel globular protein fold with atomic-level accuracy


[J]. Science, 2003, 302(5649): 1364-1368.
[本文引用: 1]


[30]
FRIEDLAND G D, KORTEMME T.
Designing ensembles in conformational and sequence space to characterize and engineer proteins


[J]. Current Opinion in Structural Biology, 2010, 20(3): 377-384.
[本文引用: 1]


[31]
DAVIS I W, ARENDALL W B, 3RD, RICHARDSON D C, et al.
The backrub motion: how protein backbone shrugs when a sidechain dances


[J]. Structure, 2006, 14(2): 265-274.
[本文引用: 2]


[32]
ZHOU X, XIONG P, WANG M, et al.
Proteins of well-defined structures can be designed without backbone readjustment by a statistical model


[J]. Journal of Structural Biology, 2016, 196(3): 350-357.
[本文引用: 1]


[33]
KOGA N, TATSUMI-KOGA R, LIU G, et al.
Principles for designing ideal protein structures


[J]. Nature, 2012, 491(7423): 222-227.
[本文引用: 1]


[34]
CHU H Y, LIU H Y.
TetraBASE: a side chain-independent statistical energy for designing realistically packed protein backbones


[J]. Journal of Chemical Information and Modeling, 2018, 58(2): 430-442.
[本文引用: 2]


[35]
FRAPPIER V, JENSON J M, ZHOU J, et al.
Tertiary structural motif sequence statistics enable facile prediction and design of peptides that bind anti-apoptotic Bfl-1 and Mcl-1


[J]. Structure, 2019, 27(4): 606-617, e5.
[本文引用: 2]


[36]
MACKENZIE C O, ZHOU J, GRIGORYAN G.
Tertiary alphabet for the observable protein structural universe


[J]. Proceedings of the National Academy of Sciences of the United States of America, 2016, 113(47): E7438-E7447.
[本文引用: 1]


[37]
OLLIKAINEN N, DE JONG R M, KORTEMME T.
Coupling protein side-chain and backbone flexibility improves the re-design of protein-ligand specificity


[J]. PLoS Computational Biology, 2015, 11(9): e1004335.
[本文引用: 1]


[38]
HALLEN M A, DONALD B R.
CATS (Coordinates of Atoms by Taylor Series): protein design with backbone flexibility in all locally feasible directions


[J]. Bioinformatics, 2017, 33(14): I5-I12.
[本文引用: 2]


[39]
ROUX B, SIMONSON T.
Implicit solvent models


[J]. Biophysical Chemistry, 1999, 78(1/2): 1-20.
[本文引用: 1]


[40]
LAZARIDIS T, KARPLUS M.
Effective energy function for proteins in solution


[J]. Proteins, 1999, 35(2): 133-152.
[本文引用: 1]


[41]
GAINZA P, NISONOFF H M, DONALD B R.
Algorithms for protein design


[J]. Current Opinion in Structural Biology, 2016, 39: 16-26.
[本文引用: 1]


[42]
NEGRON C, KEATING A E.
Multistate protein design using CLEVER and CLASSY


[J]. Methods in Protein Design, 2013, 523: 171-190.
[本文引用: 1]


[43]
GRIGORYAN G, ZHOU F, LUSTIG S R, et al.
Ultra-fast evaluation of protein energies directly from sequence


[J]. PLoS Computational Biology, 2006, 2(6): 551-563.
[本文引用: 1]


[44]
TRAORE S, ROBERTS K E, ALLOUCHE D, et al.
Fast search algorithms for computational protein design


[J]. Journal of Computational Chemistry, 2016, 37(12): 1048-1058.
[本文引用: 1]


[45]
SMITH C A, KORTEMME T.
Backrub-like backbone simulation recapitulates natural protein conformational variability and improves mutant side-chain prediction


[J]. Journal of Molecular Biology, 2008, 380(4): 742-756.
[本文引用: 1]


[46]
LANOUETTE S, DAVEY J A, ELISMA F, et al.
Discovery of substrates for a SET domain lysine methyltransferase predicted by multistate computational protein design


[J]. Structure, 2015, 23(1): 206-215.
[本文引用: 1]


[47]
HILPERT K, WINKLER D F, HANCOCK R E.
Peptide arrays on cellulose support: SPOT synthesis, a time and cost efficient method for synthesis of large numbers of peptides in a parallel and addressable fashion


[J]. Nature Protocols, 2007, 2(6): 1333-1349.
[本文引用: 1]


[48]
MACKENZIE C O, GRIGORYAN G.
Protein structural motifs in prediction and design


[J]. Current Opinion in Structural Biology, 2017, 44: 161-167.
[本文引用: 1]


[49]
MRAVIC M, THOMASTON J L, TUCKER M, et al.
Packing of apolar side chains enables accurate design of highly stable membrane proteins


[J]. Science, 2019, 363(6434): 1418-1423.
[本文引用: 1]


[50]
LU P, MIN D, DIMAIO F, et al.
Accurate computational design of multipass transmembrane proteins


[J]. Science, 2018, 359(6379): 1042-1046.
[本文引用: 1]


[51]
THOMSON A R, WOOD C W, BURTON A J, et al.
Computational design of water-soluble alpha-helical barrels


[J]. Science, 2014, 346(6208): 485-488.
[本文引用: 1]


[52]
MACDONALD J T, MAKSIMIAK K, SADOWSKI M I, et al.
De novo backbone scaffolds for protein design


[J]. Proteins, 2010, 78(5): 1311-1325.
[本文引用: 1]


[53]
KARANICOLAS J, CORN J E, CHEN I, et al.
A de novo protein binding pair by computational design and directed evolution


[J]. Molecular Cell, 2011, 42(2): 250-260.
[本文引用: 1]


[54]
ZANGHELLINI A, JIANG L, WOLLACOTT A M, et al.
New algorithms and an in silico benchmark for computational enzyme design


[J]. Protein Science, 2006, 15(12): 2785-2794.
[本文引用: 1]


[55]
BOYKEN S E, CHEN Z, GROVES B, et al.
De novo design of protein homo-oligomers with modular hydrogen-bond network-mediated specificity


[J]. Science, 2016, 352(6286): 680-687.
[本文引用: 1]


[56]
MAGUIRE J B, BOYKEN S E, BAKER D, et al.
Rapid sampling of hydrogen bond networks for computational protein design


[J]. Journal of Chemical Theory and Computation, 2018, 14(5): 2751-2760.
[本文引用: 1]


[57]
RICHARDSON J S, RICHARDSON D C.
Natural beta-sheet proteins use negative design to avoid edge-to-edge aggregation


[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(5): 2754-2759.
[本文引用: 1]


[58]
LOFFLER P, SCHMITZ S, HUPFELD E, et al.
Rosetta:MSF: a modular framework for multi-state computational protein design


[J]. PLoS Computational Biology, 2017, 13(6): e1005600.
[本文引用: 1]


[59]
WIJMA H J, FLOOR R J, JEKEL P A, et al.
Computationally designed libraries for rapid enzyme stabilization


[J]. Protein Engineering Design & Selection, 2014, 27(2): 49-58.
[本文引用: 1]


[60]
CORREIA B E, BATES J T, LOOMIS R J, et al.
Proof of principle for epitope-focused vaccine design


[J]. Nature, 2014, 507(7491): 201-206.
[本文引用: 1]


[61]
MARCANDALLI J, FIALA B, OLS S, et al.
Induction of potent neutralizing antibody responses by a designed protein nanoparticle vaccine for respiratory syncytial virus


[J]. Cell, 2019, 176(6): 1420-1431, e17.
[本文引用: 1]


[62]
SESTERHENN F, YANG C, BONET J, et al.
De novo protein design enables the precise induction of RSV-neutralizing antibodies


[J]. Science, 2020, 368(6492): eaay5051.
[本文引用: 1]


[63]
SLOVIC A M, KONO H, LEAR J D, et al.
Computational design of water-soluble analogues of the potassium channel KcsA


[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(7): 1828-1833.
[本文引用: 1]


[64]
WANNIER T M, MOORE M M, MOU Y, et al.
Computational design of the beta-sheet surface of a red fluorescent protein allows control of protein oligomerization


[J]. PLoS One, 2015, 10(6): e0130582.
[本文引用: 1]


[65]
BANDA-VAZQUEZ J, SHANMUGARATNAM S, RODRIGUEZ-SOTRES R, et al.
Redesign of LAOBP to bind novel l-amino acid ligands


[J]. Protein Science, 2018, 27(5): 957-968.
[本文引用: 1]


[66]
GLASGOW A A, HUANG Y M, MANDELL D J, et al.
Computational design of a modular protein sense-response system


[J]. Science, 2019, 366(6468): 1024-1028.
[本文引用: 1]


[67]
POLIZZI N F, WU Y, LEMMIN T, et al.
De novo design of a hyperstable non-natural protein-ligand complex with sub-A accuracy


[J]. Nature Chemistry, 2017, 9(12): 1157-1164.
[本文引用: 1]


[68]
DOU J, VOROBIEVA A A, SHEFFLER W, et al.
De novo design of a fluorescence-activating beta-barrel


[J]. Nature, 2018, 561(7724): 485-491.
[本文引用: 1]


[69]
LEAVER-FAY A, FRONING K J, ATWELL S, et al.
Computationally designed bispecific antibodies using negative state repertoires


[J]. Structure, 2016, 24(4): 641-651.
[本文引用: 1]


[70]
FRONING K J, LEAVER-FAY A, WU X, et al.
Computational design of a specific heavy chain/kappa light chain interface for expressing fully IgG bispecific antibodies


[J]. Protein Science, 2017, 26(10): 2021-2038.
[本文引用: 1]


[71]
SILVA D A, YU S, ULGE U Y, et al.
De novo design of potent and selective mimics of IL-2 and IL-15


[J]. Nature, 2019, 565(7738): 186-191.
[本文引用: 1]


[72]
CHEN Z, BOYKEN S E, JIA M, et al.
Programmable design of orthogonal protein heterodimers


[J]. Nature, 2019, 565(7737): 106-111.
[本文引用: 1]


[73]
CHEN Z, KIBLER R D, HUNT A, et al.
De novo design of protein logic gates


[J]. Science, 2020, 368(6486): 78-84.
[本文引用: 1]


[74]
LANGAN R A, BOYKEN S E, NG A H, et al.
De novo design of bioactive protein switches


[J]. Nature, 2019, 572(7768): 205-210.
[本文引用: 1]


[75]
NG A H, NGUYEN T H, GOMEZ-SCHIAVON M, et al.
Modular and tunable biological feedback control using a de novo protein switch


[J]. Nature, 2019, 572(7768): 265-269.
[本文引用: 1]


[76]
SHEN H, FALLAS J A, LYNCH E, et al.
De novo design of self-assembling helical protein filaments


[J]. Science, 2018, 362(6415): 705-709.
[本文引用: 1]


[77]
KING N P, BALE J B, SHEFFLER W, et al.
Accurate design of co-assembling multi-component protein nanomaterials


[J]. Nature, 2014, 510(7503): 103-108.
[本文引用: 1]


[78]
FALLAS J A, UEDA G, SHEFFLER W, et al.
Computational design of self-assembling cyclic protein homo-oligomers


[J]. Nature Chemistry, 2017, 9(4): 353-360.
[本文引用: 1]


[79]
KILAMBI K P, REDDY K, GRAY J J.
Protein-protein docking with dynamic residue protonation states


[J]. PLoS Computational Biology, 2014, 10(12): e1004018.
[本文引用: 1]


[80]
KILAMBI K P, GRAY J J.
Rapid calculation of protein pKa values using Rosetta


[J]. Biophysical Journal, 2012, 103(3): 587-595.
[本文引用: 1]


[81]
ALFORD R F, KOEHLER LEMAN J, WEITZNER B D, et al.
An integrated framework advancing membrane protein modeling and design


[J]. PLoS Computational Biology, 2015, 11(9): e1004398.
[本文引用: 1]


[82]
BARTH P, SCHONBRUN J, BAKER D.
Toward high-resolution prediction and design of transmembrane helical protein structures


[J]. Proceedings of the National Academy of Sciences of the United States of America, 2007, 104(40): 15682-15687.


[83]
YAROV-YAROVOY V, SCHONBRUN J, BAKER D.
Multipass membrane protein structure prediction using Rosetta


[J]. Proteins, 2006, 62(4): 1010-1025.
[本文引用: 1]


[84]
BOGAN AA, THORN K S.
Anatomy of hot spots in protein interfaces


[J]. Journal of Molecular Biology, 1998, 280(1): 1-9.
[本文引用: 1]


[85]
KORTEMME T, BAKER D.
Computational design of protein-protein interactions


[J]. Current Opinion in Chemical Biology, 2004, 8(1): 91-97.
[本文引用: 2]


產(chǎn)品反饋單 | 尊敬的客戶,如果您對南京肽業(yè)生物科技有限公司 的產(chǎn)品和服務(wù)有不滿意的地方,請您在這里對我們的產(chǎn)品和服務(wù)質(zhì)量進(jìn)行建議、監(jiān)督和投訴。
99精品国产在这里白浆,亚洲av日韩精品久久久久久,亚洲国产精品无码中文字满,国产在线精品一区二区不卡麻豆,92成人午夜福利一区二区,亚洲高清成人aⅴ片在线观看,亚洲精品第一国产综合精品99 ,亚洲香蕉成人AV网站在线观看,欧美成人在线视频,国产高潮流白浆免费观看
免费A级毛片无码免費视频| 亚洲国产成人精品无码区在线秒播| 亚洲日韩va无码中文字幕 | 国产精品亚洲va在线| 风间 一区二区 无码 有码 | 国产精品成人99久久久久| 国产麻豆剧传媒精品国产AV| 久久精品国产亚洲AV麻豆长发| 无码av一区二区大桥久未| 极品私人尤物在线精品首页 | 成人永久免费网站在线观看| 五月婷婷丁香综合| 女同久久精品国产99国产精品| 麻豆国产成人av高清在线| 三人性free欧美黑人巨大| 久久国产精品人人爽人人爽| 亚洲国产精品美女久久久久| 亚洲av无码成人专区片在线观看| 国内外精品激情刺激在线| 国产精品无码av一区二区三区| 国产精品不卡无码AV在线播放 | 无码中出人妻中文字幕AV| 久久99国产亚洲高清观看首页| 国产高清大尺度一区二区不卡| 精品一区二区三区av| 色综合久久无码五十路人妻| 亚洲成年看片在线观| 99久久天天躁狠狠躁夜夜躁| 久久久国产精品无码一区二区| 国产亚洲AV片在线观看播放| 亚洲AV日韩精品久久久久久A| 国产成人精品综合久久久| 性深夜免费福利视频| 亚洲aⅴ中文无码字幕色本草| 熟女俱乐部五十路六十路AV| 亚洲精品久中文字幕| 欧美一区二区影院| 中文字幕人妻第一区| 国产精品女视频一区二区| 亚洲永久无码动态图| 色妞WWW精品视频二|