模塊分析法:解密複雜疾病和藥物作用機製的新策略
學術探討
作者:陳寅螢 馮麗鵬 李勇 吳萍 王忠 王階
[摘要]大部分複雜疾病並不是由單個致病基因引起的,藥物作用於疾病網絡的多個靶點,產生協同效應,從而幹預疾病的發生和發展。與作用於單個分子或通路的傳統方法不同,高通量數據構建的疾病藥物靶點網絡形象地展示了藥物、靶點和疾病之間的複雜關係。但此類網絡通常極為複雜,為了降低分析的複雜性,必須對大網絡進行分解,識別出模塊結構。該研究從模塊的概念、結構和識別方法、疾病藥物模塊識別的重要性及應用4個方麵對模塊分析法的框架進行了概述。模塊分析法以一個全新的視角來解密藥物幹預複雜疾病的機製,為揭示多組分多靶點藥物作用機製提供了新思路和新途徑。
[關鍵詞]藥物靶點網絡;模塊分析法;複雜疾病;多組分多靶點藥物
當前藥物研發已經從傳統的“一個藥物,一個靶點,一種疾病”的單靶點理念向多靶點藥物治療的方向轉變。基因組學、蛋白質組學及代謝組學等各種高通量組學技術的不斷進步,以及網絡生物學、網絡醫學、網絡藥理學、係統藥理學等新概念的提出為多組分多靶點協同作用的藥物研究注入了新生力量。與針對單個分子或通路的傳統方法不同,網絡藥理學能夠整合多種數據來源,用網絡形象地表示藥物、靶點和疾病之間的複雜關係,其中節點表示基因、蛋白、小分子、藥物、疾病或其他生物實體,邊則表示節點之間的關係,如直接的物理相互作用、激活、抑製或共調解等,邊可以是有向或無向,有權重或無權重的。複雜疾病的發生、發展與一係列相互作用的基因或蛋白相關,大部分複雜疾病並非是由單個致病基因引起的。藥物作用於多個靶點,而這些靶點都存在於一個複雜網絡中,因此藥物的效果,無論是治療作用還是副作用,都是幹擾這個複雜的靶點網絡的結果[1]。在多數情況下,抑製一個靶蛋白並不會引起整個表型的改變,甚至有可能激活疾病係統中的另一個相關蛋白從而保護係統功能的穩定性,最終導致藥物失去功效或產生毒副作用[2]。因此,在網絡背景下去研究藥物與多個靶點之間的關係,有可能係統地揭示藥物作用機製,從而產生治療複雜疾病的新策略。
那麼,應該如何去分析這樣一個全局的疾病藥物靶點網絡?在係統生物學中,運用各種數學模型和算法對模式生物分子網絡,如蛋白質相互作用(PPI)網絡、代謝網絡、轉錄調控網絡等進行分解,識別出模塊化結構(modularstructure),這種分析模式為研究疾病藥物網絡提供了一個新的途徑和切入點,不僅能降低網絡分析的複雜性,而且探索模塊化結構是理解生物係統複雜性的關鍵因素[3]。近年來模塊的識別倍受人們關注,湧現出大量的網絡分解或模塊識別方法。本研究現將模塊分析法相關知識及其在複雜疾病藥物靶點網絡中的適用性及應用情況作一概述。
1模塊結構的概念與定義
複雜網絡有一個非常重要的特性——模塊性(modularity)。在不同生物係統中,模塊性是一種普遍存在的現象[4]。目前,文獻中對模塊性還沒有明確的定義。簡單地說,模塊就是部分(parts),其存在於分子、細胞、形態學等各個不同的水平[5]。不同的研究者又對模塊定義進行延伸,提出了許多種不同的模塊。Winther[5]認為有3種不同理論類型的模塊:結構模塊(structuralmodules)、發育模塊(developmentalmodules)和生理模塊(physiologicalmodules),不同領域的專家傾向於關注其中某一類型。還有研究者提出從拓撲結構、信息理論、基因上位的觀點來研究模塊性,生物模塊的識別通常是基於功能的、進化的、或拓撲結構的標準[6]。1999年Hartwell提出了功能模塊(functionalmodules)的概念,是指由許多不同的分子組成的,在功能上和形態上相對獨立的實體[7],這些功能來源於其組成部分(蛋白質、DNA、RNA和小分子)之間的相互作用。Barabási等在網絡醫學(networkmedicine)中提出,與疾病相關的基因會聚集成疾病模塊(diseasemodules),疾病通常是一個特殊的功能模塊崩潰的結果,暗示了功能模塊也是疾病模塊[8]。模塊代表成群的網絡節點,其在網絡拓撲結構上表現為模塊內部的節點連接比較稠密,模塊之間的節點連接比較稀疏[9];在功能上,分子網絡的模塊常常能夠編碼細胞功能,許多細胞功能都是通過功能模塊來執行的[7]。此外,由於背景網絡的類型不同,文獻中還出現了許多與模塊概念相似的名詞,如亞網絡或子網絡(subnetworks)[10],蛋白質複合物(proteincomplexes)[11],模體(motifs)[12],基本流量模式(elementaryfluxmodes)[10],和社團結構(communitystructure)[13]等,這些亞結構對理解網絡拓撲結構和動力學具有重要意義。
2模塊結構和識別方法
簡單地說,從大網絡中可識別出2種模塊結構:重疊的和不重疊的模塊。模塊之間又存在模塊化的重疊、橋接(bridges)、瓶頸(bottlenecks)、模塊之間的中心(intermodularhubs)等結構[1415]。其中,模塊化的重疊表明這些節點或連接屬於兩個或更多的模塊,橋接則是連接兩個模塊的節點,且在每個模塊中都發揮重要作用[14]。在生物網絡裏,功能模塊的識別是理解細胞功能的結構和動力學的第一步[16]。而且,研究疾病網絡的重要一步就是識別出與特殊的病理表型相關的疾病模塊,反之,疾病模塊的識別也能進一步指導實驗研究並影響藥物研發[8]。目前,發表的文獻中已經介紹了許多不同的模塊識別或網絡分解方法。從算法角度來看,現有的計算方法大致可分為啟發式算法和精確計算法兩大類,兩者區別在於精確計算法可以識別出最優和次優模塊,而啟發式算法僅能識別出高分模塊[17]。基於不同的計算原理,這些方法可被劃分成網絡聚類算法、網絡拓撲結構法、模塊性最優化法、種子擴展法、矩陣分解法和比較網絡分析法六大類[18]。方法雖多,但總的說來,有的方法可以劃分出重疊的和不重疊的模塊,而有的方法則傾向於生成不重疊的模塊。分子網絡的模塊之間具有廣泛或普遍的重疊[3],目前,研究者非常重視複雜網絡中的重疊模塊。模塊之間的重疊和橋接是網絡幹擾和信號轉導的主要傳遞者,是網絡節點和模塊協作的重要決定因素,也是調節細胞適應的主要位點,這些屬性提示了它們作為潛在藥物靶點的重要性。因此,模塊間的節點是具有吸引力的藥物靶標,同時也暗示了多靶點藥物的必要性[14]。相反地,傾向於識別出不重疊模塊的方法,通過消除模塊間的重疊,生成一個連貫的大網絡來描述模塊內部和模塊之間的相互作用[1819]。
3疾病藥物模塊識別的重要性
從係統生物學的觀點來看,生命體可看作是多種分子相互作用形成的複雜網絡。大多數複雜疾病並非是由單個致病基因引起的,而是通過多個基因或其產物功能紊亂導致調控網絡失衡的結果[8]。疾病表型反映了不同的病理生物學過程在一個複雜網絡中的相互作用[8]。因此,在疾病網絡中刪除單個節點對疾病網絡幾乎是沒有影響的,需要調節多個蛋白才能幹擾疾病表型[20]。那麼,如果藥物的作用隻影響到網絡裏的某一個節點,該藥物將很難去逆轉這種疾病表型。所以,藥物是通過作用於疾病網絡中的多個靶點,對各靶點的作用產生協同效應,從而對疾病的發生、發展進行幹預,最終達到治療效果[21]。這種基於網絡層麵的理解確實提供了一種非常形象的分析策略,有助於更好地理解疾病的發病機製,為藥物發現提供了更好的藥物靶標。但是與疾病或藥物相關的網絡,通常都是非常巨大的,會涉及到相當多的節點,很多時候直接去分析這樣巨大的網絡幾乎是不可能的,而且也缺乏特異性。因此,為了降低網絡分析的複雜性,必須要對大網絡進行分解或解構,進行模塊的識別。對代謝網絡的研究表明,把代謝網絡劃分成相對獨立的子網有助於更好地理解網絡模塊性和組織原則,而且對於代謝網絡的功能分析也是必要的[22]。調控網絡的研究表明motif和模塊是分析網絡局部特征和網絡構成以及研究調控機製的重要結構[23]。
目前,模塊化已經成為構建疾病網絡和藥物靶點網絡的一個基本概念。在相同功能模塊裏的基因比在不同功能模塊裏的基因要表現出更多相似的表型。相同的疾病或表型相似的疾病的致病基因通常都存在於相同的功能模塊裏[24],即疾病模塊,其代表這樣一群網絡組成部分,它們有助於某種細胞功能,並且破壞它們會導致某種特殊的疾病表型[8]。從疾病角度來看,破譯和優化疾病靶點網絡中的模塊化結構是揭示複雜疾病病理機製的關鍵步驟,不同的模塊可以為疾病結局的變化貢獻不同的功能;從藥物發現角度來看,功能模塊對於理解現代藥理學的重要組成部分是極為重要的,而且理解有助於藥效的功能模塊可以提供全新的特征用於作為定義疾病過程或藥物療效的終點[25]。因此,從大網絡中識別出功能模塊是非常重要的。有研究分別對網絡和模塊進行GO富集分析,結果顯示把網絡劃分成模塊後,模塊會富集到很多原來網絡沒有的功能,表明模塊的識別可以揭示一些隱藏的功能富集[26]。分子細胞生物學中模塊性的普遍存在已經導致廣泛地使用模塊來預測分子功能,而且比起單獨使用物理相互作用來說,模塊化的結構能更好地進行功能預測[27]。因此,為了減少疾病藥物靶點網絡分析和功能分析的複雜性,必須要對大網絡進行分解或解構,識別出疾病藥物模塊,從功能模塊水平深入探討多靶點藥物幹預複雜疾病的作用機製。