第 119 期 2005-10-05

研究發展
演化生物學的遊戲場—生物巨分子序列親緣性分析系統:POWER / PhylOgenetic WEb Repeater

生物巨分子的親緣性分析是一個經常使用的演化分類方法,此方法的主要優點是藉由計算保守性序列的變異程度,而推衍序列之間的相對演變歷史,進一步可推衍為個體間或物種間的族系發生史(phylogenesis)。序列親緣性分析可補強型態測量分類方法的不足,特別是應用在某些未必具有明顯特徵可資分類的病原菌或病毒株。傳統之血清型分類方法,無法有效鑑別病原體變異株之間的些微差異,病源鑑定與疾病控制上亦受限於此;透過代表性基因型或分子標記的定序與後續的序列親緣性分析,我們可瞭解不同時間與地點的採檢樣品之間的演變關係,進以掌握致病原變異與傳布的途徑。

序列分析在生物資訊的研究領域中已為相當成熟的技術,而分子演化(molecular evolution)學者們也成功地引入這些計算理論至生物巨分子序列分析上,發展出利用序列分析估算物種演化的理論。一個標準的親緣性分析包括一連串的操作階段:(1) 多序列排比(multiple sequence alignment, MSA),(2) 親緣關係推衍(inferring on phylogenetic relationship) (3) 樹形繪製(tree building)。每個步驟都可由個別的程式完成,例如多序列排比 MSA,可透過ClustalW on command-mode, GUI ClustalX, 或其他網路上的生物資訊服務站如Centre for Molecular and Biomolecular InformaticsEuropean Bioinformatics Institute等;親緣關係則以預先完成的序列排比結果進行分析,如 PHYLIP package、 WebPHYLIP、Mega等網路生物資源服務站或單機版軟體。最後的樹形繪製工作,有時已包含在親緣關係分析程式的最後輸出結果之內,如MEGA3;也有些軟體專為樹形繪製設計,可讀取親緣關係分析的輸出檔案(文字形式的檔案),如DRAWTREE、WebPHYLIP、 TREEVIEW、NJPLOT 、ATV、PhyloDraw 與 PHYLIP 套件中的DRAWGRAM。

在不同分析階段之間有檔案輸出與輸入格式對應與轉換的問題,而即使有整合性親緣分析服務,如 PhyloBLAST,但是其分析工作的彈性較小。PhyloBLAST 起始於 BLAST search,僅搜尋蛋白質序列進行親緣分析,但不允許使用者自行調整參數。序列親緣樹形圖是一般生物學及醫學研究者的判讀依據,但在樹形繪製的適切表達上也經常發生問題,例如:樹狀分支間發生交叉,序列識別標記重疊,檔案輸出格式支援性…等等。這些現有的分析工具,往往親和性不足,圖像化使用者介面闕如或不佳,操作過程繁瑣,對於大量或是反覆更改相關參數的親緣分析十分不利,同時也沒有在分析過程中,告知使用者有哪些分析方法與計分矩陣,及何種參數的選擇建議,造成使用者往往徒勞無功,甚至做出錯誤的分析結果。

本研究的主要目的,在於建構整合之自動化序列親緣性分析系統,以導引式互動介面協助來自不同研究社群的使用者完成分析,簡化繁瑣的序列格式處理過程及流暢地銜接多種操作程序,但又能保有各分析階段精細調整參數的功能,並自動記錄操作過程的參數設定,以便使用者回溯其工作流程,再行調整。另外,針對樹形圖的輸出方式,與樹形分支排列調整等功能設計程式,以符合客製化(customize)的理想。另外,未來將與BLAST工具結合,以GenBank或是NR為比對資料庫,以簡化並延伸使用者的輸入選定序列的工作,加速使用者解析所研究之序列與相關序列間的時空分析概況。

本系統為整合性可反覆執行之序列親緣關係分析工具,提供使用者分別以一般序列(Fasta)與比對序列(Aligned sequences) 二種方法來進行核酸或蛋白質序列親緣關係分析,並可即時動態增加或減少序列數目節點,反覆調整分析之結果。

POWER系統之建置,乃由國衛院生物統計與生物資訊研究組熊昭組主任、林仲彥助研究員、林凡凱先生、林介華小姐、賴立偉先生及徐秀君小姐所組成的研發小組,以一年半的時間進行開發,並在中央研究院基因體中心幹細胞實驗室陳淑華博士的協同合作下,完成整體系統的優化與論文的撰寫。小組所推出的生物巨分子序列親緣性分析工具-POWER已於2005年七月發表在國際知名期刊Nucleic Acid Research(33: 553-556, 2005),截自2005年九月中旬為止,共有200餘人次使用POWER,並已處理2,200餘條序列。

像POWER如此具親和性的序列親緣分析系統,除了運用於生物巨分子序列分析外,可以讓研究人員進行疾病病原分子監控,快速判定源自不同時空的檢體序列間的親緣關係,而無須陷入繁瑣的程式操作與避免複雜的結果研判,譬如人類與禽類流感病毒的分析,更可以透過這樣的系統快速地進行親緣與傳遞途徑的解析。研究小組希望像 POWER這樣的生物資訊分析平台,不僅展現同仁們對研究工作的盡心付出,也期望對國內外的生物醫學研究社群有所助益,進而實現國家衛生研究院肩負促進與協助國內生物醫學相關研究及改善國民衛生健康的使命。

附註:POWER: PhylOgenetic WEb Repeater, http://power.nhri.org.tw
《文/圖:熊昭,林仲彥,及計劃助理;圖:POWER之親緣演化分析流程圖》