第 708 期

研究發展
開發表型富集分析工具modPhEA促進高通量生物學及生物醫學研究
NHRI researchers develop a bioinformatic application, modPhEA, to functionally interpret gene sets obtained in biological and biomedical researches


近代生物學及生物醫學研究中,高通量分析技術(如生物晶片或次世代定序等)被廣泛使用;這些研究所產出的初步結果常以基因群(gene sets)的方式呈現。為詮釋基因群背後的生物意義,富集分析(enrichment analysis)已成為後基因體時代研究不可或缺的一部分。目前,提供富集分析服務的生物資訊工具普遍仰賴GO(Gene Ontology)terms或KEGG pathways等基因功能註解;而這些註解所著重的「基因功能」往往著重於分子及細胞層面,因此相關的分析結果無法反映基因群在個體發育、型態、生理及行為中所扮演的角色。

為突破上述限制,本院群體健康科學研究所廖本揚副研究員研究團隊發展出名稱為modPhEA(簡稱於model organism Phenotype Enrichment Analysis)的生物資訊分析工具。此工具所整合的基因功能資料庫,源於基因遺傳學操作(genetic manipulations)後所產生的表型(phenotypes)資料,因此能彌補既有工具的不足,為使用者提供輸入之基因群所對應的個體生理、型態、行為以及疾病等特徵。相較於常規的富集分析工具,modPhEA具有以下特色:(1)6種常用模式生物(包含人、小家鼠、斑馬魚、線蟲、果蠅及酵母菌)表型資料庫的整合,以利使用者能根據研究對象的最鄰近物種的表型資料來進行資料分析;(2)同源基因(orthologs)資料庫的建立,使modPhEA能夠分析來自於182個動物或真菌中任何一個物種的基因群;(3)允許使用者過濾或選擇表型資料的來源,以控制不同實驗方法所可能產生的誤差;(4)允許使用者自行定義表型,對複雜性狀或疾病進行研究;(5)同時提供使用者表列式及階層式的輸出結果,兼顧使用者論文撰寫時不同的需求。

modPhEA能夠廣泛應用於基礎生物學及生物醫學研究。生物醫學方面,modPhEA成功預測茲卡(Zika)病毒感染患者的臨床表徵,除顱骨、神經等發育異常(小腦症)以外,所預測的新生兒四肢異常性狀受近期的文獻所支持。另外,modPhEA也成功預測在宿主發生腸道菌異常(dysbiosis)時,宿主代謝、型態及行為的異常表徵;其在複雜疾病的應用上,亦證實特定基因群調控的變化會造成巨細胞血管炎(giant cell arteritis, GCA)。modPhEA免費開放給全球生物學及生物醫學研究人員使用,相關論文已於2017年6月線上發表於生物資訊領域的指標性期刊Bioinformatics

modPhEA的網址為:http://evol.nhri.org.tw/modPhEA/
《文:群體健康科學研究所生物統計與生物資訊研究組翁孟彬研究助理、廖本揚副研究員》