NHRI Communications

第 745 期

會議報導
高通量資料分析研習會
Report on High-throughput data analysis workshop

利用高通量資料（high-throughput data）尋找生物標記（biomarker）或產生假設（hypothesis generation），是當代生命科學研究的重要方法，也是近年所謂大數據分析（big data analytics）中最重要的例子。此次本院TBI生物資訊核心設施舉辦的研習會，其目的是在分享核心設施在利用高通量資料進行癌症轉譯醫學研究的經驗，讓學員們瞭解最重要的觀念及學習相應的操作技術，包括批次效應（batch effect）的評估校正及路徑分析（pathway analysis）。此次特別邀請冷泉港生物科技公司參與，分享已有相關臨床應用商品的NanoString公司目前在臨床研究上的最新進展。

本院癌症研究所張憶壽名譽研究員以自身所發表的論文為例，指出整合分析（integrative analysis）中，一致性的研究結果可提升可信度及價值，且同時指出高通量資料提供了資料品質（data quality）檢驗的特殊機會。由於批次效應（batch effect）會對研究結果造成偽陽性（false positive results），於研習會中，本院群體健康科學研究所陳中興博士以實例說明實驗資料產生的時間是與批次效應最可能相關的變數，亦同時說明如何利用主成分分析（principal component analysis, PCA）及相關之替代變數分析（surrogate variable analysis, SVA），來偵測批次效應並減輕其所帶來的偏差，提高實驗的再現性（reproducibility）。

本院癌症研究所江士昇助研究員以癌症研究為例，介紹國際上公用的基因表現資料庫，如GEO、ArrayExpress、TCGA等，說明如何利用這些資料庫尋找生物標記（biomarker）及進行後續之機制研究（mechanism study）。並特別指出如何在自身的研究中，利用這些資料庫提升研究結果的可信度及價值。

對乳癌患者進行預後評估，Prosigna是利用NanoString公司的nCounter技術，並已於2013年通過美國FDA認證的基因檢測法。冷泉港生物科技公司吳彥萱主任從臨床研究上的應用觀點，介紹nCounter技術的高再現性、簡單的實驗步驟與高效率的實驗流程。並對癌症免疫治療相關的生物標記，提出NanoString公司與Merck公司共同開發的TLS（tumor inflammation signature）指標，此TLS指標比傳統的PD-L1 IHC更加能預測免疫療法新藥（Keytruda）治療是否有效。

下午二場的實作課，首先是NanoString原廠提供的免費分析軟體nSlover的實作課程。經由冷泉港生物科技公司顏吟紋副理的解說，以及學員們利用實作課準備的資料親自練習，更加深對nSlover軟體的操作與瞭解。接著則是由本院癌症研究所蔡芳瑜研究助理介紹由Broad Institute開發的免費路徑分析軟體GSEA（gene set enrichment analysis），並由江士昇助研究員與陳中興博士從旁協助實作。此二場實作課程藉由上機實作，便利學員加深理解使用這些軟體的細部設定；不論是理解nSlover中資料前處理的方式，還是使用GSEA的分析結果產生假設，相信皆能提高使用者自身的研究能力。

此次研習會於中央研究院人文社會科學館舉辦，學員出席踴躍並與講者交流熱絡。會後的問卷調查顯示有89%的學員對於本次規劃之課程項目與整體收穫感到滿意。核心設施會加強研究能力，不斷更新課程，期望學員在參與本核心設施所開設之課程後，對於生物資訊更具認識，亦期望對於國內的研究環境有正向推廣的作用。
《文：癌症研究所江士昇助研究員、群體健康科學研究所陳中興博士後研究員/圖：群體健康科學研究所陳茹婕》