目前 WHO 流感病毒偵測系統的抗原鑑定是利用雪貂抗血清來進行紅血球凝集抑制試驗,然而此血清學鑑定方法耗時費力且有實驗誤差,相對地核酸定序技術具有快速、便宜且精準的特性,因此逐漸應用於流感病毒偵測系統。儘管如此,目前的基因定序分析並無法有效地預測流感病毒的抗原性,因此國衛院生物統計與生物資訊研究組熊昭組主任研究團隊與疫苗研發中心李敏西副研究員,結合血清數據及基因定序的資料,利用生物統計與生物資訊方法來找出可能的抗原變異位點,進而建立預測模型,此模型建立以後,只需要利用基因序列即可預測抗原變異株,可加速流感疫苗株的選取。
方法與原理
因為流感病毒株的抗原距離是利用雪貂的紅血球凝集抑制實驗所定量的,因此從文獻上收集雪貂血清的資料,並從 public domain 下載、或是直接由文獻中擷取流感病毒株的 HA1 基因序列,共收集 1971-2002 年份分離出來的 45 株 H3N2 病毒株,181 筆配對的抗原距離及胺基酸序列比對資料,以此資料作為訓練資料組,利用迴歸分析去找出能夠反映抗原距離的胺基酸位點,並建立預測模型,為了驗證此模型的效能,另外收集 1999-2004 年份分離出來的 19 株病毒株,96 組配對的抗原距離及胺基酸序列比對資料當作確效資料組。迴歸分析在訓練資料組共找出 20 個可能的抗原變異位點,利用這 20 個胺基酸位點所建立的預測模型對於訓練資料組及確效資料組其預測抗原變異株的準確率分別為 93.4% 及91.7%,由於新的流感病毒常產生新的胺基酸突變位點,此預測模型需定期更新。
《文:生統生資組廖玉潔博士/熊昭組主任;圖:Bioinformatics期刊》