第 386 期

學術交流
第60屆美國人類基因協會年會會後紀要
NHRI researcher attends 60th Annual Meeting of The American Society of Human Genetics


今年第60屆美國人類基因協會年會(American Society of Human Genetics, ASHG)於11月2日至6日於美國華盛頓特區舉行。目前ASHG有將近8,000多名會員,會員大致包括研究者、學者、醫師等對人類遺傳學感興趣的相關人員。此次會議邀請多位遺傳領域相關的知名人士在此發表他們的文章,也於演講中分享了許多新的資訊、未來遺傳領域發展的方向,及目前大家注目的焦點問題等,因此吸引了全世界各地約7,000多人與會。筆者也應邀於此次年會中發表壁報論文,題目為「Lifetime environmental exposure to tobacco smoke, genetic susceptibility, and risk of lung cancer in non-smoking Taiwanese.」。藉由一場會議中能獲得眾多的資訊實是難能可貴,筆者有幸能參與這次的盛會而汲取到目前遺傳領域研究最新的脈動,這些寶貴的新知均可作為筆者將來研究的重要題材。

近年來,基因與資訊科技突破性的發展,已經改變了近代生物學的面貌。這些新的技術,正如潮流般地衝擊著生命科學的每一個角落。過去幾年,利用單核苷酸多態性(Single Nucleotide Polymorphism, SNP)標記的全基因組關聯研究(genome-wide association studies, GWAS),來發現與複雜疾病相關的易感基因的趨勢,已經有了新的轉變。如何利用經由定序(sequencing)平台所產生關於SNPs、結構變異(structure variants),以及單體型(haplotypes)之大量資料,是目前重要的議題。與以前相比,目前定序的價格,已經大幅降低。1000 Genome Project是第一個應用「Next Gen」於大量樣本,來執行基因組定序的計畫,對人類遺傳變異的研究,提供了最好的完整資源。1000 Genome Project也將迅速提供一個全球科學界可以自由存取使用的公用資料庫。關於較低頻率變異(lower frequency variants),在 629個樣本,共有25487060 variant sites;其中有7922125 sites位於dbSNP 129,有17564935 sites不在dbSNP129。

科學界於人類遺傳研究中關於混合群體(admixed populations),總是有一番特殊的興趣,主要是因為混合群體具有利用混合連鎖不平衡(admixture linkage disequilibrium)尋找致病基因的潛在性,特別是針對那些於不同族群具有不同發生率的疾病。此外,大部分的連鎖分析(linkage analysis)、GWAS,與候選基因的關聯性研究,均是利用混合群體來收集樣本,對此後GWAS時代,我們更應針對研究母體(study population)的所有群體結構(population substructures),來探究易感性基因。一般而言,GWAS均假設同源群體(homogenous population),一旦出現混合群體,如何來調整呢?本次會議,一些學者亦提供方法,來解決此類問題。譬如利用主成分分析方法(principal component),來區別不同的族群,提供GWAS之調整。

此次會議,亦有相當多的議題,探討罕見變異(rare variants)的相關研究。過去,關於MAF<5%的variants,由於出現的頻率太低,因此均會於遺傳分析中刪除。但是這類的罕見變異,尤其是MAF<1%的變異,可能對複雜疾病有其貢獻性。但是單點的罕見變異的分析,由於頻率太低,恐會造成統計檢定力之不足。而如果要提高統計檢定力,所需的樣本數可能會相當大。假設要獲得80%的統計檢定力,如果MAF=5%,所需樣本數為2500;如果MAF=1%,所需樣本數為12000;如果MAF=0.1%,所需樣本數則為117000。要執行如此大的研究,可能會相當困難,因此我們需要一些不同的研究方法,譬如研究的族群侷限於高危險群(high risk individuals),是目前很多學者採用的方法。本次會議中,針對罕見變異的分析,一些學者亦提供其發展的方法,諸如Variant Calling Algorithm、LD-Aware Algorithm、SeqLRT、SeqPT,與SeqEM(Martin et al., 2010)。這些方法,均與目前使用相當普遍的SeqMAQ(Li & Leal, 2008)與Madsen & Browning(2009)等方法比較,明顯具有較大的統計檢定力。

關於探討GWAS研究的基因與基因之交互作用,亦有學者提出一些研究方法以供討論與交流。譬如利用PLINK軟體,先檢驗任兩個SNPs是否呈現交互作用,得到交互作用顯著性的p-value。將具有某一程度顯著性的p-value,再利用廣義線性模型(generalized liner model, GLM)方法,來調整一些與反應變數相關共變數,例如群體結構,再來探討基因與基因之交互作用。不過此種方法,利用GLM來調整共變數的步驟,所需的計算量相當繁重。

總而言之,此次會議除提供了目前遺傳研究的最新技術外,關於執行遺傳研究所需的方法與設計,均可以提供筆者實際上的運用,而對於未來的研究發展,也有相當大的助益。
《文/圖:群體健康科學研究所生物統計與生物資訊組蕭金福副研究員;編輯中心趙孝茜整理》