第 623 期

院務紀事
賀本院諮詢委員梁賡義院士榮獲「2015 年Karl Pearson獎」
Academician Kung-Yee Liang receives 2015 Karl Pearson Prize


本院諮詢委員梁賡義院士(2003-2006年為本院副院長)與美國約翰霍普金斯大學Scott Zeger教授榮獲國際統計學會(ISI)所頒發的「2015 Karl Pearson獎」,得獎論文為1986年共同發表的「廣義線性模式於縱向資料分析的應用(Longitudinal data analysis using generalized linear models)」,內容為所發展出之廣義估計公式(generalized estimating equation, GEE)如何應用於縱向資料分析。ISI表示,梁院士與Zeger教授的公式對統計學及生物統計學的理論及方法論均有直接及持續性的影響,尤其在醫學、物理學及社會科學中的應用研究。此公式現已成為應用統計學、統計軟體及相關領域的主要要件,深受學界肯定,因此頒發此獎項。

梁賡義院士現為國立陽明大學校長,亦為國際知名生物統計學者,於2003年至2006年擔任本院首任副院長,任職期間整合院內各研究單位之跨組合作並扮演本院與衛生署(現為衛生福利部)及國內其他相關單位之橋樑角色,充分發揮溝通及協調功能。同時於新任院長遴選期間,以代理院長身分帶領本院持續成長,貢獻良多。今年9月15日本院編輯中心陳麗秋主任、張喬菀女士與生技與藥物研究所徐祖安研究員前往國立陽明大學採訪熟悉的前國衛院大家長,以下為訪談摘要。

GEE的基本概念
在統計學上,迴歸分析(regression analysis)用於瞭解兩個或多個變數間是否相關,主要可用來預測與因果分析。當我們觀察兩個或多個現象之間的關係是否有因果關係時,被影響的現象稱為依變數(dependent variable),而影響到依變數的現象稱為自變數(independent variable)。梁院士舉例說明當研究人員想瞭解血壓高低變化的因素,如運動頻率是否影響血壓時,會利用迴歸分析將運動頻率視為自變數,進而檢驗被視為依變數的血壓高低是否受到顯著的影響。迴歸分析有許多不同的模式,如線性迴歸用在連續性數據的研究,邏輯迴歸分析用來證明二分變項,如事件有或沒有發生之影響,和在各類計數資料的研究;而傳統的統計方式針對不同性質的資料進行分析,需要選用適合的迴歸分析模式。然而,迴歸分析有一個重要的假設,那就是依變數的資料是獨立的,彼此互不相關,但在很多狀況下,這樣的假設是無法成立的,例如在分析測量孩童的成長曲線所收集的身高、體重數據的縱向資料時,同一個受試者在不同時間點上接受測量的數據是有相關性的。如前面提到的例子,若兩週前測量的血壓是高的話,合理的猜測是同一受試者兩週後的血壓也會是偏高,如果使用傳統的統計方式來分析縱向資料,很可能會讓研究者得到錯誤結論。

應運而生 發展GEE的時空背景
1985年梁院士任職於約翰霍普金斯大學公共衛生學院,當時婦幼衛生學系上有項研究在探討母親的壓力與孩子生病的機率,受試者每天記錄壓力大小及孩童是否生病。這些數據是縱向性的,因此是有相關性,研究者對傳統的統計方法是否能正確分析此數據存有疑慮,而尋求生物統計系系主任協助,因緣際會開啟這項研究。梁院士在西雅圖華盛頓大學攻讀生物統計學博士時修過廣義線性模式(generalized linear models)這門課,他的同事Scott Zeger教授擅長時間序列的研究,而梁院士具公共衛生背景,因此兩人結合各自專長,運用此概念共同研究,發展出GEE應用在縱向資料分析。過去研究者總認為數據是獨立的,即使瞭解數據的相關性,但沒有適當的統計工具協助分析,GEE這個新的統計工具,有助於此類統計數據得出更正確的結論。這個公式在發表後4年間已廣為接受及運用,1990年梁院士與Scott Zeger教授受邀至美國生物統計的重要會議(Eastern North American Region of the International Biometric Society, ENAR)講課,意外發現第一排正坐著他的博士班指導教授,生物統計的泰斗 Norm Breslow,凸顯美國學者好學不倦的精神。同時為了分享研究資源,梁院士與Zeger教授更尋找經費請學生將GEE統計工具寫成應用軟體,並受邀至各地推廣講課,且免費提供使用,GEE最後變成統計軟體SAS和SPSS一部分,至今備受科學界推崇。

GEE的應用
流行病學中的遺傳研究探討遺傳和環境因素的交互作用,研究基因在受到環境影響下,人類群體中的疾病發生率和機制。遺傳流行病學使用長期重複測量或群聚等相關性資料,其中家族性數據以兄弟姐妹為受試者分析,而這些數據也不是獨立的。但是過去的研究忽略受試者數據關聯性的問題,而家庭成員之間的相關,更是不容忽視。遺傳流行病學分析若使用不正確的統計方法,選擇忽視數據關聯性,同樣容易得到錯誤的結論。此外,梁院士也以愛滋病(AIDS)藥物研發臨床實驗為例進一步說明。1982年人類免疫缺乏病毒(HIV)被發現,當時雖已開發抗HIV藥物AZT,但因AIDS發生率低,無法在短期內收集足夠的AIDS患者樣本數,因此需要5到6年長期追蹤才能驗證AZT會降低AIDS發生率的藥效。而流行病學研究顯示CD4免疫細胞數量快速的降低會是罹患AIDS的徵兆,也因此經由持續收集CD4數據再配上GEE縱向數據的分析,研究者可以在1至2年的時間驗證AZT是否會減緩CD4的降低,早日完成有效性測試,使新藥物能通過FDA審核早日上市。

期勉的話
梁院士勉勵研究人員要持續對研究抱著興趣和廣泛的好奇心,尋找對人類有益的重要課題,努力尋求解決問題之道。在目前大環境下,研究人員有時候很容易為了發表文章、在意發表篇數、發表期刊影響因子或將重點置於能更早或更容易發表文章,而忽視了更具挑戰性的研究課題。因時間有限,應先排出問題的優先順序後再一一解決,才能有效地對該問題有所貢獻。若日後能得獎或受到眾人肯定,皆是研究過程之自然結果,而不應作為原來研究的初衷或目標。

適逢本院慶祝20週年,我們誠摯地感謝過去為本院付出與貢獻的先進們,而今日因此難得機會與梁院士面對面訪談後,除獲益良多外,也對此位素未謀面的長輩感受到其親切近人的一面。

註:Karl Pearson獎
ISI為了紀念著名的英國數學家及哲學家Karl Pearson,於2013年創立該獎項,表揚於過去30年內所發表對統計理論、方法、實務或應用具深遠影響及貢獻的研究論文或書籍,該獎項每兩年頒發一次。Karl Pearson 爵士為相關係數(correlation coefficient)及矩量法(method of moments)的發明者,也是統計學領域知名期刊Biometrika的創刊主編。
《文/圖:編輯中心張喬菀》