从费氏临床试验谈近代生物统计张忆寿61 熊昭
從費氏臨床試驗談近代生物統計
張憶壽 熊
昭
一.楔子
在許多人的觀念中,凡是與醫學、藥學、動物、植物等有關的隨機現象均在生物統計(Biostatistics)的知識範圍之內。從這個角度來看,我們當能理解生物統計給人的拼盤印象。這情形與理論數學中的主題鮮明,層次井然固然不同,而與統計學中某些分支所表現的精雕細琢也不甚一樣。但是這種拼盤印象似乎逐漸成為過去了。生物統計學的內容在過去三、四十年間有了相當的充實與改變。這種充實與改變一方面是基於醫藥研究上的急切需要,另方面則是由於近代機率論的適時成長。而代表這種充實與改變的兩個主要分支便是存活分析與序列分析。
在本文裡,我們要先介紹一個著名的費氏白血病患存活數據,然後指出要能充分利用類似這樣的數據而得出科學性結論便是當代存活分析與序列分析的主要目標。希望這個簡單的介紹能夠幫助具有大學乃至高中數學程度的人士暸解生物統計的要旨。
二.費氏白血病患存活數據
1
費氏(Freireich)等人在1963年報告了一個關於白血病患的存活數據。這套數據給許多生物統計學家研究過。我們現在參考Andersen,Borgan,Gill&Keiding
(1993)及Siegmund(1985)來陳述這套數
據。
當時,在美國的十一家醫院裡,有62個患有急性白血病(acuteleukemia)的病患,這些病患是在接受類固醇(prednisone)治療後得到部分或完全緩解的小孩。緩解(re-mission)在這是指骨髓中的病況消失。這62個病患接受了一個緩解維持治療方案(re-missionmaintenancetherapy)。它的做法是這樣的:以醫院為單位,把在同一醫院內的這些病患依照緩解狀況加以配對,然後在每一對中隨機抽出一位給他施予6-MP治療,而剩下的一位則給他安慰劑(placebo)。
下表所列的是21個完整配對的緩解時段數據。緩解時段(remissionlength)是指病患配對後(約為緩解發生時刻)至白血病復發時刻的時段長度。譬如說,第5對病患中用安慰劑的是8週後開始復發,用6-MP的是22週後復發。
从费氏临床试验谈近代生物统计张忆寿61 熊昭
2數學傳播十九卷二期民84年6月
(i)安慰劑6-MP勝負淨贏W(i)
表一.
表中第一行為對數,第二行為某對中
使用安慰劑的病患的緩解時段,第三行為使用6-MP之緩解時段,(皆以週為單位),第四行為該對勝負狀況,1表示6-MP得勝, 1表示安慰劑得勝,第五行為W(i)。例如第7列說第7對病人中使用安慰劑的緩解期為2週,使用6-
MP的是16週,所以6-MP得勝,而在第7
對的勝負分曉時,6-MP一共淨贏3分。
基於人道考量,這個試驗是所謂的序列試驗;即,要在能看出6-MP與安慰劑之優劣後儘早停止試驗,以免病患成為劣等治療法的無謂犧牲品。因此,試驗開始之前便如下規定:如果一個使用安慰劑的病患比他配對的病患早產生復發現象,則記安慰劑缺點一次;反之,則記6-MP缺點一次。而當雙方缺點次數的差距大到一個程度時,則即刻停止試驗。
由於停止試驗的時候,很可能還有病患處於緩解期間。對這些病患,我們沒法知道他的緩解時段有多長,而僅知道他在緩解開始至試驗結束止的這一時段內沒有復發。數據表裡第3對病患中服用6-MP的那位便是在32週後,試驗終止了,而仍處在緩解期中的一個例子。這種情形的數據是一種所謂的設限數據。如果一個病患因為其他因素在白血病復發前死亡,或中途離去而不在試驗觀察之中,則所觀察到的數據也稱為設限數據。
三.
序列分析
我們先引入一些數學符號來描述上述數據。
令Yi是第i對病人配成對的時刻(約
為緩解發生的時刻)。令Xi1,Xi2分別代表第i對病人中採用6-MP與採用安慰劑的緩解時段。
對
从费氏临床试验谈近代生物统计张忆寿61 熊昭
第二節中所說的停止整個試驗的時間可以更清楚的敘述如下。
令Wi(t)為第i對病人在時間(日曆)t時6-MP與安慰劑的勝負狀況。即當Xi1∧t>Xi2∧t時,令Wi(t)=1,當Xi1∧t<Xi2∧t時,令Wi(t)= 1,當Xi1∧t=Xi2∧t時,令Wi(t)=0。(這裡a∧b是指a與b二數中較小的那數)。
令W(t)=
表了在t時刻,6-MP n
i=1
Wi(t)。則W(t)代
比安慰劑多得的點數。這裡n為一適當大的數,大於可能配成的對數。令Ti=Yi+Xi1∧Xi2。令T(k)為{T1,T2,···,Tn}中第k小的數。因此T(1)≤T(2)≤···T(n),而且{T1,···,Tn}={T(1),···,T(n)}。
由於W(t)只在當t=T(i)時才會變動它的值,令W(i)≡W(T(i))。W(1),W(2),···,W(n)這個有限數列就代表了6-MP與安慰劑的勝負記綠。為了方便,我們可以把(i,W(i)),i=1,2···,n劃在座標平面上。
當時,Freireich等人便是預先把座標平面分成幾個區域,分別叫G,G1,G2,G3(如圖一),然後規定好,一旦有一個i,使得(i,W(i))離開G,則停止試驗。用數學符號來講便是定義停止時刻
S=inf{i|(i,W(i))∈/G}.停止試驗時,如果(i,W(i))是在G1,則說6-MP較好,若在G2,則說安慰劑較好,若在G3,則說兩者無甚差異
。
從費氏臨床試驗談近代生物統計3
圖一
這種一邊收集數據,一邊做統計分析,然後再決定是否要繼續收集數據的設計稱為序列設計,相關的分析叫序列分析。它是當今統計領域中理論比較豐富的一支。但是,在1960年代初期它的理論還是相當年輕的。關於這裡的情形,就有許多問題是當時無法回答的。
Freireich等人所選的這個G,G1,G2及G3具有下述性質。令P=P(Xi1>Xi2)。如果P=0.75,則這試驗會有0.95的機率說6-MP較好,如果P=0.25,則這試驗會有0.95的機率說安慰劑較好。
為什麼選用這樣的{G,G1,G2,G3}呢?很自然的,我們要問,如果有另外一組{G′
,G′
′
′
1,G2,G3}也具有上段所說的性質,我們該選用那一組?這時侯有一個簡單的選擇辦法,即,看那一組所需的樣本數S較少。用心的讀者不難發現這不是一個容易的問題。
从费氏临床试验谈近代生物统计张忆寿61 熊昭
4數學傳播十九卷二期民84年6月
四.存活分析
上述判定6-MP與安慰劑優劣的辦法只
是許多辦法之一。它是有些粗糙的,因為它只看每一對病人中的相對勝負,即Xi1>Xi2或Xi1<Xi2,而沒有把其他的量,譬如說,Xi1 Xi2,考慮進去。
近代存活分析的主要貢獻之一便是提出了處理這個問題的一個辦法。下邊我們先介紹這個辦法,再提一下它的背景。為此,我們引入隨機過程
Nik(t)=1[Xik,∞)(t∧T).
這裡T是整個臨床試驗停止的時刻。Nik(t)記錄了第i對第k人在t時刻是否仍在緩解期。
假設Xik的風險函數(hazardrate)是λik(t)。λik(t)的意思是一個緩解期大於或等於t的人會馬上復發的機率。假設λi1(t)=λi2(t)·eθ,則θ便是一個比較6-MP與安慰劑優劣的一個指標,在存活分析裡,這叫做相對風險係數(relativeriskco-e cient)。有的文獻稱之為療效(treatmente ect)。令G(θ,t)=
21 2 t
i=1k=10
2
Zik k=1
1(0,Xik]eθZikZik
(s)
从费氏临床试验谈近代生物统计张忆寿61 熊昭
估計θ0;但是,T愈大,使用劣等治療法的時間愈久。怎樣的T最好?這又是序列分析的課題了。
五.結語
在第三節、第四節中我們藉著Freireich
數據介紹了一點點的序列分析及存活分析的概念。這兩門學問都有相當的內容,一方面它們成功的扮演了科學之僕的角色,另方面它們也造就了自己的理論。但是,Freireich的試驗所能提出的科學結論就只這樣嗎?
Freireich等人的論文中沒有把Yi報告
出來,只報告了Xik及Xik+
。許多後來的統
計學家便依照這樣的數據提出新的統計方法去分析6-MP的療效。除了Sellke&Sieg-mund(1983)之外,沒有人從序列分析的觀點來研究這數據。在Sellke&Siegmund的
從費氏臨床試驗談近代生物統計5
工作之後,許多人瞭解到這工作的困難情形,也注意到當時Freireich沒發表Yi是相當可惜的。事實上,Sellke&Siegmund不是以研究這套數據為目標,他們是要建立更一般的序列分析理論。他們沒有考慮到配對的設計。如果把配對的設計考慮進來,該如何做呢?事實上,這時候比較好做,最近我們在這問題上得到了一些結論。
參考文獻
文中所引論文多可在以下兩本書中找到
1.Andersen,P.K.,Borgan,φ,Gill,R.D.,Keiding,N.(1993).StatisticalModelsBasedonCountingProcesses.Springer-Verlag.
2.Siegmund,D.O.(1985).SequentialAnalysis.Springer-Verlag.
—本文作者任教於中央大學數學系與
中央研究院統計科學研究所—