正文 五、統計癌症(2 / 3)

假設其中的一個村莊,引進了高度敏銳的癌症檢測手段,比如將血液裏阻礙蛋白(proteinPreventin)的濃度作為癌症的標記。假設阻礙蛋白法是一個完善的偵測試驗。阻礙蛋白呈“陽性”的男女,就直接被計入患癌症的人群。

我們進一步假設,阻礙蛋白是一個極其敏感的檢查,能揭示很早期的癌症。因為這項難以置信的測試會越來越早地抓出癌症,所以引進後不久,甲村診斷出癌症的平均年紀就會從70歲變成60歲。然而,由於引進阻礙蛋白測驗之後,並無有效的治療介入,兩個村子平均死亡的年齡仍然相同。

對於沒經驗的觀察者來說,這個方案可能會產生奇怪的效果。在甲村,阻礙蛋白診斷起了作用,現在檢查出癌症的年齡是60歲,病人死於80歲,有20年的存活期;在乙村,沒有阻礙蛋白診斷,70歲時才檢測到癌症,病人死於80歲,有10年的存活期。然而,“增加”的存活時間,不可能是真實的。阻礙蛋白,怎麼能僅憑其存在,而沒有任何介入治療,就增加了存活時間呢?

答案是顯而易見的:存活時間的增加,當然是一種假象。存活率看起來增加了,但其實是由於診斷方法改進而使診斷時間提前,從癌症診出到死亡之間的時間增加了。

避免這種偏差的簡單方法是,去衡量總死亡率,而不是存活率(上麵的例子中,即使在引入早期診斷的測試方法後,死亡率仍保持不變)。

但這樣在方法上也有嚴重的瑕疵。“癌症相關的死亡”是癌症記錄的原始數據,其統計數字來源於宣告病人死亡時醫生登記的診斷結論。把原始數據在很長一段時間內作對比的問題在於:總的來說,美國全體居民(像別國一樣)正在逐漸變老,癌症相關的死亡率必然隨之慢慢增長。老人不可避免地會攜帶癌症,就像潮水攜帶著漂浮物。老年公民占更大比例的國家,似乎比年輕公民多的國家有更多的癌症纏身,即使真實的癌症死亡率並沒變。

為比較隨時間推移的樣本,需要其他方法把兩組人群調整到相同的標準上——事實上,是在統計學上實現一組人到另一組人的“縮放”。這把我們帶到了貝勒分析中新觀念的核心:為完成縮放,他使用了一種獨特有效的標準化處理,稱之為“年齡校正”。

為理解年齡校正,請想象兩組非常不同的人群。一組人群年輕人居多,第二組人群稍年長。如果要統計“原始”的癌症死亡人數,則較年長的人群會明顯有更多的癌症死亡病例。

現在,設想一下對第二組做出校正,以消除年齡的差異。以第一組人群為參照,調整第二組,當年齡差異被消除後,死亡率也會按比例縮減。年齡校正後,兩組人群現在包含相同數量的老人和年輕人,以及相應調整的死亡率,特定癌症產生了相同的死亡率。貝勒在幾十年間反複執行這個運算:他每年把人群分成多個年齡組:20~29歲,30~39歲,40~49歲,以此類推,然後使用1980年的人口分布(任意選取,作為標準),把其他年份的人群轉變為同樣的分布。癌症發病率也相應調整了。一旦各組分布被調整成相同的具有標準結構的人口,該人群就可以隨時間推移被研究和比較了。

貝勒和史密斯在1986年5月發表了他們的文章,撼動了腫瘤學界的根基。甚至連溫和的悲觀派人士凱恩斯也曾期望,隨時間推移癌症相關的死亡率至少會小幅下降。但貝勒和史密斯發現,即使凱恩斯也實在是太過寬大了:1962年到1985年,癌症相關的死亡上升了8.7%。這一增長反映了多種因素,影響最大的是20世紀50年代吸煙率的增長,導致了肺癌的增長。

擺在眼前的事情是:美國癌症的死亡率並沒下降。貝勒和史密斯悲傷地寫道:“沒有證據表明35年來堅持不懈改善癌症治療的努力對臨床效果(死亡率)這個最基本的標準,有太多的整體效果。”他們繼續寫道:“我們打輸了抗癌戰爭,盡管有一些不常見的疾病(如兒童白血病和霍奇金病)取得了進展,改善了病情的緩解,有效地延長了生命……但這35年專注在提高治療上的熱切努力,必須被評價為十足的失敗。”

在裝腔作勢的學術圈內,“十足的失敗”這個短語別有深意。貝勒是在用這個詞,向癌症當權派宣戰,反對國家癌症研究所、反對價值數十億美元的癌症治療行業。一位記者把他形容為“國家癌症研究所的眼中釘、肉中刺”。醫生們抨擊貝勒的分析,說他是一個老愛唱反調的人、恐嚇者、虛無主義者、失敗者以及想法古怪的人。

可以預見,回應如洪流般湧現在醫學雜誌上。一個批評陣營爭辯說,貝勒-史密斯的分析看上去令人驚恐,不是因為癌症治療無效,而是因為沒有實施足夠強勢的治療。這些批評者說,化療的實施比貝勒和史密斯臆想的要複雜得多;非常複雜,以至於大多數腫瘤學家對全劑量化療的前景都非常踟躕。他們指出1985年的一項調查作為證據,當時估計隻有1/3的癌症醫生對乳腺癌使用了最有效的組合治療。一位著名的評論家寫道:“我估計,早期積極使用多重化療醫治乳腺癌,可以挽救1萬人的生命,而不是現在的僅僅挽救了幾千人。”