健康與科學

真檢驗,假結果

美國食品及藥物管理局大力整頓醫事檢驗項目!

撰文/施密特(Charles Schmidt)
翻譯/黃榮棋

健康與科學

真檢驗,假結果

美國食品及藥物管理局大力整頓醫事檢驗項目!

撰文/施密特(Charles Schmidt)
翻譯/黃榮棋


每一年,美國的醫院總共會開出幾十億張醫事檢驗單,檢驗項目包括血液、膽固醇、阿茲海默症高風險基因等各種疾病指標,醫師與病患通常對檢驗結果都毫不懷疑,而大多時候結果也都可信。然而事實上,並非所有醫事檢驗實驗室都可靠,有問題的檢驗結果可能會造成嚴重後果:有時是沒有檢驗出致命症狀,有時則是檢驗出不存在的問題,這些都會導致不必要、不適合甚至對病患有危險的治療措施。


有許多醫事檢驗項目的管控標準,不像其他用來找出疾病風險或確認症狀的診斷技術那麼嚴格,其中有一類醫事診斷項目,由某間實驗室設計、研發並解釋結果,稱為「實驗室發展出來的檢驗」(lab-developed test, LDT),目的與一般醫事檢驗旨在讓所有臨床醫護人員都能了解並應用的考量有所不同,當一般血液檢查結果無法用來診斷病患狀況時,醫師才會改採LDT檢驗。


問題是這領域的專家認為許多LDT項目是無效的,有些LDT甚至可能對病患造成傷害,因為其檢驗結果誤導了醫師,讓許多病患以為自己罹患了某些罕見疾病,或檢驗出沒有明確證據顯示對病患有害的症狀,又或者讓病患以為自己身體健康、卻缺乏可靠證據支持檢驗結果。哈佛醫學院病理學助理教授阿諾(Ramy Arnaout)說︰「我們往往認為LDT的結果是最終的真理,但沒有任何一項LDT的結果是100%正確的,有些LDT項目根本沒有任何醫療價值。」


美國食品及藥物管理局(FDA)正採取措施來恢復大眾對LDT的信心。2014年FDA首次提出法規把這些LDT納入政府監督範圍,包括研發者必須提出可信數據證明其正確有效才能上市。FDA雖不願對此發表評論,但幾條來自業界的消息指出,這法規的最後裁決也許不久就會生效,這將讓某些醫事檢驗實驗室的主持人備感壓力,因為他們認為這樣會增加成本並妨礙醫療行為。


25年前LDT在臨床醫療扮演的角色很小,所以不是FDA關注的對象。當時只有少數幾種LDT項目受到廣泛使用,最著名的就是用來檢驗子宮頸癌的子宮頸抹片檢查。當時FDA採取「非目前管制重點」的政策,亦即FDA原則上不會去管控LDT,而是專注於會造成顯著傷害的高風險醫療器材,例如運作失常的心臟節律器。


持續擴大的法律漏洞


不過1990年代以來,在研究人員發展出新的遺傳工程技術之後,LDT在臨床上的應用價值就急遽竄升。舉例來說,早先的LDT偵測的只是一些不尋常的蛋白質,但一些新興的LDT基因檢驗,可從人類基因組的DNA序列已知的30億對鹼基或核?酸字母中,尋找與疾病相關的異常位置。此外,檢驗流程自動化也讓LDT的設計與應用變得越來越容易。遺傳工程的進步大幅增加了上市的LDT數量與多樣化,據估計現在大約有1萬1000間醫事檢驗實驗室,提供6~10萬種LDT;但因為LDT上市不必註冊,當然也就無法明確知道真正數量。現行聯邦法規巨大的法律漏洞,在於LDT不必接受醫療效益相關評鑑,也不必把研究結果公諸於世。研發這些LDT的醫事檢驗實驗室不必遵循科學研究的某些基本法則,FDA也不會如同對多數處方用藥或醫療器材裝置那般,審查這些LDT項目。


也就是說,這個法律漏洞讓剛起步只提供一兩項LDT的小實驗室,到提供數千項LDT的大型醫事檢驗實驗室,都可以自由研發新的LDT並收費,而研發難度遠比大多數其他類型的醫療產品容易得多。但快速增加的LDT項目,伴隨而來的是一連串研究報告,指出某些LDT項目的檢驗結果會導致醫師誤診,甚至已經對病患造成傷害。


FDA舉了20種特別有問題的LDT項目為例,包括經常出錯的萊姆病與百日咳檢驗,以及聲稱藉由檢驗血液中是否存在CA 125蛋白質,可評估女性罹患卵巢癌風險的LDT。FDA在2016年9月指出,篩選檢驗這個蛋白質並「無確證的臨床效益」,並提醒醫師不要建議病患或開立這項LDT。


其中許多讓FDA提出警告的LDT項目,的確可能檢驗了研發者宣稱可測量的目標物,問題是測得的東西不見得是某特定醫療問題的良好臨床指標。以卵巢癌檢驗為例,CA 125是由卵巢細胞所生成的一種蛋白質,高量的CA 125蛋白質理論上應該代表具有過多卵巢細胞,也就是有腫瘤存在;但事實上卻發現,許多具有高量CA 125蛋白質的婦女並沒有罹患卵巢癌。因此,CA 125蛋白質無法做為是否有腫瘤的臨床檢驗指標。但有不少檢驗出陽性反應的婦女,因為害怕罹癌,甚至決定摘除健康的卵巢。


確認臨床效益


流行病統計學採用一種稱為陽性預測值(positive predictive value, PPV)的統計方法,來評估某項醫事檢驗項目是否真能做為病患狀況的臨床檢驗指標,計算PPV可得知某特定族群出現某種症狀的機率。打個比方來說,如果你把帶餌的魚鉤丟入裝滿魚的水桶,那麼釣線受到拉扯就代表有魚上鉤的機率頗高;但若把同樣帶餌的魚鉤丟入魚不多的淡水湖中,每次釣線受到拉扯時有魚上鉤的機率,就比被樹枝勾到來得低了。由於水桶裡的魚密度遠比淡水湖高,因此水桶裡釣線受到拉扯,代表魚上鉤的PPV接近100%,而魚數量不多的湖中釣線受到拉扯,其PPV值則遠低於100%。上述差異可以解釋為何FDA會質疑最近一項卵巢癌篩檢的LDT,研發者宣稱其PPV為99.3%。但生物統計學家仔細分析後發現,此PPV值乃根據單次實驗計算而來,這次實驗的受試者超過一半是罹患卵巢癌的婦女,這樣經高度挑選的族群形同滿是魚兒的淡水湖。


因此當研究人員把美國婦女罹患卵巢癌的真實機率(每2500位停經後婦女有一位罹患)納入公式重新計算後,發現其PPV值就從99.3%急遽下降為6.4%。也就是說,每15位卵巢癌陽性反應的受試者,只有一位可能真的罹患卵巢癌。而另外14位若單靠這項檢驗結果,就可能誤信自己有99.3%的機率罹患卵巢癌,甚至因而摘除原本健康的卵巢。


嚴格把關


由於FDA沒有資源可用來監督近年來所有上市的LDT,因此打算根據檢驗結果的誤導性或錯誤而可能造成重大傷害的機率,把LDT分類成三大範疇,新法規這麼規定:不正確的LDT結果會造成死亡或延長失能期,稱為高風險LDT項目。這類檢驗要接受最嚴格的審查,其相關資訊必須登錄至全國資料庫,製造商上市前也得向FDA提出其安全性與醫療效益相關的證明。約翰霍普金斯大學彭博公衛學院的教授夏夫斯丁(Joshua Sharfstein)說:「原則上,FDA要看到有證據支持高風險LDT項目,才會准許它上市。」


這項策略也讓許多業界領袖以及包括美國醫學會的某些專業醫學會憂心。梅約醫事檢驗實驗室每年進行2500萬項LDT,實驗室主任韓森(Curtis Hanson)說:「這要看FDA怎麼定義高風險,但現在並不清楚。目前所有上市的LDT可能有1~10%是高風險的醫事檢驗項目。FDA該如何審查、如何有效找出可能有問題的LDT申請項目呢?」然而對病患與醫師而言,問題則更為根本:他們為何需要對已上市的醫事檢驗項目是否弊大於利感到煩惱呢?


更多相關文章

2018年12月202期睡眠學習不是夢 雜誌訂閱

本期最新文章