科學人雜誌
特別企劃

AI找新藥

2021/03/29 傅利曼 ( David H. Freedman )
製藥業正陷入藥物開發的瓶頸,人工智慧能否帶來變革?

加快藥物開發

藥物開發程序通常從找出與疾病有關的「目標蛋白質」開始,最終希望找到可以與該蛋白質結合以治療疾病的化合物。Exscientia公司開發的AI程式可針對特定蛋白質,尋找可能與之結合的化合物,並提供新的測試方案來縮減化合物的候選清單以進行後續測試。


藥物開發過程中,有很多原因會導致有潛力的藥物遭淘汰,其中之一是細胞色素P450(CYP450)減少。CYP450由多種酵素構成,主要由肝臟產生,功能是分解體內的化學物質以防在血液中累積過量。事實證明,許多實驗性藥物會抑制CYP450的產生,這種令人討厭的副作用會讓藥物毒害人體。


製藥公司長期以來依靠傳統工具,以預測候選藥物是否會抑制患者體內的CYP450產生,例如在試管中進行化學分析、研究CYP450與類似藥物的交互作用,以及利用實驗小鼠進行測試。然而,研究人員的預測大約有1/3是錯誤的。在這種情況下,製藥公司可能在臨床試驗階段才發現藥物會抑制CYP450產生,導致數百萬美元和長年來的努力付諸流水。必治妥-施貴寶公司(Bristol-Myers Squibb)研發與轉譯醫學部資深副總裁薩哈(Saurabh Saha)表示,這些錯誤預測不僅代價高昂,還可能危及人類的生存。


諸如此類的錯誤導致更大的問題:全球規模達一兆美元的製藥業,在過去20年面臨藥物開發效率持續下滑。如今製藥公司必須花費越來越多資金(排名前10大公司每年花費近800億美元),成功通過臨床試驗的藥物卻越來越少。10年前,投入藥物開發的每一美元資金能獲得10美分的回報,如今收益不到兩美分,原因之一是容易研發且能安全有效治療常見疾病的藥物已開發殆盡,迫使藥廠挑戰複雜難解的罕見疾病藥物,即使研發成功,帶來的收益也十分有限。


美國塔弗茲藥物發展研究中心指出,因開發新藥越趨困難,2003~2013年開發一款新藥進入市場的平均成本增加近一倍,達26億美元。新藥從開發到上市的時程也延長至12年,90%候選藥物在臨床試驗遭淘汰。


因此我們完全可以理解,為何製藥業對於以人工智慧(AI)為工具來開發藥物充滿期待。這些工具並非使用由專家開發的分析技術來運作,而是由使用者提供欲解決的問題(一種分子)和多種解決方案(如何把該分子製造成藥物),AI便能自行發展演算法來解決問題。


大多數以AI輔助的藥物開發應用程式都採用機器學習技術(包括深度學習)。大多數機器學習程式採用小量經過整理且帶有標記的數據;而深度學習程式則使用大量原始格式不一致的數據。因此機器學習程式在接觸過成千上萬張標記細胞細部構造的影像後,就能學會識別細胞的不同特徵;深度學習程式則能從未標記的細胞影像中自行辨識細部構造,但要做到這種程度可能需要輸入上百萬張細胞影像。


許多科學家認為AI最終可在三個層面上促進藥物開發:找出更有潛力的候選藥物、提高命中率(通過臨床試驗並獲政府核准的候選藥物比率)、加快藥物開發過程。例如最近必治妥-施貴寶公司開發並訓練一款機器學習程式來找出抑制CYP450產生的相關數據。薩哈說,該程式預測CYP450減少的準確性提高到95%,與傳統方法相比,失敗率降低了六倍。這些結果可幫助研究人員快速淘汰可能有毒的藥物,把資源集中在更有潛力的候選藥物,以通過臨床試驗並獲得美國食品及藥物管理局(FDA)的核准。禮來藥廠(Eli Lilly)數據長戈帕爾(Vipin Gopal)表示:「AI帶來的巨大改變,在於我們投入巨額資金前,就能預先知道哪些藥物無效。」


許多資源正湧入AI領域,以AI為主力的藥物開發新創公司在2018年募資超過10億美元。截至去年9月的統計與預估,這些公司有機會在該年募得15億美元。所有大型製藥公司都宣佈至少與一家AI新創公司合作,但只有少數幾種透過AI開發的藥物正進行臨床試驗,而且尚未有藥物進入第三期臨床試驗;所有藥物都必須通過臨床試驗才准上市。薩哈承認,還需要幾年才能得知AI預測藥物抑制CYP450產生的準確度是否會提升新藥開發命中率。雖然製藥業大肆宣揚AI的好處,但目前無法肯定好的開始是否就能帶來更多成功藥物。


找出有潛力的藥物

AI程式的興起,並非製藥業的革命性變革。早在10年前,在生物資訊學領域蓬勃發展下,具有強大功能的統計學和生物物理建模程式因而興起,並孕育出可預測分子特性的工具。不過這些程式能發揮的力量有限,因為科學家還未充份了解分子間的作用方式:當科學家不清楚相關數據的重要性與關聯性,便無法讓這些程式找出解答。近來新的AI程式能自行計算出哪些數據更重要,因此可從眾多變數中得出更好的預測結果。


AI可從多種面向切入輔助開發,例如有些AI公司專注於開發安全有效的藥物,而該藥物通常是針對經過詳細研究且與疾病相關的特定蛋白質產生作用。常見方法是找出一種可用以修飾並結合特定蛋白質的分子,使該蛋白質不再導致病症。加拿大的Cyclica公司利用AI,把帶有不同生物物理結構和生化特性的數百萬種分子,與大約15萬種具有不同結構與特性的蛋白質進行匹配,藉此篩選出可能與特定蛋白質結合的分子。


但好的候選藥物仍必須通過其他考驗,包括能通過腸道進入血液且不會立即被肝臟或其他代謝反應分解、在腎臟等器官內發揮作用而不會傷害其他器官、避免與數千種重要蛋白質結合而危害健康、在累積過量前能妥善分解並排出體外。Cyclica的AI程式能考量上述所有情況。Cyclica執行長庫吉(Naheed Kurji)說:「如果某分子可與一種蛋白質結合,通常也會與至少300種蛋白質發生作用。如果你設計出一種分子,那麼也應該考量其他299種交互作用會不會危害人體。」


生物醫學研究人員逐漸體認到,諸如癌症和阿茲海默症等複雜疾病涉及了數百種蛋白質,僅針對其中一種蛋白質可能無法治療疾病。庫吉表示Cyclica正嘗試尋找可與數十種蛋白質結合,又能避免與其他數百種蛋白質發生作用的化合物。目前Cyclica也正從匿名的全球基因資料庫中整理出大量蛋白質變異的資訊,好讓AI程式找出候選藥物適用哪類患者。庫吉認為一旦AI具備這些功能,就能把篩選候選藥物到進入臨床試驗的時間從七年縮短至五年。


大藥廠默克(Merck)和拜耳(Bayer)已經宣佈與Cyclica合作。和大多數AI公司與藥廠的合作關係一樣,這些公司並未明確指出AI會找到何種候選藥物。不過Cyclica分享了一些成功案例的細節,他們找到作用於特定蛋白質的候選藥物,獲FDA核准用於全身性硬皮病,另一種藥物則與伊波拉病毒有關。FDA已核准把這兩種藥物用於治療愛滋病和憂鬱症,若研究有所進展,這些藥物將可能以老藥新用方式迅速通過審核。


有時,研究人員雖然找到很可能在疾病中扮演關鍵角色的蛋白質,卻又發現對其結構和特性所知甚少(人體中有大約90%蛋白質都是如此)。由於缺乏足夠的數據,大多數機器學習和深度學習程式都無法針對該蛋白質找出適合的藥物,也就是無法找出與該蛋白質結合的化合物,並符合安全有效等標準。少數AI公司正在關注這類問題,例如Exscientia公司運用AI程式來尋找可能與特定蛋白質結合的分子。Exscientia執行長、英國丹地大學醫學資訊學教授霍普金斯(Andrew Hopkins)表示,Exscientia開發的AI程式要針對一種蛋白質得到有用的結果,僅需約10組相關數據。


Exscientia的演算法是把與特定蛋白質相關的少量數據,與資料庫裡大約10億筆蛋白質交互作用的數據進行比較。此步驟會大幅縮小可能適用的化合物數量,並指出額外輸入哪些數據將有助於優化結果,例如檢視組織樣本、把蛋白質作用於體內的數據輸入程式後,系統就會進一步縮減可能數量,並再次建議可額外輸入哪些數據以優化結果。重複此過程直到程式產出合理數量的化合物清單為止,這份清單正是針對該蛋白質的理想候選藥物。霍普金斯聲稱Exscientia的開發平台可以讓篩選候選藥物的時間從4.5年縮短為1年,降低該階段80%的成本,亦即只要合成20%數量的化合物,就能找到一種候選藥物。Exscientia正與生技大廠賽爾金公司(Celgene)合作開發用於三種蛋白質的候選藥物。

Exscientia也與葛蘭素史克(GlaxoSmithKline)合作,宣稱已找到一種可治療慢性阻塞性肺病的分子。但就像其他從事藥物開發的AI公司一樣,Exscientia進入這個領域的時間尚短,因此還沒有足夠數量的候選藥物可進入後期臨床試驗,而這一階段通常需要5~8年的時間。霍普金斯聲稱Exscientia找出的其中一種候選藥物最快在今年就會進入臨床試驗,他說:「最終我們會驗證這些候選藥物是否有效。」

預測藥物效果

藥物開發的挑戰,不只是尋找有潛力的藥物,還得先找出藥物作用的目標。為了找出可能導致疾病的蛋白質,生物製藥公司柏格(Berg)用AI篩選人體組織樣本的資訊。柏格公司執行長納拉因(Niven R. Narain)表示,這種方法旨在解決「尋找藥物作用目標的研究」中普遍存在的兩個問題:首先,研究工作往往基於理論或直覺,這可能導致結果偏差與過於限縮候選藥物的數量;其次,研究人員選定的目標往往不是最關鍵的致病蛋白質,就算治療這些目標也無濟於事。

柏格公司採取的方法是從健康人或患者的組織樣本和血液中蒐集資訊,包括基因組學、蛋白組學、代謝組學、脂質組學等,過去在尋找目標時,搜尋範圍通常不會這麼大。柏格公司會在患者罹病的不同階段採樣,並讓樣本裡的細胞暴露於各種化合物和環境條件,例如低氧或高葡萄糖。這種方法可蒐集到相對應條件的數據,包括細胞產生能量的能力或細胞膜的堅固程度。

接下來,研究人員把所有數據輸入深度學習程式進行運算,找出人體在健康或罹病狀態下的所有差異,最終找出與疾病有關的蛋白質。在某些情況下,這些蛋白質會成為治療目標,屆時柏格公司再透過AI針對這些蛋白質搜尋候選藥物。由於柏格公司的程式能找出這些蛋白質使患者發病的時間點,可用來辨認患者可能具有的特徵,例如某些基因。這種技術能用於發展精準醫療,未來可在患者服用藥物之前便進行測試,以確定藥物是否有效。

柏格公司的研發成果中最令人期待的AI開發藥物,是名為BPM31510的抗癌藥物。他們最近完成以晚期胰臟癌患者為對象的第二期臨床試驗,這種癌症發展極為快速且難以治療。第一期臨床試驗主要測試藥物在一定劑量下是否具有毒性,通常不會測試藥物的潛在功效,不過BPM31510針對其他癌症的第一期臨床試驗,證實柏格公司所開發的AI軟體可預測約20%的患者對藥物有反應,以及哪些受試者更可能出現副作用。試驗裡的組織樣本分析讓柏格公司的AI軟體能預測該藥物對侵略性癌症最有效,因為它能攻擊癌症的重要致病機制。納拉因表示如果該藥獲得核准,柏格公司打算針對1%服用該藥的患者進行上市後分析,以改進這套軟體的準確度。柏格公司正與阿斯特捷利康公司(AstraZeneca)合作,尋找針對帕金森氏症和其他神經疾病的治療目標,並與賽諾菲巴斯德公司(Sanofi Pasteur)合作以改善流感疫苗。柏格公司還與美國退伍軍人事務部和克里夫蘭醫院合作尋找攝護腺癌的治療目標。該軟體已找出可區辨攝護腺癌與良性攝護腺肥大的診斷方式,過去通常需要額外檢查才能區分兩者。


製藥界的新契機

藥廠把AI導入藥物開發的熱情,可從近年來20多則大藥廠與AI開發藥物公司合作的新聞報導中看出端倪。據說輝瑞大藥廠、葛蘭素史克和諾華(Novartis)等製藥公司都建立龐大的AI系統,其他公司可能也正在進行。儘管這些公司的研發主管對AI帶來的初步成果感到興奮,但他們承認由於目前很少有AI找出的候選藥物進入動物試驗階段,遑論進行人體試驗,因此無法確定AI未來能否為製藥業找到新藥。基因科技公司(Genentech)開發科學部資深副總裁肯克雷-密特拉(Sara Kenkare-Mitra)表示,AI能否成功提高藥物開發效率,目前尚無定論,即使真的有效,「我們還不確定AI將會帶來小幅度改善或能大幅提高效率。」縱使AI找到的許多候選藥物順利進入臨床試驗,或許答案仍得等到藥物獲得FDA核准後才能得知。

薩哈認為,短期內以AI輔助開發的藥物進入市場的命中率可能不高。不過如果機器學習和深度學習系統能更準確篩選出安全有效的藥物,且能預測最適合服用的患者,藉此簡化臨床試驗和核准流程,便可能大幅提升藥物進入市場的命中率。薩哈說:「當政府單位和我們一樣看到AI的重要價值時,就會為製藥業帶來變革。一旦我們能證明藥物可以在避免危害人體的情況下治療疾病,政府就可能允許我們跳過動物試驗,直接進行人體試驗。」不過他也承認,要帶來這種變革還要很多年。他補充道,AI並非取代科學家和傳統研究,雖然AI能為人類帶來更大的利益,但它仍需要人類才能發展出嶄新的生物學觀點、建立研究方向和研究優先順序、指引並驗證結果,以及產生所需的數據。

納拉因提到,對於AI藥物開發的高度期待與炒作氛圍,實際上可能會造成傷害,因為期待過高可能導致失望和衝擊。他說:「現在還處於起步階段,我們必須保持清醒,AI確實可以提供幫助,但還不是解決方案。」庫吉批評那些言過其實的AI公司,例如宣稱能把開發藥物原本所需的數年時間和數十億美元,降為數星期和數十萬美元,「這根本不是真的,這樣說不但不負責任,而且毫無幫助。」即使炒作可能帶來傷害,庫吉仍相信真正能幫助製藥業引進AI的關鍵,是提供AI更多高品質的數據,「我們依靠三樣東西:數據、數據,以及更多數據。」輝瑞大藥廠藥物科學部的副總裁黃以諾(Enoch Huang,音譯)對此表示贊同,他認為開發精良的演算法並非最關鍵的因素。

隨著研究人員進行許多與AI相關的數據實驗,他們更加了解提供AI大量數據的必要性,這一點將帶來科學變革。肯克雷-密特拉指出,這種情況已發生在免疫療法藥物研究當中:「醫療院所提供的數據總是不夠機器學習使用,但我們可使用實驗室產出的數據。」

這種方法很可能啟動藥物開發的良性循環,讓AI協助研究人員尋找治療目標和藥物。這些成果又會提供研究人員大量的相關數據,讓AI更有能力帶來豐碩的結果。肯克雷-密特拉說:「我們不依賴AI,而是與AI合作。」



本文章由大亞集團獨家贊助開放全文閱讀,更多精彩文章請前往【Global Next】


更多文章
活動推薦更多
追蹤科學人