近年來,人工智慧成為新的創新的動力,持續推動各個領域的演進,其中藥物開發就是一個備受注目的焦點。相較於過去動輒十年以上的藥物開發時間,人工智慧可望加速藥物開發流程,降低財務負擔,許多知名藥廠與藥物設計公司(例如:BenevolentAI、Exscientia、AstraZeneca、Pfizer、Microsoft、Novartis等公司1)也紛紛投入人工智慧領域。人工智慧的應用領域擴及包括:藥物開發、臨床測試、品管、製造、產品開發與管理等面相,而藥物開發更是涵蓋藥物設計、多重藥理學(polypharmacology)、化學合成路徑規劃、老藥新用與藥物篩選等各式各樣的應用2。方法學自傳統的機制為基礎如蛋白質小分子嵌合實驗,一路演進至資料驅動的模式,從過去實驗資料中採用機器學習與深度學習分析模式獲取知識,並用以預測未知化合物的特性;而最常採用的方法為監督式學習(supervised learning),即藉由分析大量標註(進行實驗取得的標註資料)與化合物結構間的關聯就能有效預測新化合物結構的生物活性。然而,監督式學習仰賴的大量標註資料在藥物開發領域幾乎是難以取得,特別是相較於複雜度動輒超過1010以上的化學空間而言。目前監督式學習方法學習到的僅僅是化學空間中的一個小角落,也因此對於差異較大的化合物結構的預測效果往往有限。
圖:人工智慧在藥物產業的相關應用2
借鏡於影像與自然語言處理領域的成功經驗,近期有許多研究專注於探討不須標註資料的非監督式學習(unsupervised learning)中的自監督學習(self-supervised learning),透過學習資料本身的結構或特性,建立預訓練模型,接著利用潛在空間(latent space)進行監督式學習或是生成式學習(generative learning)。舉例來說,NVIDIA發表的MegaMolBART(https://catalog.ngc.nvidia.com/orgs/nvidia/teams/clara/models/megamolbart)就是透過學習5億個分子結構的特性建構預訓練模型,其產生的潛在空間就能用來進行少量資料的監督式學習,甚至生成式藥物設計。其他像是自編碼器(autoencoder)或是對抗生成網路(generative adversarial network)等相關衍生的演算法在近年也有許多進展3。就目前的研究進展來說,人工智慧於藥物開發的應用仍處於萌芽階段,在研究計畫與科技大廠陸續投入後,未來幾年預期將能看到許多突破性的應用。
參考資料:
- Savage, N. Tapping into the drug discovery potential of AI. Biopharma Deal. (2021) doi:10.1038/d43747-021-00045-7.
- Paul, D. et al. Artificial intelligence in drug discovery and development. Drug Discov. Today 26, 80–93 (2021).
- Pandey, M. et al. The transformational role of GPU computing and deep learning in drug discovery. Nat. Mach. Intell. 4, 211–221 (2022).
文:生技與藥物研究所童俊維研究員/圖:Drug Discovery Today