醫療人工智能的三個時代

    醫療人工智能的三個時代

    judong 2025-03-31 聯系我們 40 次瀏覽 0個評論

    原創 趙喜同學

    人們對人工智能(AI)的興趣達到了前所未有的高度。整個醫療保健領域的領導者都面臨著在何處、何時、如何部署AI,以及如何了解其風險、問題和可能性等問題。

    各種AI的能力和風險明顯不同。正如在制定治療方案時將細菌和病毒感染歸為一類可能會導致錯誤的臨床結果一樣,將不同種類的AI歸為一類可能會將醫療決策者引向錯誤的道路。來自美國的學者將AI分成了簡單實用的AI三個時代的框架,可以幫助決策者在技術變革的今天了解不同類型人工智能的優勢、劣勢和挑戰。我們今天一塊學習一下。

    人工智能 1.0:符號 AI 和概率模型

    在人工智能發展的最初 50 多年里,大多數人工智能都專注于將人類知識編碼成機器規則。我們可以將其理解為許許多多的 "如果-那么 "規則或決策樹。這種符號人工智能取得了一些非凡的成就,例如 IBM 的 "深藍"(Deep Blue)在 1997 年擊敗了國際象棋世界冠軍。在醫療保健領域,INTERNIST-I 等工具旨在表達有關疾病的專家知識,以幫助處理具有挑戰性的病例。

    符號人工智能也有一些關鍵的局限性,特別是在構建過程中始終存在人為邏輯錯誤的風險,而且由于其知識庫完全依賴于創建者,其規則中也存在偏見。但最重要的問題可能是,從經驗上看,符號人工智能存在基本能力限制,在面對真實世界的情況時顯得脆弱不堪。作為回應,研究開始更多地關注概率建模,如傳統的回歸和貝葉斯網絡,這使得專家知識和經驗數據都能為推理系統做出貢獻。這些模型能更優雅地處理現實世界中的情況,并在醫療保健領域找到了一些用武之地,但在實踐中難以擴展,管理圖像、自由文本和其他復雜臨床數據的能力有限。

    圖片源自網絡

    人工智能 2.0:深度學習時代

    研究更多數據驅動方法的工作,即廣義上的機器學習,植根于這樣一種理念:智能的關鍵是從錯誤中學習。20 世紀 80 年代和 90 年代的錯誤反向傳播等發現奠定了基礎,但真正的革命發生在 2010 年代初。隨著數據集的增長和計算機速度的加快,使用多層神經網絡的深度學習開始發揮其作用,人工智能 2.0 時代開始了。首先,卷積神經網絡架構賦予了計算機 "看 "的能力,它們獲得了對照片中的圖像進行分類(如 "貓 "與 "狗")的能力。如今,在手機上搜索成千上萬張照片是一件輕而易舉的事,無需手動為每張照片標注內容。個人甚至可以識別照片中自己一無所知的事物,如特定類型的植物。語音識別已司空見慣。人們可以在 100 多種語言中進行翻譯,無論是通過打字還是將相機對準使用他們不懂的語言書寫的單詞。

    深度學習還讓醫療保健領域的新事物變得實用。本世紀《美國醫學會雜志》(JAMA)上最具影響力的一篇文章顯示,眼科醫生可以從視網膜照片中識別出糖尿病視網膜病變。研究人員還在乳腺癌和肺癌篩查、病理學、皮膚病鑒定以及從電子健康記錄數據中進行預測等諸多領域取得了突破性進展。

    深度學習算法從標有基本事實("這張圖片是一只貓")的示例中學習。然后,它們學習模式,而不是通過編程來確定模式是什么。在這個時代,對計算機進行編程學習比用專家提供的規則硬編碼要容易得多,至少在許多任務中是如此。這些模型具有非凡的能力,但也存在重大風險。當實時數據與訓練數據不同時,模型可能會失效。例如,如果一個模型只接受了 "貓與狗 "的訓練,但給它一張飛機的圖片,它就不會給出好的結果。這種分布失衡問題的更微妙版本是醫療保健領域的一個重要安全問題。還可能出現復雜的偏差,涉及基礎數據的包容性、基于種族的不平等和不公平的診斷和治療選擇、算法設計選擇以及其他問題。

    圖片源自網絡

    人工智能 3.0:基礎模型和生成式人工智能

    醫療人工智能的三個時代

    人工智能 2.0 有一個關鍵問題,與有點兒夸張的災難性遺忘有關:在處理長文本序列時,它很難記住序列中較早的內容。2017 年出現的轉換器架構幫助解決了這一問題,讓模型在處理長段落時能夠集中注意力。隨后幾年,轉換器與更多計算和更多數據相結合,創建了基礎模型和大型語言模型。2022 年和 2023 年,進展速度急劇加快,標志著第三個時代的到來。

    人工智能 2.0 區別于人工智能 3.0 的兩個關鍵要素。首先,人工智能 2.0 是針對特定任務的。它一次只做一件事。如果個人希望它做其他事情,就需要一個新的數據集和訓練一個新的模型。其次,人工智能 2.0 在很大程度上是對事物進行預測或分類。它生成新單詞、圖像或其他內容的能力有限。

    人工智能 3.0 則從根本上不同。它可以完成許多不同的任務,而無需重新訓練。例如,一個簡單的文本指令就能改變模型的行為。像 "為專家顧問寫這張便條 "和 "為病人的母親寫這張便條 "這樣的提示會產生明顯不同的內容。這些模型的能力也有顯著提高:解釋真正復雜的問題;接受并生成文本、圖像和聲音;創建與人寫的幾乎無異的回復;以及進行長時間對話。這些模型有多種類型,我們將重點討論一個重要的類別--大型語言模型。

    這些模型已經影響到我們的日常生活,如寫作助手、圖像生成器、軟件編碼助手和聊天機器人。針對健康領域的大型語言模型現在也已經存在。例如,Med-PaLM 和 Med-PaLM 2 是谷歌開發的經過醫學調整的基礎模型,在醫學執照考試類型的問題上達到了專家級水平。當醫生將 Med-PaLM 2 的答案與不了解其來源的醫生所寫的答案進行比較時,在 9 個評估維度中的 8 個維度上,醫生都強烈傾向于該模型的答案。想象一下,有一大堆文檔。一個人按順序向模型展示每個單詞,但不讓它看到下一個單詞。相反,要求模型一次又一次地預測單詞。每當模型預測錯誤一次,它就會改變其內部關于單詞如何組合在一起的表征。最終,它就會建立一個關于這些單詞(以及概念)如何組合在一起的表征。之后,當該模型被問到一個問題時,它就會通過預測答案中可能出現的下一個單詞來做出反應。

    將這些模型的基本版本視為下一個單詞預測引擎。這有助于理解它們的一些驚人行為。例如,這些模型可能擅長編寫計算機程序,卻不擅長算術。為什么呢?因為它們不是在做數學,而是在預測一個序列中的下一個單詞。

    同樣,它們可能會返回聽起來合理但不正確的期刊引文。為什么?同樣的原因:他們不是在PubMed上查資料,而是在預測似是而非的下一個詞。這些 "幻覺 "是人工智能 3.0 中的一個新風險類別。在這一領域,基礎和檢索增強生成等方面的技術進步正在積極提高性能,這些模型使用計算器等工具或實時訪問網絡的能力也提高了結果。我們預計,人工智能 3.0 將作為增強工具投入使用,最初將幫助解決醫療保健方面的問題,如文檔記錄負擔。隨著這些工具隨后開始支持臨床實踐,臨床醫生也將參與其中,因此需要一個深思熟慮的監管框架,以幫助確保患者安全地從這項技術中獲益。

    基礎模型和生成型人工智能代表了人工智能能力的一場重大革命,為改善護理提供了巨大潛力。如今,醫療保健領導者正在就人工智能做出決定。雖然任何啟發式方法都會省略細節并失去細微差別,但人工智能1.0、2.0和3.0的框架可能對決策者有幫助,因為每個時代都有根本不同的能力和風險。

    更多干貨,關注XI區!

    編譯整理自:Howell MD, Corrado GS, DeSalvo KB. Three Epochs of Artificial Intelligence in Health Care. JAMA. 2024 Jan 16;331(3):242-244. doi: 10.1001/jama.2023.25057. 僅供專業人士交流目的,不用于商業用途。

    2024年2月19日

     

    轉載請注明來自青島峻峰水處理設備有限公司,本文標題:《醫療人工智能的三個時代》

    百度分享代碼,如果開啟HTTPS請參考李洋個人博客
    每一天,每一秒,你所做的決定都會改變你的人生!
    Top