近期,中國人工智能協會發布了《中國人工智能大模型技術白皮書》,系統梳理了大模型技術演進,深入探討關鍵技術要素,并剖析當前挑戰及未來展望。我為大家做了簡要總結,并附上原文供深入閱讀。
自2006年Geoffrey Hinton提出通過逐層無監督預訓練攻克深層網絡訓練難題以來,深度學習在眾多領域均取得了顯著的突破,其發展歷程從最初的標注數據監督學習,逐漸演進到預訓練模型,最終邁向大模型的新紀元。2022年底,OpenAI發布的ChatGPT憑借其卓越的性能引發了廣泛的關注,充分展現了大模型在處理多場景、多用途、跨學科任務時的強大能力。因此,大模型被普遍認為是未來人工智能領域不可或缺的關鍵基礎設施。
在這場技術熱潮中,語言大模型作為領軍者,通過大規模預訓練學習了豐富的語言知識與世界知識,進而擁有了面向多任務的通用求解能力。其發展脈絡清晰可見,歷經統計語言模型、神經語言模型、預訓練語言模型,直至現在的語言大模型(探索階段)的四個階段。
統計語言模型雖然基于馬爾可夫假設,但由于數據稀疏問題的影響,其能力有限;
神經語言模型通過神經網絡對語義共現關系進行建模,成功地捕獲了復雜語義依賴;
預訓練語言模型采用“預訓練+微調”的范式,通過自監督學習使模型能夠適配各種下游任務;
而大模型則基于縮放定律。簡單來說就是,隨著模型參數和預訓練數據規模的不斷增加,模型的能力與任務效果會持續提升,甚至展現出了一些小規模模型所不具備的獨特“涌現能力”。
大模型時代正逐步揭開序幕,其領軍者如ChatGPT正在經濟、法律、社會等領域發揮著至關重要的作用。OpenAI憑借其GPT-1、GPT-2以及GPT-3等語言模型,展現了不同規模參數下的強大能力,而谷歌也推出了規模龐大的PaLM模型,擁有5400億參數。當模型參數規模躍升至千億量級,語言大模型所展現出的多樣化能力令人矚目。GPT-3僅憑提示詞或少數樣例,便能出色地完成眾多任務。
自Transformer架構亮相以來,OpenAI推出了一系列領先的語言大模型技術,如GPT-1、GPT-2、GPT-3等,它們在自然語言任務中展現了卓越性能。CodeX通過微調GPT-3,提升了代碼和復雜推理能力;InstructGPT和ChatGPT則運用人類反饋的強化學習技術,增強了遵循人類指令的能力和對人類偏好的理解。GPT-4則更進一步,處理更長的上下文窗口,具備多模態理解能力,邏輯推理、復雜任務處理能力顯著改進,為多模態領域開辟了新天地。
大模型技術生態正在蓬勃發展,多種服務平臺向個人用戶和商業應用開放。OpenAI API讓用戶輕松訪問不同GPT模型以完成任務。Anthropic的Claude系列模型強調有用性、誠實性和無害性。百度文心一言基于知識增強的大模型,提供開放服務和插件機制。訊飛星火認知大模型具備開放式知識問答、多輪對話、邏輯和數學能力,以及對代碼和多模態的理解能力。訊飛和華為聯合發布了支持大模型訓練私有化的“星火一體機”。
大模型的開源生態同樣豐富多彩,涵蓋了開源框架和開源大模型。開源框架如PyTorch和飛槳支持大規模分布式訓練,OneFlow則支持動靜態圖的靈活轉換,而DeepSpeed則通過減少冗余內存訪問以訓練更大模型。開源大模型如LLaMA、Falcon和GLM則降低了研究門檻,促進了應用的繁榮。Baichuan系列模型支持中英雙語,使用高質量訓練數據,表現卓越,并開源了多種量化版本。CPM系列在中文NLP任務上表現出色。
大模型技術的應用場景廣泛無比,為各行各業注入了新的活力。無論是新聞、影視、營銷、娛樂、軍事、教育、金融還是醫療等領域,大模型都能顯著降低生產成本,提高作品質量,助力產品營銷,增強決策能力,使教育方式更加個性化和智能化,提高金融服務質量,賦能醫療機構診療全過程。更重要的是,大模型被認為是未來人工智能應用中的關鍵基礎設施,能夠帶動上下游產業的革新,形成協同發展的生態,對經濟、社會和安全等領域的智能化升級形成關鍵支撐。
然而,大模型技術依然面臨諸多風險與挑戰。其可靠性尚未得到充分保障,合成內容在事實性和時效性上仍存在缺陷。大模型的可解釋性相對較弱,其工作原理難以透徹理解。此外,應用大模型的部署成本高昂,涉及大量訓練和推理計算,功耗高,應用成本高,且端側推理存在延遲等問題。在大數據匱乏的情況下,大模型的遷移能力受到制約,魯棒性和泛化性面臨嚴峻挑戰。更為嚴重的是,大模型還存在被濫用于生成虛假信息、惡意引導行為等衍生技術風險,以及安全與隱私問題。
大模型技術,以其廣闊的應用前景和巨大潛力,無疑成為了技術發展的焦點。然而,隨之而來的挑戰亦不容忽視:可靠性、可解釋性的難題需要我們去攻克,數據質量與數量的提升成為迫切需求,應用部署成本的降低與遷移能力的增強同樣重要,而安全與隱私保護的強化更是關鍵中的關鍵。此外,探索更為貼合實際、具備落地價值的應用場景,亦是我們需要努力的方向。這些挑戰與機遇并存,將決定大模型技術未來的廣泛應用與發展命運。
2023 中國人工智能系列白皮書--大模型技術(2023版).pdf