DeepMind最新推演：AGI並非終點！

當人工智慧產業還在爭論AGI（通用人工智慧）什麼時候到來時，GoogleDeepMind 的研究已經把問題往前推了一步：如果人類真的實現了AGI，接下來會發生什麼事？

近日，DeepMind 發表了一篇題為「From AGI to ASI」的文章，探討如果人類真的實現AGI，AI 將如何繼續演進，最終達到ASI（超人工智慧）？

參與報告的研究人員包括DeepMind 的多位核心研究者，他們長期研究AGI、強化學習、多智能體系統、AI 安全性和通用智能理論。例如DeepMind 共同創辦人之一、首席AGI 科學家Shane Legg，AIXI 模型提出者Marcus Hutter，其被視為當今最頂尖的AGI 理論家之一，DeepMind 資深研究員、AlphaGo 計畫核心成員之一Thore Graepel 等等。

在討論之前，研究人員首先對AGI 和ASI 進行了清晰的界定。

AGI 是一套在絕大多數認知任務中，達到普通人類中位數水平的智能係統；ASI 則設定了極高的門檻，它是在人類所有活動與認知領域，全面超越大規模人類專家協作團隊的智能係統。

為什麼AGI 不是終點？

論文指出，AGI 不太可能剛好停在人類層面。原因在於，數位智慧與生物智能有著根本不同的運作條件。

人類智能很強，但它受到生物條件限制。一個人大腦的運作速度、記憶容量、壽命、學習速度、溝通方式，都有明顯上限。 AI 則運行在數位計算系統上，許多限制可以透過更多算力、更好硬體、更有效率演算法來放大或繞過。

第一，輸入輸出速度較快。人類閱讀、聽說、寫作和操作工具的速度有限。 AI 不一樣，今天的大模型已經可以在很短時間內處理大量文字。未來如果連接更強的檢索系統、資料庫、感測器和執行工具，它獲取資訊、處理資訊、輸出結果的速度還會繼續提高。

第二，內部處理速度可以加速。人類思考速度受大腦結構限制。 AI 的思考可以透過硬體和演算法提高速度。更多GPU、更高平行度、更優推理架構、更有效率模型，都可能讓系統在更短時間內完成更多推理、搜尋、規劃和驗證。

第三，工作記憶和長期記憶容量更大。人類工作記憶非常有限。我們很難同時穩定處理幾十個複雜變量，也很難完整記住所有讀過的資料。 AI 可以擁有更大的上下文視窗、更強外部記憶和更快檢索能力。它可以調用大量文件、程式碼庫、實驗記錄和資料庫，並在任務過程中保持更多相關資訊。

第四，AI 可以脫離單一身體或硬體。人類智慧綁定在一個具體的身體和大腦上。人的身體會衰老，大腦也會疲倦、受傷和死亡。 AI 系統原則上可以遷移到不同硬體上，它可以從舊伺服器遷移到新伺服器，從較慢硬體遷移到更快硬件，也可以被備份和恢復。

第五，AI 可以無損複製。一個人無法把自己的知識、記憶和經驗完整複製給另一個人。 AI 可以，複製的不只是原始碼，也可以是模型參數、情境狀態、記憶庫和任務經驗。一個表現良好的AI 智能體，可以複製成許多實例，同時處理不同任務。

第六，AI 可以高頻寬共享經驗。人類社會的知識累積很強，但傳播速度有限。 AI 之間的資訊共享可以更直接。不同實例可以共用日誌、資料、模型更新、工具使用記錄、失敗經驗和成功策略。如果系統夠同質，甚至可以分享更底層的學習訊號。

這並不是說今天的AI 已經全面超過人類，而是說：一旦AI 達到人類水平，這些數位化特性會讓它更容易繼續擴展。

AGI 走向ASI 的4 條路徑

圍繞著如何從AGI 到ASI ，研究者提出了四種可能路徑。

第一條路徑是繼續擴大算力、模型和數據。過去幾年，AI 能力的提升很大程度上來自scaling：模型越來越大，訓練資料越來越多，訓練算力越來越強，推理階段也開始投入更多運算資源。

論文認為，如果這種趨勢能持續，那麼從AGI 到ASI 可能不需要完全不同的技術路線。只要更多有效算力仍能轉化為更強能力，繼續擴大規模就可能推動AI 越過人類層面。

不過，這條路徑也面臨不確定性。

最直接的是數據。目前大模型主要依賴人類產生的數據，尤其是文字數據。但高品質文本並不是無限的。隨著模型繼續擴大，可用數據可能不足以支撐下一階段訓練。

除了數據，資源也是重要瓶頸。繼續scaling 需要更多晶片、能源、資料中心、資金和供應鏈支援。算力不是抽象數字，它背後是真實世界的電力、土地、製造能力、冷卻系統和資本投入。如果這些資源無法持續成長，scaling 路線就會放緩。

但論文也指出，所謂「數據牆」未必一定會成為硬障礙。 AI 可能透過合成資料、自博弈、模擬環境、使用者互動和搜尋增強來產生新的高品質訓練材料。 AlphaZero 就是一個例子：系統透過自我對弈產生數據，再將搜尋結果蒸餾回模型，從而不斷提升能力。未來類似機制可能被推廣到更廣泛的任務。

第二條路徑是演算法層面的演化或典範轉移。論文指出，目前AI 的主流範式大致是：用大規模Transformer 在海量資料上進行預訓練，然後再經過指令微調、強化學習、人類反饋、工具調用、檢索增強和推理時計算等方式提升能力。

但研究者認為，這項範式可能還不夠。要真正達到AGI 或ASI，AI 系統可能需要更強的長期記憶、持續學習、互動式強化學習、世界模型、規劃能力和工具使用能力。例如，目前模型雖然可以在上下文視窗內處理複雜任務，但還不具備真正穩定的終身學習能力。它們在互動環境中的長期決策和可靠行動能力也仍有限。

未來可能出現的典範演化包括：更長甚至近乎無限的脈絡、更有效率的序列架構、可更新記憶系統、面向真實環境的強化學習、基於世界模型的規劃、以及更強的自主智能體框架。

但論文也討論了更激進的典範轉移。例如，完全不同的架構、最佳化方法、神經形態硬體、模擬運算，或基於強化學習預訓練、顯式世界模型的新路線。

這條路徑最大的問題是難以預測。真正的典範轉移往往不是簡單外推可以得到的。 Transformer 在成為大模型時代核心架構之前，也並非所有人都預見到它會產生如此深遠影響。

第三條路徑是遞歸自我改進。所謂遞歸自我改進，指的是AI 系統幫助推進AI 研發，進而產生更強的AI；更強的AI 又進一步加速下一輪AI 研發，形成正回饋循環。

傳統討論中，自我改進常被理解為AI 修改自己的程式碼。但論文把範圍擴得更寬：AI 可以改進演算法，也可以輔助設計晶片，可以自動調參，可以產生訓練數據，可以分析實驗結果，可以組織專業化分工。只要AI 能顯著提高AI 研發效率，就已經構成某種遞歸改進。

這條路徑之所以重要，是因為它可能改變AI 進步的速度。如果AI 只是被人類研究者一點點改進，進步速度就受限於人類研發能力。但如果AI 本身成為AI 研發的重要力量，那麼進步速度可能會加速。

事實上，今天已經能看到某些形式的遞歸改進。例如，AI 輔助寫研究程式碼、幫助設計實驗、自動調參、神經架構搜尋、AI 輔助晶片設計、自動課程生成、世界模型仿真，以及一些AI Scientist 系統。這些還不是完全自主的自我改進，但已經說明AI 可以參與改善AI 研發流程。

不過，研究者指出，遞歸改進仍可能受到許多現實限制。例如，訓練更強模型需要真實算力；晶片製造需要實體工廠；許多科學實驗必須等待現實世界回饋；能源和供應鏈無法無限加速。因此，遞歸自我改善可能導致快速躍遷，也可能在資源、實驗和工程瓶頸前逐漸放緩。

第四條路徑是多智能體協作，也就是ASI 可能不是由單一系統產生，而是由大量AGI 智能體組織起來之後形成。這一路徑與第一條scaling 路徑有關，但重點不同。第一條路徑關心的是算力、模型和資料如何擴大；這條路徑關心的是：當許多AGI 實例一起工作時，整體智慧會如何改變。

論文認為，超級智能可能作為一種集體屬性出現。許多AGI 智能體透過協調、分工、通訊和組織，可能形成類似「群體智慧」或「集團智能」的系統。

這個想法並不陌生。人類社會本身就是例子。一個現代科學機構、一家大型公司、一個國家系統，都不是靠單一人完成複雜任務，而是依靠分工、協作、知識累積、組織管理和資源調配。

AGI 群體也可能如此。它們可以被組織成自動化公司、研究機構、智慧體市場或服務網路。每個智能體負責不同任務，有的做規劃，有的做執行，有的做驗證，有的做資訊蒐集，有的做專業分析。透過高頻寬通信，它們可以快速共享結果並調整策略。

論文提出，未來有必要研究多智能體的scaling laws：當智能體數量增加、通訊密度提高、組織結構優化時，整體能力如何改變？是線性成長、超線性成長，還是很快就被協調成本抵銷？

這意味著，即使單一模型無法大幅超過人類，一個由大量人類層級AGI 組成的系統，也可能構成實際意義上的ASI。

實現ASI 的六大瓶頸

雖然論文認為AGI 不太可能是終點，但它並沒有把ASI 描繪成必然到來的神話。研究者列出了可能阻礙AGI 走向ASI 的六大瓶頸。

第一是數據牆。目前大模型的訓練高度依賴大規模數據，尤其是人類生成的文字、圖像、音訊和視訊。但這些數據並不是無限的，模型規模和訓練需求成長很快，而人類自然產生高品質資料的速度有限。尤其是高品質文字數據，可能在未來成為限制因素。

第二是經濟和自然資源約束。持續擴大AI 能力需要資金、晶片、電力、資料中心、冷卻系統、土地、稀有材料、供應鏈和工程能力。如果訓練和部署更強AI 所需的經濟投入成長太快，而AI 帶來的經濟回報跟不上，那麼scaling 可能變得不可持續。

第三是神經網路範式可能不夠。目前主流路線是大規模神經網絡，尤其是Transformer，加上預訓練、後訓練、推理時計算、工具呼叫和檢索增強。這一路線雖然非常成功，但不能保證一定足以達到AGI，更不能保證足以達到ASI。可能缺失的能力包括長期記憶、持續學習、真實環境中的穩健決策、世界模型、深層規劃和自主互動能力。如果這些能力無法在現有範式內自然補齊，就可能需要新的架構、新的訓練方式，甚至是新的運算範式。

第四是研究越來越難。很多技術領域都會遇到一個問題：越往後，進步越難。早期容易發現的改進被快速利用，後續突破需要更多實驗、更大團隊、更高成本和更複雜工程。 AI 研究也可能如此。模型越大，實驗越貴，驗證週期越長，架構和訓練細節越複雜。持續獲得同樣幅度的能力提升，可能需要越來越多資源。

第五是抽象壁壘，也就是AI 能否創造超越人類的新觀念。目前AI 主要訓練在人類產生的資料上，因此它學習到的概念、語言和知識結構，很大程度上來自人類已有抽象。如果AI 只是在人類概念體系內組合和外推，它是否能真正形成新的科學概念、新的抽象層次和超越人類的理解方式？

第六是人為放緩。如果AI 帶來嚴重事故、濫用風險、軍事風險、政治衝突、失業衝擊、文化反彈或安全擔憂，政府和公眾可能要求放緩甚至限制前線AI 發展。可能表現為更嚴格的監管、強制評估、事故報告、算力限制、出口管制、責任追究，甚至暫停某些高風險訓練和部署。

這些瓶頸到底是硬上限，還是可以被技術繞過的摩擦，目前並不清楚。資料牆可能被合成資料、模擬和自博弈緩解；資源瓶頸可能被更有效率演算法和硬體緩解；研究變難可能被AI 研究助理抵消；抽象壁壘可能需要新的互動學習和強化學習範式來突破；人為放緩則可能受到經濟利益和國際競爭壓力影響。

如何評測超過人類的系統？

論文提出一個很現實的問題：如果AI 超過人類，我們該如何評測它？

今天很多benchmark 本質上以人類水準為參照。例如考試題、程式設計題、數學題、問答任務、專業知識測驗等。一旦AI 在這些任務上達到或超過頂尖人類水平，評測就會迅速飽和。

這會帶來兩個後果。一方面，研究者很難繼續準確衡量AI 能力提升。另一方面，社會也很難判斷系統到底處於什麼能力階段。

因此，研究者呼籲建立面向AGI 後時代的新評測體系。包括多元智能體競爭與合作任務、自動產生測試、通用壓縮任務、經濟生產力等間接指標，以及可持續更新、不會輕易飽和的評估機制。

預測體系同樣需要升級。不能只依賴專家訪談或主觀判斷，而要建立更量化的模型，把有效算力成長、演算法效率、經濟回報、資源投入、AI 研發自動化等因素連結起來，並隨新數據不斷更新。

在安全和治理方面，論文採取了一個明確但很重要的前提：為了聚焦技術路徑，研究者暫時假設AI 安全和監管能在足夠程度上解決。但他們也承認，這絕對不是輕鬆前提。如果高階AI 不安全、不可控，那麼它本身就會成為能力發展的瓶頸，因為無法放心部署到自動化研究、基礎設施和社會系統。

鑑於目前存在太多不確定性，研究者認為很難精確預測ASI 何時到來，以及它具體會具備哪些能力。他們一再強調ASI 仍受物理、計算複雜性、數據、資源、實驗時間、現實世界回饋速度等限制。它不是魔法，也不自動意味著能治癒所有疾病、任意改造物質或解決所有社會問題。

讀報知天下事：DeepMind最新推演：AGI並非終點！