當人工智慧產業還在爭論AGI(通用人工智慧)什麼時候到來時,GoogleDeepMind 的研究已經把問題往前推了一步:如果人類真的實現了AGI,接下來會發生什麼事?
近日,DeepMind 發表了一篇題為「From AGI to ASI」的文章,探討如果人類真的實現AGI,AI 將如何繼續演進,最終達到ASI(超人工智慧)?
參與報告的研究人員包括DeepMind 的多位核心研究者,他們長期研究AGI、強化學習、多智能體系統、AI 安全性和通用智能理論。例如DeepMind 共同創辦人之一、首席AGI 科學家Shane Legg,AIXI 模型提出者Marcus Hutter,其被視為當今最頂尖的AGI 理論家之一,DeepMind 資深研究員、AlphaGo 計畫核心成員之一Thore Graepel 等等。
在討論之前,研究人員首先對AGI 和ASI 進行了清晰的界定。
AGI 是一套在絕大多數認知任務中,達到普通人類中位數水平的智能係統;ASI 則設定了極高的門檻,它是在人類所有活動與認知領域,全面超越大規模人類專家協作團隊的智能係統。
為什麼AGI 不是終點?
論文指出,AGI 不太可能剛好停在人類層面。原因在於,數位智慧與生物智能有著根本不同的運作條件。
人類智能很強,但它受到生物條件限制。一個人大腦的運作速度、記憶容量、壽命、學習速度、溝通方式,都有明顯上限。 AI 則運行在數位計算系統上,許多限制可以透過更多算力、更好硬體、更有效率演算法來放大或繞過。
第一,輸入輸出速度較快。人類閱讀、聽說、寫作和操作工具的速度有限。 AI 不一樣,今天的大模型已經可以在很短時間內處理大量文字。未來如果連接更強的檢索系統、資料庫、感測器和執行工具,它獲取資訊、處理資訊、輸出結果的速度還會繼續提高。
第二,內部處理速度可以加速。人類思考速度受大腦結構限制。 AI 的思考可以透過硬體和演算法提高速度。更多GPU、更高平行度、更優推理架構、更有效率模型,都可能讓系統在更短時間內完成更多推理、搜尋、規劃和驗證。
第三,工作記憶和長期記憶容量更大。人類工作記憶非常有限。我們很難同時穩定處理幾十個複雜變量,也很難完整記住所有讀過的資料。 AI 可以擁有更大的上下文視窗、更強外部記憶和更快檢索能力。它可以調用大量文件、程式碼庫、實驗記錄和資料庫,並在任務過程中保持更多相關資訊。
第四,AI 可以脫離單一身體或硬體。人類智慧綁定在一個具體的身體和大腦上。人的身體會衰老,大腦也會疲倦、受傷和死亡。 AI 系統原則上可以遷移到不同硬體上,它可以從舊伺服器遷移到新伺服器,從較慢硬體遷移到更快硬件,也可以被備份和恢復。
第五,AI 可以無損複製。一個人無法把自己的知識、記憶和經驗完整複製給另一個人。 AI 可以,複製的不只是原始碼,也可以是模型參數、情境狀態、記憶庫和任務經驗。一個表現良好的AI 智能體,可以複製成許多實例,同時處理不同任務。
第六,AI 可以高頻寬共享經驗。人類社會的知識累積很強,但傳播速度有限。 AI 之間的資訊共享可以更直接。不同實例可以共用日誌、資料、模型更新、工具使用記錄、失敗經驗和成功策略。如果系統夠同質,甚至可以分享更底層的學習訊號。
這並不是說今天的AI 已經全面超過人類,而是說:一旦AI 達到人類水平,這些數位化特性會讓它更容易繼續擴展。
AGI 走向ASI 的4 條路徑
圍繞著如何從AGI 到ASI ,研究者提出了四種可能路徑。
第一條路徑是繼續擴大算力、模型和數據。過去幾年,AI 能力的提升很大程度上來自scaling:模型越來越大,訓練資料越來越多,訓練算力越來越強,推理階段也開始投入更多運算資源。
論文認為,如果這種趨勢能持續,那麼從AGI 到ASI 可能不需要完全不同的技術路線。只要更多有效算力仍能轉化為更強能力,繼續擴大規模就可能推動AI 越過人類層面。
不過,這條路徑也面臨不確定性。
最直接的是數據。目前大模型主要依賴人類產生的數據,尤其是文字數據。但高品質文本並不是無限的。隨著模型繼續擴大,可用數據可能不足以支撐下一階段訓練。
除了數據,資源也是重要瓶頸。繼續scaling 需要更多晶片、能源、資料中心、資金和供應鏈支援。算力不是抽象數字,它背後是真實世界的電力、土地、製造能力、冷卻系統和資本投入。如果這些資源無法持續成長,scaling 路線就會放緩。
但論文也指出,所謂「數據牆」未必一定會成為硬障礙。 AI 可能透過合成資料、自博弈、模擬環境、使用者互動和搜尋增強來產生新的高品質訓練材料。 AlphaZero 就是一個例子:系統透過自我對弈產生數據,再將搜尋結果蒸餾回模型,從而不斷提升能力。未來類似機制可能被推廣到更廣泛的任務。
第二條路徑是演算法層面的演化或典範轉移。論文指出,目前AI 的主流範式大致是:用大規模Transformer 在海量資料上進行預訓練,然後再經過指令微調、強化學習、人類反饋、工具調用、檢索增強和推理時計算等方式提升能力。
但研究者認為,這項範式可能還不夠。要真正達到AGI 或ASI,AI 系統可能需要更強的長期記憶、持續學習、互動式強化學習、世界模型、規劃能力和工具使用能力。例如,目前模型雖然可以在上下文視窗內處理複雜任務,但還不具備真正穩定的終身學習能力。它們在互動環境中的長期決策和可靠行動能力也仍有限。
未來可能出現的典範演化包括:更長甚至近乎無限的脈絡、更有效率的序列架構、可更新記憶系統、面向真實環境的強化學習、基於世界模型的規劃、以及更強的自主智能體框架。
但論文也討論了更激進的典範轉移。例如,完全不同的架構、最佳化方法、神經形態硬體、模擬運算,或基於強化學習預訓練、顯式世界模型的新路線。
這條路徑最大的問題是難以預測。真正的典範轉移往往不是簡單外推可以得到的。 Transformer 在成為大模型時代核心架構之前,也並非所有人都預見到它會產生如此深遠影響。
第三條路徑是遞歸自我改進。所謂遞歸自我改進,指的是AI 系統幫助推進AI 研發,進而產生更強的AI;更強的AI 又進一步加速下一輪AI 研發,形成正回饋循環。
傳統討論中,自我改進常被理解為AI 修改自己的程式碼。但論文把範圍擴得更寬:AI 可以改進演算法,也可以輔助設計晶片,可以自動調參,可以產生訓練數據,可以分析實驗結果,可以組織專業化分工。只要AI 能顯著提高AI 研發效率,就已經構成某種遞歸改進。
這條路徑之所以重要,是因為它可能改變AI 進步的速度。如果AI 只是被人類研究者一點點改進,進步速度就受限於人類研發能力。但如果AI 本身成為AI 研發的重要力量,那麼進步速度可能會加速。
事實上,今天已經能看到某些形式的遞歸改進。例如,AI 輔助寫研究程式碼、幫助設計實驗、自動調參、神經架構搜尋、AI 輔助晶片設計、自動課程生成、世界模型仿真,以及一些AI Scientist 系統。這些還不是完全自主的自我改進,但已經說明AI 可以參與改善AI 研發流程。
不過,研究者指出,遞歸改進仍可能受到許多現實限制。例如,訓練更強模型需要真實算力;晶片製造需要實體工廠;許多科學實驗必須等待現實世界回饋;能源和供應鏈無法無限加速。因此,遞歸自我改善可能導致快速躍遷,也可能在資源、實驗和工程瓶頸前逐漸放緩。
第四條路徑是多智能體協作,也就是ASI 可能不是由單一系統產生,而是由大量AGI 智能體組織起來之後形成。這一路徑與第一條scaling 路徑有關,但重點不同。第一條路徑關心的是算力、模型和資料如何擴大;這條路徑關心的是:當許多AGI 實例一起工作時,整體智慧會如何改變。
論文認為,超級智能可能作為一種集體屬性出現。許多AGI 智能體透過協調、分工、通訊和組織,可能形成類似「群體智慧」或「集團智能」的系統。
這個想法並不陌生。人類社會本身就是例子。一個現代科學機構、一家大型公司、一個國家系統,都不是靠單一人完成複雜任務,而是依靠分工、協作、知識累積、組織管理和資源調配。
AGI 群體也可能如此。它們可以被組織成自動化公司、研究機構、智慧體市場或服務網路。每個智能體負責不同任務,有的做規劃,有的做執行,有的做驗證,有的做資訊蒐集,有的做專業分析。透過高頻寬通信,它們可以快速共享結果並調整策略。
論文提出,未來有必要研究多智能體的scaling laws:當智能體數量增加、通訊密度提高、組織結構優化時,整體能力如何改變?是線性成長、超線性成長,還是很快就被協調成本抵銷?
這意味著,即使單一模型無法大幅超過人類,一個由大量人類層級AGI 組成的系統,也可能構成實際意義上的ASI。
實現ASI 的六大瓶頸
雖然論文認為AGI 不太可能是終點,但它並沒有把ASI 描繪成必然到來的神話。研究者列出了可能阻礙AGI 走向ASI 的六大瓶頸。
第一是數據牆。目前大模型的訓練高度依賴大規模數據,尤其是人類生成的文字、圖像、音訊和視訊。但這些數據並不是無限的,模型規模和訓練需求成長很快,而人類自然產生高品質資料的速度有限。尤其是高品質文字數據,可能在未來成為限制因素。
第二是經濟和自然資源約束。持續擴大AI 能力需要資金、晶片、電力、資料中心、冷卻系統、土地、稀有材料、供應鏈和工程能力。如果訓練和部署更強AI 所需的經濟投入成長太快,而AI 帶來的經濟回報跟不上,那麼scaling 可能變得不可持續。
第三是神經網路範式可能不夠。目前主流路線是大規模神經網絡,尤其是Transformer,加上預訓練、後訓練、推理時計算、工具呼叫和檢索增強。這一路線雖然非常成功,但不能保證一定足以達到AGI,更不能保證足以達到ASI。可能缺失的能力包括長期記憶、持續學習、真實環境中的穩健決策、世界模型、深層規劃和自主互動能力。如果這些能力無法在現有範式內自然補齊,就可能需要新的架構、新的訓練方式,甚至是新的運算範式。
第四是研究越來越難。很多技術領域都會遇到一個問題:越往後,進步越難。早期容易發現的改進被快速利用,後續突破需要更多實驗、更大團隊、更高成本和更複雜工程。 AI 研究也可能如此。模型越大,實驗越貴,驗證週期越長,架構和訓練細節越複雜。持續獲得同樣幅度的能力提升,可能需要越來越多資源。
第五是抽象壁壘,也就是AI 能否創造超越人類的新觀念。目前AI 主要訓練在人類產生的資料上,因此它學習到的概念、語言和知識結構,很大程度上來自人類已有抽象。如果AI 只是在人類概念體系內組合和外推,它是否能真正形成新的科學概念、新的抽象層次和超越人類的理解方式?
第六是人為放緩。如果AI 帶來嚴重事故、濫用風險、軍事風險、政治衝突、失業衝擊、文化反彈或安全擔憂,政府和公眾可能要求放緩甚至限制前線AI 發展。可能表現為更嚴格的監管、強制評估、事故報告、算力限制、出口管制、責任追究,甚至暫停某些高風險訓練和部署。
這些瓶頸到底是硬上限,還是可以被技術繞過的摩擦,目前並不清楚。資料牆可能被合成資料、模擬和自博弈緩解;資源瓶頸可能被更有效率演算法和硬體緩解;研究變難可能被AI 研究助理抵消;抽象壁壘可能需要新的互動學習和強化學習範式來突破;人為放緩則可能受到經濟利益和國際競爭壓力影響。
如何評測超過人類的系統?
論文提出一個很現實的問題:如果AI 超過人類,我們該如何評測它?
今天很多benchmark 本質上以人類水準為參照。例如考試題、程式設計題、數學題、問答任務、專業知識測驗等。一旦AI 在這些任務上達到或超過頂尖人類水平,評測就會迅速飽和。
這會帶來兩個後果。一方面,研究者很難繼續準確衡量AI 能力提升。另一方面,社會也很難判斷系統到底處於什麼能力階段。
因此,研究者呼籲建立面向AGI 後時代的新評測體系。包括多元智能體競爭與合作任務、自動產生測試、通用壓縮任務、經濟生產力等間接指標,以及可持續更新、不會輕易飽和的評估機制。
預測體系同樣需要升級。不能只依賴專家訪談或主觀判斷,而要建立更量化的模型,把有效算力成長、演算法效率、經濟回報、資源投入、AI 研發自動化等因素連結起來,並隨新數據不斷更新。
在安全和治理方面,論文採取了一個明確但很重要的前提:為了聚焦技術路徑,研究者暫時假設AI 安全和監管能在足夠程度上解決。但他們也承認,這絕對不是輕鬆前提。如果高階AI 不安全、不可控,那麼它本身就會成為能力發展的瓶頸,因為無法放心部署到自動化研究、基礎設施和社會系統。
鑑於目前存在太多不確定性,研究者認為很難精確預測ASI 何時到來,以及它具體會具備哪些能力。他們一再強調ASI 仍受物理、計算複雜性、數據、資源、實驗時間、現實世界回饋速度等限制。它不是魔法,也不自動意味著能治癒所有疾病、任意改造物質或解決所有社會問題。
讀報知天下事:DeepMind最新推演:AGI並非終點!
