觀點速讀
伴隨生成式人工智能的迅猛發展,我們正迎來人工智能第三次浪潮的高峰期。DeepSeek的推出,成為世界人工智能發展史上的一個標志性事件,為在受限資源下探索通用人工智能開辟了新的路徑。發展人工智能需要充足的算力和高質量數據,必須構建自主可控的AI基礎設施生態來保障資源供給。《人民郵電報》記者特邀中國工程院院士李國杰暢談AI發展策略。
發展人工智能重在落地行業
人工智能是對人類智能某方面的再現和超越,其通用性是相對的,需基于特定條件或范圍。大模型追求的通用人工智能(AGI)只是眾多通用目標的一種。我們要認識人工智能的局限性,不能盲目追求天下通吃的人工智能,重點還是要根據實際需求,將相對通用的人工智能技術落地到各行業,讓一定范圍內的人工智能技術見到實效。
斯坦福大學《2024年人工智能指數報告》明確指出,機器學習大模型在圖像分類、視覺推理及英語理解等方面的表現已超過人類。聊天機器人和其他智能軟件正改變我們的工作和生活。AI驅動的科學研究作為科研第五范式,也展現出驚人潛力。比如DeepMind的Alpha-Fold3已成功預測地球上已知的超兩億種蛋白質的三維結構,有望顛覆當前的藥物研發模式,其發明者獲得了2024年諾貝爾化學獎。人們相信,智能技術的指數性發展一定會加速通用人工智能的到來,但自適應性、持續學習及與外界互動等問題仍需克服。
實現通用智能是一個漸進過程,不會因某項技術的發明就突然到來。盡管當前AI的通用性比前兩波有顯著提高,但距離真正的通用智能還有較大差距。在某些應用中通過圖靈測試只是階段性成果,發展既通用自主又安全放心的人工智能仍是巨大挑戰。
DeepSeek開辟新路徑
DeepSeek的推出成為世界人工智能發展史上的一個標志性事件,不僅創下了全球用戶增長速度的新紀錄,還引發了市場對相關硬件需求預期的調整。例如,英偉達的股價短期內有所波動,反映了市場對新興技術可能帶來的行業變革的敏感性。這也表明中國科技公司在全球最關注的核心技術領域,正通過持續創新重塑世界既有格局。
DeepSeek為在受限資源下探索通用人工智能開辟了新的路徑。傳統大模型通常從廣泛的通用能力出發,逐漸向特定應用場景優化。相比之下,DeepSeek采取了一種不同的策略,通過專注于特定任務或領域,逐步擴展其通用能力。這種方法有助于推動人工智能技術生態的發展,并促進通用人工智能的社會共享。“小而精”模型將AI的應用重點從面向企業轉向面向消費者,從廣泛覆蓋轉變為深度優化,讓更多的中小企業參與,可能創造更大的市場空間。這種“垂直深潛”策略與通用大模型的“橫向擴展”互為補充,共同構建智能時代的創新生態。
長期以來,中國AI企業側重于應用和商業模式創新,追求快速盈利,較少涉足核心技術的原創性突破。與西方發達國家相比,我們真正的差距不在于資金或硬件的短缺,而在于缺乏原創技術和發明,以及在增強信心和有效組織高水平人才進行創新方面的能力不足。隨著經濟的發展和技術的積累,中國企業逐漸增強了原創研發能力。DeepSeek開了一個好頭,他們把探索通用人工智能的實現之路作為奮斗目標,并吸引了一批充滿創新熱情和好奇心的年輕博士加入。這些“90后”的中國青年展現出與西方同行平等對話的信心和“敢為天下先”的勇氣,成為中國科技自主創新能力發展的希望。
構建自主可控的基礎設施生態
發展人工智能需要充足的算力和高質量數據,必須構建自主可控的AI基礎設施生態來保障資源供給。
美國的AI基礎設施是基于英偉達的GPU建立起來的。我國的人工智能加速芯片,如華為的昇騰、海光的DCU和寒武紀的芯片與GPU芯片的硬件性能差距并不是很大。英偉達的核心優勢在于CUDA軟件生態及NVLink和InfiniBand高速互聯,其中CUDA生態最難攻克。DeepSeek雖沖擊了CUDA生態,但沒有完全繞過CUDA,CUDA的生態壁壘仍然存在。從長遠來講,我們需要開發一套比CUDA更優秀的自主可控的AI軟件工具系統。像取代Wintel和ARM+Android系統一樣,就是要重構軟件生態系統,這是一項十分困難的任務,需要周密的規劃和長期努力。
信創工程對推廣國產化芯片和軟件有重大的推動作用,但產業生態的形成主要靠市場牽引。國家要通過政策引導,鼓勵在PC、手機和物端設備上推廣AI應用,擴大“國產大模型+國產GPU”應用空間,增大國產GPU、CPU和軟件的市場份額。高度重視芯片設計和大模型的開源戰略,爭取我國在全球AI開源系統中起到主導作用。
GPU芯片可能在市場上延續相當長的時間。從長遠來看,GPU并非終極方案,針對一類AI應用的專用芯片也可能成為主流。AI加速芯片將來可能進入多芯片競爭的XPU時代。Groq的LPU推理性能已達GPU的10倍,其單芯片能實現每秒250萬億次整數運算,延遲低于1微秒。算力是AI基礎設施的重要組成部分,我們既要攻關ZFlops級的超算,也要探索類腦計算、光子計算等新范式。為了降低能耗,模擬計算、類腦計算、碳基計算等非傳統計算無疑是重要的研究方向。