OpenAI 最新發布的 o3 模型引爆 AI 熱潮,作為主要 GPU 供應商的輝達,其股價有望因此大幅攀升。

人工智慧已進入一個新時代。OpenAI 揭示了 新的 o3 模型,該模型在著名的 ARC-AGI-Pub 基準測試 中取得了令人震驚的 75.7% 的分數,這代表了人工智慧能力的量子飛躍。這不僅僅是另一個增量收益,這是我們在 GPT-4 的突破性發布後已經習慣的事情,而是一個革命性的事件,它改變了我們對智慧機器能做什麼的理解。多年來,先進的 LLM(大型語言模型)難以執行真正新穎的任務。事實上,GPT-3 在 ARC-AGI 的適應性基準測試中的得分為 0%,而 GPT-4 幾乎沒有改進。
幾乎在毫無預警的情況下,OpenAI 的 o3 模型打破了這些假設,並表明真正強大的、靈活的、即時推理並不是遙遠的夢想,而是當前的現實。這次揭示最令人難以置信的方面是,o 系列的測試時計算模型仍處於起步階段,這意味著這些模型的未來迭代可能會比 o3 的表現更好。然而,伴隨著這種興奮而來的是一個新的挑戰。o3 的突破是由大量的測試時計算驅動的。
o3 不是簡單地通過擴大預訓練來訓練更大的模型,而是在推理時需要更多的計算能力。每個查詢不僅僅是一個快速查找,而是在巨大的「程式空間」中進行搜索,這需要數千萬個 tokens 和驚人的 GPU 週期才能解決一個複雜的任務。這種新範式將需要指數級增長的推理晶片需求以及數十億美元的額外加速器容量。更重要的是,擴展 測試時計算 的有效性仍然沒有明確的終點,因此需求可能只會從這裡呈指數級增長。
在這場構造性的轉變中,輝達公司 (NASDAQ:NVDA) 以獨特的優勢脫穎而出,可以構建下一代人工智慧基礎設施。長期以來,輝達的 GPU 一直是訓練大型語言模型的黃金標準。現在,隨著 o3 引領著一個可能由測試時計算定義的未來,輝達在協調複雜的全球人工智慧供應鏈方面無與倫比的能力給了它巨大的戰略優勢。通過按需交付由數千個 GPU、DPU、專用記憶體和網路設備組成的 AI「工廠」,輝達已做好充分準備,為 o3 級模型及更高版本將需要的空前推理能力提供硬體。
o3 模型絕對打破了之前在 ARC 基準測試中的記錄。

ARC Prize
o3:人工智慧推理的範式轉移
多年來,大型語言模型以真正先進的模式識別給我們留下了深刻的印象,但在需要真正新穎性的問題上表現糟糕。例如,GPT-4 和其他同等基礎模型(如 Claude 或 Gemini)已能在已知任務和基準測試中取得世界一流的成果,但在執行真正的新挑戰方面卻舉步維艱。「更大更大的模型」將持續轉化為更聰明的模型的假設已經 碰壁。
OpenAI 的 o 系列模型承諾,一種不同的方法,一種涉及密集的測試時搜索、推理鏈和自適應解決方案生成的方法,可以突破這堵牆。雖然 o1 的結果令人鼓舞,但它並沒有像 o3 的結果那樣真正打破預期。然而,這項新的突破意味著推理將不再是廉價和微不足道的,而是密集和探索性的。OpenAI 的 o3 並非在推理時快速運行靜態的、預先設定的模型,而是可以協調複雜的推理過程,每個查詢都會消耗大量的 GPU 週期。這意味著將需要越來越大的推理集群規模,以便針對「即時搜索」工作負載進行調整。
以下是 ARC 測試中的一些任務。

ARC Prize
為什麼測試時擴展很重要
人工智慧對硬體需求的增長在歷史上是由於訓練更大的語言模型所驅動的。一旦訓練完成,這些基礎模型的推理成本相對可預測且穩定。然而,o3 的成功表明,測試時計算有望爆發式增長。想像一下這樣一個世界,每個複雜的問題都會觸發一個令人難以置信的精細而複雜的 token 搜索,跨越數十億,最終將達到數兆的參數。隨著人工智慧越來越多地嵌入到企業工作流程、消費者服務甚至主權數據中心中,此類查詢的數量可能會呈指數級增長。
這種新範式有一個投資者應該理解的重要組成部分:測試時擴展目前還沒有明顯的上限。這意味著,只要用戶想要更聰明、更能感知上下文的人工智慧,其推理能力甚至可以與人類專家相媲美,那麼推理的計算強度將持續呈指數級上升。每一代新模型幾乎肯定會進一步推動這一點,從而需要更多的 GPU。
實際上,當給予更長的「思考」時間時,o3 的表現甚至優於前面提到的 75.7%。

ARC Prize
輝達:端到端供應商
輝達目前是唯一一家有能力滿足爆炸性推理需求的企業,這得益於其覆蓋範圍、合作關係和供應鏈掌控力。為了服務於這個不斷發展的格局,僅僅創造一個 GPU 是不夠的。相反,一家公司必須控制一個全球管道,該管道交付先進的記憶體、高速網路、專用連接器、DPU、機架、冷卻系統以及連接所有這些組件的軟體堆疊。輝達數十年的生態系統建設及其與供應商的深入合作關係,使其在與超微半導體公司 (AMD) 等競爭對手相比具有巨大的戰略優勢。輝達與美光、InfiniBand、Spectrum-X 等供應商的牢固關係是其供應鏈優勢的主要原因。
在測試時計算範式下,推理不再是一項輕量級活動,雲端供應商、人工智慧公司和企業可能會競相部署嚴重依賴輝達的代理式人工智慧和基礎模型。他們將需要大量的 GPU 集群來處理持續的、自適應的推理負載。輝達的供應鏈主導地位確保了它可以快速、大規模地且以最佳配置的方式建立這些數據中心。事實上,輝達最近普及了「人工智慧工廠」這個術語,以描述其交付預先封裝的人工智慧數據中心的能力。即使輝達無法完全滿足需求,它也可能仍然比競爭對手擁有巨大的優勢。
我們正在發展到一個數據中心開始演變成輝達執行長黃仁勳喜歡稱之為「人工智慧工廠」的世界,或者持續生產和改進智慧的專用基礎設施。輝達的目標是成為這些工廠的事實供應商,這符合該公司的全堆疊方法。這就是其 GPU、DPU、NVLink、Grace CPU、軟體框架和合作夥伴生態系統允許設計用於處理高計算負載(如 o3 級測試時擴展中存在的負載)的統包人工智慧工廠的原因。雖然競爭對手可能能夠匹配不同組件的個別規格,但沒有人能像輝達那樣整合人工智慧數據中心的所有部分。
以下是「人工智慧工廠」外觀的視覺表示。

駕馭擴展曲線
輝達未來成功的關鍵是擴展還有很長的路要走的概念。雖然由於數據限制,預訓練擴展正在觸及軟牆,但測試時計算擴展仍處於早期階段。隨著以推理為中心的模型的普及,沒有內在的原因可以阻止我們不斷追求每個查詢更複雜的推理。從真正的推理模型中獲得的生產力提升將證明運行此類查詢所帶來的巨大成本是合理的。
隨著每一個測試推理邊界的新模型出現,輝達都處於完美的地位,可以提供更大的計算集群、更快的網路和更先進的協調軟體。甚至程式碼層也由輝達的 CUDA 框架主導,這再次使該公司與競爭對手相比具有巨大的優勢。
財務實力允許戰略靈活性
輝達最近的財務業績已經非常出色,該公司在 2025 財年第三季度 的收入為 351 億美元。這代表了驚人的 94% 的同比增長,這對於一家如此規模的公司來說是聞所未聞的。由 o3 的性能所證明的測試時計算革命,將通過顯著擴大輝達的潛在市場來進一步推動其增長。隨著每次推理的成本最初飆升,輝達的規模和營運實力使其能夠協商更好的價格並不斷提高系統效率。
輝達巨大的現金產生能力,以及該公司在供應鏈中的流動性和槓桿作用,將使該公司能夠應對地緣政治風暴、投資新架構、構建數據中心原型等。所有這些活動都需要數百億美元,這是輝達絕大多數競爭對手,尤其是規模較小的初創公司無法企及的。
主要風險依然存在
儘管對輝達持樂觀態度,但該公司在未來發展中面臨一些主要風險。輝達不僅面臨來自 AMD 和英特爾等傳統加速器供應商的更激烈的競爭 (INTC),還面臨來自亞馬遜等超大規模企業的競爭 (AMZN)、Google (GOOG) 和微軟 (MSFT)。這些雲端巨頭正拼命想擺脫輝達的控制,這很合理,因為它們的人工智慧業務在很大程度上依賴輝達的 GPU。因此,輝達基本上擁有所有主要的科技巨頭和傳統加速器供應商,這對其利潤率造成了下行壓力。
輝達還面臨著不確定的研究方向。雖然目前的趨勢表明推理擴展沒有終點,但革命性的新方法,例如更高效的模型架構或混合量子-經典系統,可能會降低計算強度。如果研究人員找到在保持 o3 級能力的情況下大幅降低推理成本的方法,那麼對輝達硬體的需求可能會大幅下降。
結論
隨著 o3 引領一個無限推理擴展的時代,對輝達的影響是深遠的。輝達公司的市值已高達 3.2 兆美元,由於 OpenAI 新型模型帶來的測試時計算革命,其有望看到更多上漲空間。對於投資者而言,輝達在這個新範式中的作用是明確的;沒有其他公司比輝達更有能力抓住這場革命的需求增長,因為沒有其他公司擁有像輝達那樣的整體方法和最先進的技術。