GPT-5?沒有驚喜,但信號拉滿

1 評論 1113 瀏覽 0 收藏 14 分鐘

在AI技術(shù)快速發(fā)展的當下,OpenAI的GPT系列一直是行業(yè)的焦點。然而,隨著GPT-5的發(fā)布,市場反應(yīng)卻相對平淡。本文將深入探討GPT-5發(fā)布背后的真實情況,分析其技術(shù)升級的局限性以及市場預(yù)期的落差。同時,本文還將探討大模型行業(yè)的發(fā)展趨勢,以及AI Agent的興起如何正在改變大模型的商業(yè)化路徑。

在GPT-4發(fā)布兩年之后,經(jīng)歷多次“跳票”的GPT-5終于在今日登場。

北京時間8月8日凌晨1點,OpenAI舉辦了一場超過一小時的發(fā)布會,系統(tǒng)展示了GPT-5在智能水平、編程能力、任務(wù)推理等維度的性能迭代。

但相比此前GPT-3到GPT-4所帶來的全方位升級,許多人表示,這次GPT-5并沒有帶來更多的驚喜,從發(fā)布會規(guī)模、產(chǎn)品亮點、到性能升級,都顯得較為平庸,相較當前主流SOTA模型,提升幅度并不顯著。

反倒是價格策略成了此次發(fā)布的最大亮點。GPT-5的API調(diào)用價格僅為前幾日發(fā)布的Claude Opus 4.1的1/15,顯著低于Gemini 2.5 Pro,在當前大模型市場上展現(xiàn)出極強的性價比。

近兩年,隨著AI工具開始席卷各行各業(yè),人們渴望AI能夠取代重復(fù)繁瑣的工作,也在擔憂自己是否會被AI所取代,這也是GPT-5發(fā)布前備受關(guān)注的原因之一。但就目前GPT-5的能力突破來看,人類智能在通往AGI的路上仍有很長一段路要走。

回顧過去幾年GPT的迭代歷程,不僅是眾多AI公司爭相效仿的對象,也是整個大模型行業(yè)發(fā)展的縮影。而此次GPT-5相對平庸的表現(xiàn),雖然打破了外界對大模型技術(shù)持續(xù)突破的慣性認知,但某種程度上,也在大多數(shù)人的意料之中。

相比AI興起階段大眾對于大模型技術(shù)的過高展望,市場上有關(guān)大模型參數(shù)突破的討論正勢漸微弱。相比起技術(shù)突破,人們開始更加關(guān)心的是,AI如何更有效地滲透進日常生活。

01 從GPT1到GPT5

GPT的未來要走向哪里?

自2018年OpenAI發(fā)布首個大模型GPT-1以來,GPT系列已經(jīng)走過了七年。

2020年GPT3的出現(xiàn),讓大模型參數(shù)規(guī)模從15億直接拓展到了1750億,也因此通過“上下文學習”能力,擺脫了對大量標注數(shù)據(jù)的依賴,使大模型能夠開始作為效率工具使用。

兩年后,基于GPT-3.5構(gòu)建的對話式模型ChatGPT上線,進一步推動大模型走入C端日常,成為通用AI應(yīng)用的重要落地轉(zhuǎn)折點。

隨后GPT-4的全面升級,更是在實現(xiàn)萬億級模型參數(shù)的同時,讓大模型在單純文本輸出的基礎(chǔ)上,實現(xiàn)了圖像的交互提升。

此后一年里,GPT發(fā)布的多款模型,都在圍繞圖像、語音互動等多模態(tài)能力迭代; deepseek的橫空出世,將推理模型帶向了大眾視野,去年OpenAI接連發(fā)布了O1、O3系列產(chǎn)品,將復(fù)雜推理作為了性能優(yōu)勢,開始強調(diào)對科學、編程等專業(yè)領(lǐng)域的協(xié)助能力。

與此同時,圍繞大模型參數(shù)量的宏大敘事開始逐漸消失,轉(zhuǎn)變?yōu)閷Χ嗄B(tài)、長文本等細節(jié)能力的追求,以及對醫(yī)療、教育等落地場景的討論。正因如此,大模型產(chǎn)品形態(tài)也開始從單一模型轉(zhuǎn)向了多版本并行。

截至目前,OpenAI已構(gòu)建起由GPT系列(主打?qū)υ捊换ィ?、O系列(聚焦復(fù)雜推理)以及圖像/視頻生成模型(支撐多模態(tài)創(chuàng)作)組成的三大產(chǎn)品矩陣。

在本次升級的GPT-5中,GPT進一步統(tǒng)一了O系列的推理能力和GPT的快速響應(yīng),相比較deepseek在模型使用時,自主選擇是否使用深度思考模式,GPT-5的區(qū)別在于能夠自動判斷對話類型。

OpenAI核心產(chǎn)品發(fā)布時間線

除此之外,在此次發(fā)布會中,OpenAI首次同時推出了4個版本,標準版GPT-5、輕量級的GPT-5 mini與GPT-5 nano,以及面向企業(yè)與高級訂閱用戶的GPT-5 Pro(需企業(yè)授權(quán)或月付200美元)。加深了按需定制、分層定價的SaaS化路徑演進。

這種轉(zhuǎn)變也意味著,對于AI公司來說,競爭的門檻不再僅是技術(shù)突破,還在于是否具備構(gòu)建產(chǎn)品體驗、搭建商業(yè)模型、整合跨界資源的綜合能力。

02 GPT-5難產(chǎn)真相:大模型升級為何越來越難?

DeepSeek上線所帶來的用戶量激增,不僅向外界證明了開源模型的商業(yè)化可行性,也進一步加深了大模型公司對“先發(fā)優(yōu)勢”的重視。當模型性能差距趨于收斂,前期對于用戶心智的爭奪上升為第一要義。

正因如此,隨著GPT-5問世的風聲不斷,最近一段時間,各大廠商開始紛紛加速競跑,相繼推出新品。

字節(jié)在兩個月前將豆包更新至1.6版本,阿里也在昨日推出了Qwen3-4B-Instruct-2507與Thinking-2507雙版本,MiniMax近幾日發(fā)布了新一代語言生成模型Speech 2.5,智譜也在上月底發(fā)布旗艦?zāi)P虶LM-4.5……一場集中式更新潮,給沉靜許久的大模型賽道掀起了又一波浪潮。

但當我們把時間拉長來看,這波密集的模型上新趨勢,距離上一次“百模大戰(zhàn)”的盛景,已經(jīng)過去了一年多。

大模型的更新趨勢正在逐漸放緩。不僅如此,相較GPT-3到GPT-4參數(shù)暴漲、多模態(tài)突破、上下文顯著增強的躍遷,近期多款新品的提升幅度也顯得頗為有限,大多數(shù)模型的升級和GPT-5一樣乏善可陳。

很多人把背后的原因歸結(jié)為數(shù)據(jù)瓶頸。

去年萬眾矚目的Orion,項目開發(fā)時長超過了18個月,曾經(jīng)被寄予厚望,原計劃作為GPT-5推出。結(jié)果在驗證時,性能卻遠未達到預(yù)期,最終只能被降級成GPT-4.5,在今年2月默默上線。

據(jù)業(yè)內(nèi)人士稱,Orion之所以失敗,最核心的原因在于,團隊摸到了預(yù)訓(xùn)練階段的天花板。隨著訓(xùn)練數(shù)據(jù)的不斷擴充,高質(zhì)量網(wǎng)絡(luò)數(shù)據(jù)存量不斷減少,直接導(dǎo)致了模型訓(xùn)練效果的下降。

除此之外,隨著大模型參數(shù)量不斷增加,硬件水平所帶來的掣肘也在越發(fā)放大,據(jù)媒體報道,有開發(fā)人員透露,OpenAI在去年年底所推出的推理模型O3,之所以能夠?qū)崿F(xiàn)核心的性能提升,主要依賴于使用更多的英偉達芯片進行開發(fā)。

更進一步的問題在于,大眾對于AI幻覺、AI味的抵制正在呈現(xiàn)更為激進的態(tài)勢。

GPT-5發(fā)布前夕,奧特曼曾在社交平臺分享了模型對話能力的演示。但出乎意料的是,評論區(qū)關(guān)注的焦點已不再是性能指標,而是GPT頻繁使用破折號的語言習慣。

此前OpenAI在今年2月推出的GPT 4.5,核心性能升級也在于提升模型情商,減少AI痕跡。與此同時,在有關(guān)GPT-5的權(quán)威測評數(shù)據(jù)中,也表示出AI事實性幻覺的大幅減少。

但正如眾多網(wǎng)友所吐槽的那樣,相比較數(shù)學能力的準確度提升,GPT-5在寫作流暢度、情商表現(xiàn)上卻遠不如GPT 4.5。

某種程度上來說,AI的思維機制和生成原理,注定了“事實性幻覺”始終是一種概率性存在。

Meta首席AI科學家楊立昆曾經(jīng)對當前主流的LLM背后的自回歸模型表示質(zhì)疑,認為其通過預(yù)測下一個詞來生成文本的模式,本質(zhì)上無法孕育出真正的智能。

這一判斷也對過去大模型訓(xùn)練逃不開的Scaling Law路線進行了質(zhì)疑,即單純增加參數(shù)數(shù)量并不能使得AI更好的擬合人類智能。背后的原因在于,兩者在思維結(jié)構(gòu)上存在本質(zhì)不同,前者是從更大、更多的參數(shù)中,以最小的成本組織信息;而后者則為了在不確定中生存和繁衍,具有更強的冗余性和模糊性。

03 AI Agent落地,大模型要讓位?

一直以來,圍繞ChatGPT的訂閱收費、API接口調(diào)用是OpenAI的重要盈利來源,但隨著今年AI Agent 的大量涌現(xiàn),大模型公司的商業(yè)化重心,開始發(fā)生了遷移。

上半年,OpenAI發(fā)布了兩款基于ChatGPT的AI Agent,一是可以代替用戶操作瀏覽器,自主執(zhí)行任務(wù)的Operator;二是可以輔助做深入研究,生成專業(yè)研究報告的Deep Research。

據(jù)The Information披露相關(guān)文件表示,OpenAI已告知投資者,預(yù)計到2025年末,AI Agent及其他新產(chǎn)品的合計銷售額將超越ChatGPT。

與此同時,對比去年全年37億美元的營收, OpenAI預(yù)計今年的營收能達到127億美元,相比去年的營收估值足足增長了2倍以上。背后最重要的驅(qū)動力之一,就是AI Agent。

事實上,AI Agent的商業(yè)化爆發(fā)并非OpenAI獨享。以輔助編程為核心的“vibe coding”編輯器Cursor便是典型代表。

憑借多行智能重構(gòu)、代碼自動補全和代碼庫查詢等功能,Cursor付費用戶已超36萬,最新估值較年初激增三倍。與此同時,曾引發(fā)全網(wǎng)“賬號搶購”熱潮的Manus,盡管被曝“出逃海外”,依然反映出AI Agent在垂直細分領(lǐng)域的極高用戶粘性。

AI Agent的興起,一方面得益于大模型底層性能的持續(xù)提升,另一方面則源自各垂直領(lǐng)域?qū)Χㄖ苹悄芄ぞ叩膭傂孕枨?。這種需求不僅使得Agent能夠更精準、高效地服務(wù)專業(yè)場景,也催生了更強的用戶依賴。

但需要指出的是,AI Agent在實際應(yīng)用中通常面臨更高的Tokens消耗,這對創(chuàng)業(yè)公司尤其是資金實力有限者而言是沉重的壓力。Manus的“出逃”,一定程度上折射出了初創(chuàng)團隊在高成本運維與現(xiàn)金流壓力下的兩難境地。

此外,AI Agent本質(zhì)上是建立在大模型基座之上的“套殼”應(yīng)用,模型能力的天花板直接限制了Agent的性能上限。相較之下,OpenAI等頭部大模型廠商在底層模型研發(fā)上擁有明顯優(yōu)勢,也因此更具主導(dǎo)權(quán)和話語權(quán),這也解釋了為何它們不會放棄AI Agent的開發(fā)與布局。

由此可見,大模型商業(yè)化正加速向細分場景和專門化應(yīng)用遷移。另一個與之相佐證的趨勢在于,OpenAI對“大模型閉源”的保守態(tài)度開始出現(xiàn)了松動。

在GPT-5發(fā)布前夕,OpenAI時隔三年再次推出了兩款開源模型:gpt-oss-120b 和 gpt-oss-20b。這一動作不僅被外界視作GPT-5發(fā)布前的技術(shù)熱身,也被認為是在試圖回應(yīng)業(yè)界對模型開源日益高漲的呼聲。

與此同時,GPT-5調(diào)用價格也被進一步拉低,僅為前幾日發(fā)布的Claude Opus 4.1的1/15。當模型迭代的平臺期和Agent商業(yè)化趨勢同時出現(xiàn),從“賣模型”轉(zhuǎn)向“賣能力”,大模型公司的產(chǎn)品重心正在發(fā)生實質(zhì)性轉(zhuǎn)變。本文系新眸原創(chuàng),申請轉(zhuǎn)載授權(quán)、商務(wù)合作請聯(lián)系微信:ycj841642330,添加好友請備注公司和職位。

新眸原創(chuàng)·作者 | 簡瑜

本文由人人都是產(chǎn)品經(jīng)理作者【新眸】,微信公眾號:【新眸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. GPT-5 雖無驚喜,但低價策略亮眼,大模型競爭轉(zhuǎn)向綜合能力。AI Agent 崛起成新方向,開源與商業(yè)化平衡成行業(yè)新課題。

    來自新疆 回復(fù)