Kimi 逆襲，硅谷紙貴

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

雪豹財(cái)經(jīng)社

2025-11-13

0 評(píng)論 1036 瀏覽 0 收藏

14 分鐘

月之暗面發(fā)布了新一代模型Kimi K2 Thinking。與之同時(shí)引發(fā)熱議的，不僅是它在數(shù)學(xué)推理、代碼理解上的進(jìn)步，還有它背后的一個(gè)數(shù)字——460萬(wàn)美元的訓(xùn)練成本。

在估值5000億美元的“AI獨(dú)角獸之王”O(jiān)penAI面前，糧草彈藥薄弱的中國(guó)初創(chuàng)公司要想突圍，“硬剛”顯然不現(xiàn)實(shí)，只能另辟蹊徑、彎道超車。

月之暗面正代表一種新型的AI力量——它不一定最豪華，卻可能最高效；不一定擁有最多資源，卻更懂得如何讓資源發(fā)揮最大價(jià)值。

低成本美學(xué)的中國(guó)AI力量

10月的最后一個(gè)工作日，雪豹財(cái)經(jīng)社拜訪了月之暗面的北京辦公室。我們注意到，月之暗面的會(huì)議室都以樂隊(duì)命名：Pink Floyd、The Rolling Stone、Queen、The Beatles、Radiohead……

阿里有“光明頂”，百度有“昆侖”，它們講秩序與修煉；月之暗面卻更像一支正在排練的樂隊(duì)，崇尚自由、創(chuàng)新和反叛。搖滾樂在誕生之初，就是一種“低投入門檻”的音樂：它不需要復(fù)雜的錄音室或昂貴的樂器，一把破吉他、一套架子鼓就能表達(dá)強(qiáng)大的力量。

就在那次拜訪后一周，11月6日，月之暗面發(fā)布了新一代模型“Kimi K2 Thinking”。與之同時(shí)引發(fā)熱議的，不僅是它在數(shù)學(xué)推理、代碼理解上的進(jìn)步，還有它背后的一個(gè)數(shù)字——460萬(wàn)美元的訓(xùn)練成本。

在一個(gè)大型AI模型動(dòng)輒要花幾千萬(wàn)美元、幾億算力小時(shí)的時(shí)代，這個(gè)數(shù)字顯得幾乎不真實(shí)。但它確實(shí)發(fā)生了——而且，類似的故事正在中國(guó)反復(fù)上演，它們共同指向一個(gè)事實(shí)：中國(guó)的AI產(chǎn)業(yè)正在進(jìn)入一個(gè)高效期：模型越來(lái)越強(qiáng)，但花的錢越來(lái)越少。

問題是，這意味著什么？

“中國(guó)效率”再次震撼硅谷

CNBC一則有關(guān)Kimi K2 Thinking訓(xùn)練成本的報(bào)道，猶如巨石投入水面，業(yè)界一片嘩然。

460萬(wàn)美元，還不到GPT-4訓(xùn)練成本的8%，甚至比DeepSeek披露的V3訓(xùn)練成本（租賃價(jià)，正式訓(xùn)練階段）560萬(wàn)美元還要低。

而在性能上，Kimi K2 Thinking在Humanity‘s Last Exam、BrowseComp等部分權(quán)威基準(zhǔn)測(cè)試中，取得了媲美甚至超越GPT-5和Claude 4.5等頂級(jí)模型的表現(xiàn)。

長(zhǎng)期以來(lái)，在人們的印象中，AI能力與天價(jià)資本支出之間似乎已形成了線性關(guān)系：更強(qiáng)大的模型，理應(yīng)對(duì)應(yīng)著更龐大的投入。

但Kimi K2和DeepSeek的出現(xiàn)都打破了這個(gè)邏輯，重建了一套新的敘事，徹底顛覆了傳統(tǒng)認(rèn)知。

雖然此后月之暗面創(chuàng)始團(tuán)隊(duì)出面回應(yīng)：“這不是官方數(shù)據(jù)。訓(xùn)練成本很難計(jì)算，因?yàn)槠渲泻艽笠徊糠钟糜谘芯亢蛯?shí)驗(yàn)?！钡诰薮蟮某杀静町惷媲埃@個(gè)解釋并沒有稀釋業(yè)界的驚嘆。

Hugging Face聯(lián)合創(chuàng)始人Thomas Wolf 甚至發(fā)出靈魂拷問：“我們是否每隔幾個(gè)月就要經(jīng)歷一次‘DeepSeek 時(shí)刻’？”

與之形成鮮明對(duì)比的是，今年8月，OpenAI首席執(zhí)行官山姆?奧爾特曼（Sam Altman）表示，未來(lái)公司將投入數(shù)萬(wàn)億美元夯實(shí)AI基建，用于支持各項(xiàng)人工智能服務(wù)。而就在Kimi K2發(fā)布后兩天，甲骨文一筆高達(dá)180億美元的數(shù)據(jù)中心融資交易的消息公布。

兩相對(duì)比，海外媒體開始反思中美兩國(guó)在AI基礎(chǔ)設(shè)施投入和發(fā)展模式的差異。

CNBC預(yù)計(jì)，到2027年，美國(guó)將在數(shù)據(jù)中心上投入近7000億美元，而相比之下，中國(guó)的主要玩家，包括阿里巴巴、騰訊、字節(jié)跳動(dòng)和百度，合計(jì)預(yù)期投入不到800億美元。也就是說(shuō)，資本支出差距高達(dá)10:1，但系統(tǒng)性能卻基本相當(dāng)。

當(dāng)美國(guó)玩家在通過(guò)私人信貸和債券市場(chǎng)為龐大的數(shù)據(jù)中心融資時(shí)，中國(guó)同行正在靠效率取勝——使用更便宜的芯片、開源模型，以及需要更少資本投入的精簡(jiǎn)基礎(chǔ)設(shè)施。

據(jù)一家國(guó)際媒體估算，Kimi K2 Thinking的API價(jià)格比OpenAI和Anthropic的同類模型便宜6到10倍，可能對(duì)企業(yè)的采用模式造成沖擊。

Thomas Wolf表示，Kimi K2 Thinking發(fā)布后，已成為該平臺(tái)上最受開發(fā)者歡迎的模型。

進(jìn)一步的質(zhì)疑在于，AI領(lǐng)域的游戲規(guī)則是否正在被改寫？

Interconnected Capital 創(chuàng)始人兼首席投資官Kevin Xu在接受CNBC采訪時(shí)表示，此前，人工智能領(lǐng)域幾乎所有的事情都是由硬件主導(dǎo)的，這就是為什么OpenAI、Anthropic能夠做它們所做的事情。但DeepSeek的進(jìn)化提供了在中國(guó)發(fā)展人工智能的另一種方式，即軟件主導(dǎo)。

如今，從DeepSeek、阿里巴巴的通義大模型，再到Kimi K2 Thinking，中國(guó)的大模型，正在通過(guò)開源策略和極致的成本效率，改變?nèi)斯ぶ悄茴I(lǐng)域的競(jìng)爭(zhēng)態(tài)勢(shì)和格局。

Kimi K2 Thinking 為何“炸場(chǎng)”？

Kimi K2 Thinking之所以大受歡迎，原因很簡(jiǎn)單：更聰明，但價(jià)格更低。

以每百萬(wàn)Token的API調(diào)用成本來(lái)對(duì)比，K2 Thinking的輸入和輸出成本分別為0.15和2.5美元，GPT-5分別為1.25和10美元。

市場(chǎng)的認(rèn)知已經(jīng)被重塑：最實(shí)用的模型≠最貴的模型。

在過(guò)去很長(zhǎng)一段時(shí)間，資金算力決定論是美國(guó)模式主導(dǎo)下的敘事邏輯。OpenAI、Anthropic、Google DeepMind們爭(zhēng)相掀起大模型“軍備競(jìng)賽”，但錢燒得越來(lái)越快，模型進(jìn)步卻越來(lái)越慢。據(jù)美國(guó)投行摩根士丹利的估算，訓(xùn)練GPT-4的成本超過(guò)6000萬(wàn)美元。

而在中國(guó)，我們看到的恰好相反：Kimi用幾十分之一的成本，達(dá)到了接近GPT的能力。

估值5000億美元的“AI獨(dú)角獸之王”O(jiān)penA，技術(shù)團(tuán)隊(duì)規(guī)模幾千人，其中大部分是高薪挖來(lái)的專家，已部署超過(guò)10 萬(wàn)塊NVIDIA H100 GPU，接下來(lái)還有1萬(wàn)億美元的算力擴(kuò)張計(jì)劃。而月之暗面估值33億美元，不及前者的1%，技術(shù)團(tuán)隊(duì)只有200余人。

在這場(chǎng)完全不對(duì)等的對(duì)決面前，糧草彈藥薄弱的中國(guó)初創(chuàng)公司要想突破OpenAI們的銅墻鐵壁，“硬剛”顯然不現(xiàn)實(shí)，只能另辟蹊徑、彎道超車。

Kimi現(xiàn)階段的重點(diǎn)是：“充分壓榨每一張卡”，通過(guò)架構(gòu)優(yōu)化和成本控制換取最佳性能。

從燒錢競(jìng)賽轉(zhuǎn)向效率競(jìng)賽，這并非“中國(guó)效率”第一次給硅谷帶來(lái)“億點(diǎn)點(diǎn)”小小的震撼。

自去年年底DeepSeek R1橫空出世，在大幅降低推理成本的達(dá)到了與o1并肩的表現(xiàn)，國(guó)產(chǎn)大模型多次貢獻(xiàn)令人驚喜的表現(xiàn)。Qwen躋身Hugging Face模型下載榜單的Top 10，智譜（Z.ai）的GLM系列模型、MiniMax等也頗受海外用戶關(guān)注。

換句話說(shuō)，中國(guó)AI創(chuàng)新在資源限制中不斷涌現(xiàn)。

“小米加步槍”的突圍邏輯

如果說(shuō) 2022 年 ChatGPT 的發(fā)布標(biāo)志著“AI 啟蒙”，那么進(jìn)入2025年，中國(guó)AI在有限資源下涌現(xiàn)出的創(chuàng)新，用有限的算力榨出的極限性能，一次次向世界展示了中國(guó)團(tuán)隊(duì)的技術(shù)實(shí)力。

AI創(chuàng)新不僅是算力競(jìng)賽，也是效率競(jìng)爭(zhēng)；AI的競(jìng)爭(zhēng)不僅是“有多少錢”，也是“怎么用好每一分錢”。

Kimi和DeepSeek的崛起，讓全球觀察者重新審視一個(gè)老問題：為什么那些沒有寵大資金支撐的中國(guó)團(tuán)隊(duì)，能在AI領(lǐng)域接連跑出黑馬？

答案或許可以概括為三點(diǎn)：技術(shù)哲學(xué)、資源稟賦、算法策略。

美國(guó)的大模型往往帶著“科研理想主義”的浪漫色彩——先設(shè)想一個(gè)理想系統(tǒng)，再投入海量資源去逼近。而中國(guó)的團(tuán)隊(duì)更像是“工程現(xiàn)實(shí)主義者”——現(xiàn)有資源下的最優(yōu)解是什么。

DeepSeek 在去年引入了被稱為“稀疏激活”的技術(shù)，即模型在推理時(shí)并非激活所有神經(jīng)元，而是根據(jù)任務(wù)動(dòng)態(tài)選擇部分網(wǎng)絡(luò)參與，從而將推理成本壓縮至原來(lái)的幾分之一。

Kimi K2模型第一次在超大規(guī)模的模型上采用了全新一代的優(yōu)化器，實(shí)現(xiàn)了2倍左右的效率提升。

11月5日，就在Kimi K2 Thinking發(fā)布的前一天，英偉達(dá)CEO黃仁勛在一場(chǎng)閉門會(huì)中斷言：“中國(guó)將贏下這場(chǎng)人工智能的全球競(jìng)賽”。

重估中國(guó)AI基模的三重邏輯

是時(shí)候給月之暗面?zhèn)冎匦鹿乐盗?。因?yàn)?，資本市場(chǎng)正在慢慢意識(shí)到：AI公司的真正壁壘，或許不再是參數(shù)規(guī)模，而是單位算力產(chǎn)出價(jià)值（Compute Efficiency）。

對(duì)月之暗面?zhèn)兊膬r(jià)值重估至少有三重邏輯：

第一重，從“資本密集型”轉(zhuǎn)向“智力密集型”。不到500萬(wàn)美元訓(xùn)練出能與GPT-4相抗的模型，意味著這家公司擁有一種新型技術(shù)杠桿，能在低成本條件下保持高速創(chuàng)新。這種能力本身就是資本市場(chǎng)最稀缺的資產(chǎn)——即高ROI的研發(fā)能力。

第二重，成本結(jié)構(gòu)可復(fù)制，商業(yè)化可預(yù)期。與那些動(dòng)輒上億美元的模型不同，Kimi的成本意味著它的更新頻率更高、風(fēng)險(xiǎn)更可控。這讓月之暗面具備了可持續(xù)迭代的模型。有點(diǎn)類似于服裝行業(yè)為應(yīng)對(duì)快速變化的市場(chǎng)需求而建立的柔性生產(chǎn)體系。

第三重，戰(zhàn)略位置：處于中國(guó)AI生態(tài)的關(guān)鍵節(jié)點(diǎn)。中國(guó)的AI產(chǎn)業(yè)正處在“算力去中心化”的關(guān)鍵階段。以阿里、字節(jié)為代表的巨頭，以Deepseek、月之暗面為代表的模型公司，正在形成一條從底層框架到應(yīng)用的“內(nèi)生循環(huán)”。DeepSeek和Kimi的出現(xiàn)，不僅補(bǔ)全了“高性價(jià)比模型”這一生態(tài)空白，也成為中國(guó)AI產(chǎn)業(yè)全球化的新樣板。它證明了，不依賴巨額算力投入，也能在技術(shù)上正面對(duì)標(biāo)國(guó)際頂級(jí)模型。

過(guò)去三年，AI 競(jìng)爭(zhēng)的關(guān)鍵詞是“大”：參數(shù)更大、語(yǔ)料更大、訓(xùn)練集群更大。

但接下來(lái)，它會(huì)變成另一種邏輯：誰(shuí)能以最少的資源，創(chuàng)造出最強(qiáng)的智能。

未來(lái)的AI競(jìng)爭(zhēng)將不再是“硬件戰(zhàn)爭(zhēng)”，而是四個(gè)維度的綜合較量：數(shù)據(jù)效率——誰(shuí)能用更少的數(shù)據(jù)訓(xùn)練出更通用的模型；算法創(chuàng)新——誰(shuí)能讓模型學(xué)得更快、想得更深；推理成本——誰(shuí)能讓AI的使用成本降到人人可負(fù)擔(dān)；場(chǎng)景融合——誰(shuí)能最快把AI變成真實(shí)生產(chǎn)力。

中國(guó)的機(jī)會(huì)正在于此：在硬件上雖有短板，但在成本結(jié)構(gòu)、產(chǎn)業(yè)整合、場(chǎng)景落地上具備極強(qiáng)的實(shí)踐能力。

而像月之暗面這樣的公司，正代表著這種新型AI力量——它不一定最豪華，卻可能最高效；不一定擁有最多資源，卻更懂得如何讓資源發(fā)揮最大價(jià)值。

在這一新的周期里，決定勝負(fù)的不只是誰(shuí)擁有更多芯片，還有誰(shuí)能用有限的芯片做出最聰明的模型和應(yīng)用。

DeepSeek和 Kimi的幾百萬(wàn)美元，也許不僅是一筆訓(xùn)練預(yù)算的數(shù)字，更是中國(guó)人在限制中也能持續(xù)創(chuàng)新的生動(dòng)注腳。

撰文：陳序?qū)?，黃運(yùn)濤

本文由人人都是產(chǎn)品經(jīng)理作者【雪豹財(cái)經(jīng)社】，微信公眾號(hào)：【雪豹財(cái)經(jīng)社】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Kimi官網(wǎng)截圖

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App