AI Agent過時了,現(xiàn)在開始構(gòu)建Skills吧

0 評論 3750 瀏覽 3 收藏 13 分鐘

Anthropic團隊發(fā)現(xiàn),當(dāng)前AI的瓶頸并非智力不足,而是缺乏可復(fù)用的專業(yè)知識。他們提出用‘技能’這一簡單而強大的概念——本質(zhì)是封裝了程序性知識的文件夾——來取代復(fù)雜的Agent構(gòu)建模式。通過將代碼作為通用接口,并采用漸進式披露設(shè)計,這一方案讓AI能力構(gòu)建變得民主化,開啟了可積累、可共享的‘能力應(yīng)用商店’新時代。

最近看了 Anthropic 的 Barry Zhang 和 Mahesh Murag 在 AI Engineer 會議上的一個重磅分享,他們提出了一個新的范式轉(zhuǎn)換:緊耦合模型與運行時環(huán)境,用“技能”取代傳統(tǒng)的 Agent 構(gòu)建模式。深受啟發(fā),記錄一些感受如下:

近一年來,AI Agent無疑是科技圈最熱門的話題之一。它們承諾了一個美好的未來:AI 將不再僅僅是問答工具,而是能主動執(zhí)行復(fù)雜任務(wù)、與數(shù)字世界交互的智能體。然而,許多滿懷期待的用戶在實際體驗后,卻普遍感到一種挫敗感。

這種挫敗感源于一個核心痛點:盡管底層的大語言模型(如 Claude)極其智能,但在處理需要特定領(lǐng)域?qū)I(yè)知識的真實世界任務(wù)時,這些 AI 代理的表現(xiàn)卻像個“新手”。它們擁有強大的通用能力,卻缺乏經(jīng)驗和必要的背景知識,導(dǎo)致任務(wù)執(zhí)行不穩(wěn)定、結(jié)果不可靠。

Anthropic 的團隊在識別出這一全行業(yè)的瓶頸后,診斷出問題的根源并非智能的失敗,而是知識傳遞的障礙。這直接促使他們做出戰(zhàn)略轉(zhuǎn)向:停止構(gòu)建大而全的單一代理,轉(zhuǎn)而擁抱一個全新的范式。

1. AI 的真正瓶頸不是智力,而是專業(yè)知識

讓我們從一個生動的類比開始。假設(shè)現(xiàn)在是報稅季,你有兩個選擇:一位是智商高達 300 的數(shù)學(xué)天才,他能從第一性原理推導(dǎo)出復(fù)雜的稅法;另一位是經(jīng)驗豐富的稅務(wù)專家,他熟悉所有最新的稅法條款和申報流程。你會選擇誰來處理你的稅務(wù)?

答案顯而易見:幾乎所有人都會選擇稅務(wù)專家。因為我們需要的不是一個從零開始推導(dǎo)稅法的天才,而是一個能夠可靠、一致地執(zhí)行專業(yè)任務(wù)的專家。

這個類比精準地描繪了當(dāng)前 AI 代理的困境。它們就像那個數(shù)學(xué)天才,雖然聰明絕頂,但缺乏特定領(lǐng)域的深厚知識和實戰(zhàn)經(jīng)驗。它們可以完成令人驚嘆的任務(wù),但前提是你必須投入大量精力、提供極其詳盡的指導(dǎo)。它們無法很好地吸收你的專業(yè)知識,而且它們不會隨著時間的推移而學(xué)習(xí)。

“agents have intelligence and capabilities but not always expertise that we need for real work”

Anthropic 認識到,AI 要在專業(yè)領(lǐng)域真正發(fā)揮價值,就必須跨越從“高智商”到“高專精”的鴻溝。

2. 通往數(shù)字世界的通用接口不是復(fù)雜的工具,而是代碼

在探索初期,Anthropic 的團隊也曾認為,需要為金融、法律、醫(yī)療等不同領(lǐng)域構(gòu)建截然不同的代理和專門的工具集。這似乎是一個合乎邏輯的假設(shè):不同的領(lǐng)域需要不同的工具。

然而,他們很快迎來了一個反直覺的核心發(fā)現(xiàn):與數(shù)字世界交互的終極通用接口,其實不是無數(shù)個定制化的工具,而是“代碼”本身。

在成功構(gòu)建了編碼代理 Claude Code 之后,他們意識到,一個能夠理解和執(zhí)行代碼的通用代理,其應(yīng)用范圍遠比想象中要廣得多。以“生成一份財務(wù)報告”為例:代理可以通過代碼調(diào)用 API 獲取數(shù)據(jù)、用 Python 分析數(shù)據(jù),并將結(jié)果整合到文件中。整個工作流的核心,就是代碼的生成與執(zhí)行。

這一發(fā)現(xiàn)的深遠意義在于,核心的基礎(chǔ)架構(gòu)可以瞬間變得像 Bash 和文件系統(tǒng)一樣輕薄。這極大地簡化了底層架構(gòu),使其變得異常精簡和可擴展,不再需要為每個場景都設(shè)計一套復(fù)雜的專用接口。代碼,成為了連接 AI 與所有數(shù)字任務(wù)的通用語言。

3. 突破性的解決方案異常簡單:文件夾

既然問題是專業(yè)知識,接口是代碼,那么解決方案是什么?Anthropic 給出的答案出人意料地簡單:文件夾。

他們將新的解決方案命名為“技能(Skill)”,其本質(zhì)就是一個“打包了可組合程序性知識的有組織的文件夾集合”。這種設(shè)計的“刻意簡單性”背后,蘊含著強大的力量:

  • 兼容性:因為技能本質(zhì)上就是文件夾和文件,所以它們可以無縫地與我們已經(jīng)使用了幾十年的現(xiàn)有工具(如 Git、Google Drive、Zip 壓縮包)協(xié)同工作,無需任何額外的適配。
  • 易于創(chuàng)建:無論是人類專家還是 AI Agent,只要能操作計算機、創(chuàng)建文件夾和文件,就能創(chuàng)建、使用和分享技能。這極大地降低了為 AI 擴展能力的門檻。
  • 效率:為了讓代理能同時感知成百上千個技能,Anthropic 采用了“漸進式披露(progressively disclosed)”的巧妙設(shè)計。在初始階段,代理只會看到技能的元數(shù)據(jù)。只有當(dāng)它決定在特定任務(wù)中調(diào)用該技能時,才會去讀取包含核心指令的 skill.md 文件。這一設(shè)計巧妙地避免了代理有限且昂貴的上下文窗口被信息淹沒,使其能夠高效地管理海量技能而不影響性能。

舉個具體的例子:團隊發(fā)現(xiàn) Claude 在工作中,會反復(fù)編寫同一個 Python 腳本來為演示文稿應(yīng)用特定的樣式?,F(xiàn)在,他們只需讓 Claude 將這個腳本保存為一個“樣式應(yīng)用”技能。未來,任何版本的 Claude 在遇到同樣任務(wù)時,可以直接調(diào)用這個技能,從而保證了執(zhí)行的一致性和效率。

4. AI 的未來:一個面向“能力”的應(yīng)用商店

這個由“通用代理 + 技能庫”組成的架構(gòu),催生了一個富有遠見的類比,它清晰地勾勒出了 AI 應(yīng)用生態(tài)的未來圖景:

  • 模型  = 處理器 :它們是計算的核心,擁有巨大的潛力,但本身用途有限。
  • 代理運行時 = 操作系統(tǒng) :它負責(zé)協(xié)調(diào)資源(如文件系統(tǒng)、代碼執(zhí)行環(huán)境),讓處理器的價值得以體現(xiàn)。
  • 技能 (Skills) = 應(yīng)用程序:這才是真正創(chuàng)造價值的地方。就像數(shù)百萬開發(fā)者為 PC 和手機編寫應(yīng)用程序一樣,未來將由成千上萬的開發(fā)者通過構(gòu)建“技能”來解決具體問題。

這個類比的意義是深遠的,它標志著AI 能力構(gòu)建的民主化。它是一種戰(zhàn)略舉措,旨在通過賦能領(lǐng)域?qū)<遥ǘ粌H僅是 AI 工程師)來解鎖 AI 應(yīng)用的“長尾效應(yīng)”?,F(xiàn)在,來自財務(wù)、招聘、會計、法律等領(lǐng)域的專家,都可以將他們的知識和工作流程打包成“技能”,分享給團隊乃至整個社區(qū),真正開啟一個“全民共建 AI 能力”的時代。

5. AI 終將擁有真正可復(fù)利的“記憶”

傳統(tǒng) AI 的一個核心缺陷是“健忘”。每次交互都是一次新的開始,它無法從過去的經(jīng)驗中真正沉淀。而“技能”的出現(xiàn),讓 AI 的“記憶”變得具體化、可轉(zhuǎn)移且具有復(fù)利效應(yīng)。

重要的是,這種記憶并非要記錄一切,它只專注于固化那些可被 AI 在特定任務(wù)中重復(fù)使用的“程序性知識”。這是一個極其務(wù)實的方案,旨在有針對性地解決 AI 的學(xué)習(xí)和復(fù)用問題。

Anthropic 提出了一個激動人心的愿景:與你共事第 30 天的 Claude,將遠勝于第一天的它。因為在這 30 天里,你(或者 Claude 自己)可以將新的知識、高效的流程和有價值的反饋,不斷固化成一個個新的“技能”。

這種知識的積累還具有強大的網(wǎng)絡(luò)效應(yīng)。這就像社區(qū)里的某個人構(gòu)建了一個新的 MCP 服務(wù)器讓你的代理變得更有用一樣,現(xiàn)在,另一個人構(gòu)建的一個技能,也能讓你的代理瞬間變得更強大。

“The vision that excites us most is one of a collecting and collective and evolving knowledge base of capabilities that’s curated by people and agents inside of an organization.”

通過“技能”,AI 的學(xué)習(xí)和成長將不再是一次性的、孤立的,而是變成了一個可以持續(xù)積累、共享和演進的集體智慧體系。

結(jié)論:停止重復(fù)造輪子,開始構(gòu)建能力

Anthropic 的探索標志著一個重要的范式轉(zhuǎn)變:我們或許應(yīng)該停止構(gòu)建一個個孤立的、試圖包羅萬象的 AI 代理,轉(zhuǎn)而投入到一個更靈活、更具擴展性的生態(tài)系統(tǒng)中去——一個由“通用代理”作為操作系統(tǒng),由無數(shù)“可組合技能”作為應(yīng)用程序的生態(tài)。

這種轉(zhuǎn)變將重點從“代理的智力”轉(zhuǎn)移到了“代理的能力”上。它不僅為解決 AI 代理的“新手”困境提供了清晰的路徑,更為 AI 的普及和價值創(chuàng)造打開了全新的想象空間。

那么,不妨思考一下這個問題:如果讓你教給 AI 第一個“技能”來徹底改變你的日常工作,那會是什么?

本文由人人都是產(chǎn)品經(jīng)理作者【產(chǎn)品經(jīng)理駱齊】,微信公眾號:【駱齊】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!