從Workflow到Agent:互聯(lián)網(wǎng)從業(yè)者的技術(shù)躍遷與實(shí)踐指南

0 評(píng)論 2276 瀏覽 22 收藏 35 分鐘

互聯(lián)網(wǎng)效率革命的新階段——AI Agent,如何從被動(dòng)執(zhí)行到自主決策?本文通過(guò)同程旅行DeepTrip案例,解析Agent的核心架構(gòu)與落地實(shí)踐,帶你領(lǐng)略智能伙伴帶來(lái)的體驗(yàn)質(zhì)變。

引言:我們?yōu)楹涡枰狝gent?—— 互聯(lián)網(wǎng)效率革命的下一站

你有沒(méi)有過(guò)這樣的經(jīng)歷?給客服發(fā)消息,得到的永遠(yuǎn)是模板化回復(fù),解決不了你真正的問(wèn)題。或者在購(gòu)物網(wǎng)站上想找一件”適合送給喜歡戶外運(yùn)動(dòng)的朋友的生日禮物”,搜索結(jié)果卻完全不是你想要的。這些場(chǎng)景背后,其實(shí)都指向了同一個(gè)問(wèn)題:我們現(xiàn)有的自動(dòng)化工具,在面對(duì)復(fù)雜、模糊、非結(jié)構(gòu)化的需求時(shí),顯得越來(lái)越力不從心。

作為一個(gè)在互聯(lián)網(wǎng)行業(yè)摸爬滾打多年的產(chǎn)品經(jīng)理,我見(jiàn)證了太多這樣的痛點(diǎn)。從早期的RPA機(jī)器人到后來(lái)的工作流自動(dòng)化,這些工具確實(shí)在特定場(chǎng)景下提高了效率,但它們都有一個(gè)共同的局限——只能按照預(yù)設(shè)的規(guī)則行事。就像一個(gè)只能沿著固定軌道行駛的火車,遇到軌道外的情況就束手無(wú)策。

AI Agent的出現(xiàn),確實(shí)標(biāo)志著互聯(lián)網(wǎng)效率革命邁入了新階段。它的核心突破在于,機(jī)器不再只是被動(dòng)執(zhí)行預(yù)設(shè)命令的工具,而是轉(zhuǎn)變?yōu)槟軌?strong>深度理解用戶意圖、并自主規(guī)劃與執(zhí)行完整任務(wù)的智能伙伴。這推動(dòng)交互范式發(fā)生了根本性轉(zhuǎn)變:從過(guò)去需要用戶主動(dòng)操作、一步步進(jìn)行“信息檢索”的模式,躍遷至用戶只需設(shè)定目標(biāo),AI Agent便能自主完成“決策執(zhí)行”的全新邏輯。

我近期關(guān)注的同程旅行DeepTrip就是一個(gè)典型例證。與傳統(tǒng)旅行服務(wù)需要用戶親自搜索比價(jià)、規(guī)劃路線不同,你只需向DeepTrip陳述核心需求(例如“下周去杭州玩三天,預(yù)算3000元,喜歡自然風(fēng)光和美食”),它就能自主拆解目標(biāo)、調(diào)用工具、生成方案并完成從行程規(guī)劃到機(jī)票酒店預(yù)訂的閉環(huán)操作。這不僅僅是節(jié)省時(shí)間的量變提升,更是一種體驗(yàn)的質(zhì)變,它重新定義了服務(wù)的本質(zhì)——從提供被動(dòng)的、需要用戶驅(qū)動(dòng)的工具,轉(zhuǎn)變?yōu)榻桓吨鲃?dòng)的、完整的解決方案。

在互聯(lián)網(wǎng)發(fā)展的早期,我們解決的是信息獲取的問(wèn)題;移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們解決的是服務(wù)觸達(dá)的問(wèn)題;而現(xiàn)在,Agent要解決的是決策執(zhí)行的問(wèn)題。這不僅僅是技術(shù)的進(jìn)步,更是人機(jī)交互模式的根本轉(zhuǎn)變。

本質(zhì)區(qū)別:Agent不是”更智能的Workflow”

說(shuō)到Agent,很多人會(huì)覺(jué)得這不就是”更智能的工作流”嗎?畢竟工作流(Workflow)也是自動(dòng)化執(zhí)行一系列任務(wù)。但這其實(shí)是一個(gè)很大的誤解,Agent和Workflow有著本質(zhì)的區(qū)別。如果用一個(gè)比喻來(lái)說(shuō),Workflow就像鐵軌,而Agent就像越野車——它們雖然都能幫你到達(dá)目的地,但工作方式完全不同。

Workflow就像火車,嚴(yán)格按照預(yù)設(shè)的軌道行駛。你提前鋪好了路,火車就沿著這條路走,不會(huì)偏離分毫。這種方式的優(yōu)勢(shì)很明顯:穩(wěn)定、高效,特別適合簡(jiǎn)單重復(fù)的任務(wù)。比如每月固定日期的工資發(fā)放,或者訂單確認(rèn)郵件的自動(dòng)發(fā)送,這些場(chǎng)景用Workflow非常合適。但劣勢(shì)也很突出——它無(wú)法應(yīng)對(duì)軌道之外的情況。一旦出現(xiàn)計(jì)劃外的問(wèn)題,整個(gè)流程就會(huì)卡住,必須等人工介入解決。

Agent則完全不同,它更像一輛配備了GPS和自動(dòng)駕駛功能的越野車。你不需要給它鋪好路,只需要告訴它目的地,它就能自己規(guī)劃路線,遇到障礙會(huì)繞開(kāi),路況不好時(shí)會(huì)減速,甚至在必要時(shí)會(huì)選擇完全不同的交通方式。這種目標(biāo)導(dǎo)向的工作方式,讓Agent在復(fù)雜多變的環(huán)境中表現(xiàn)出極強(qiáng)的適應(yīng)性。

我看到過(guò)一篇公眾號(hào)文章叫《AI Agent 四象限法則》,里面有個(gè)觀點(diǎn)我很認(rèn)同:當(dāng)”流程不確定”且”輸入不確定”時(shí),Agent的價(jià)值就體現(xiàn)出來(lái)了。比如客戶服務(wù)場(chǎng)景,用戶的問(wèn)題千變?nèi)f化,解決流程也各不相同,這時(shí)候傳統(tǒng)的Workflow根本無(wú)能為力,而Agent卻能游刃有余。

為了更直觀地理解兩者的區(qū)別,我們可以看看下面這個(gè)對(duì)比:

理解這個(gè)本質(zhì)區(qū)別非常重要,因?yàn)楹芏鄨F(tuán)隊(duì)在嘗試落地Agent時(shí),其實(shí)還是在用Workflow的思維去設(shè)計(jì)——提前定義好每一步該做什么,什么時(shí)候做。這樣做出來(lái)的東西,雖然可能比傳統(tǒng)Workflow更智能一些,但遠(yuǎn)遠(yuǎn)不是真正的Agent。

核心架構(gòu)解析:一個(gè)真正的Agent是如何工作的?

那么一個(gè)真正的Agent到底是如何工作的呢?它的內(nèi)部引擎是什么樣的?這可能是大家最關(guān)心的問(wèn)題。其實(shí)Agent的核心工作原理可以用一個(gè)循環(huán)來(lái)概括:”感知-規(guī)劃-行動(dòng)-觀察”,也就是常說(shuō)的ReAct循環(huán)。這個(gè)循環(huán)是Agent區(qū)別于簡(jiǎn)單問(wèn)答機(jī)器人的核心所在。

感知(Perception)

感知是Agent工作的第一步,就像我們用眼睛看、用耳朵聽(tīng)一樣,Agent通過(guò)感知模塊接收外部信息。這包括用戶的指令、當(dāng)前環(huán)境的狀態(tài)、以及之前行動(dòng)的結(jié)果。感知的關(guān)鍵在于理解信息的含義,而不僅僅是識(shí)別信息本身。

比如用戶說(shuō)”幫我準(zhǔn)備下周去上海的行程”,Agent需要感知到幾個(gè)關(guān)鍵信息:目標(biāo)是”準(zhǔn)備行程”,地點(diǎn)是”上海”,時(shí)間是”下周”。更重要的是,它需要理解”準(zhǔn)備行程”這個(gè)目標(biāo)背后通常包含哪些子任務(wù),比如確定具體日期、預(yù)訂交通、安排住宿、規(guī)劃活動(dòng)等。

規(guī)劃(Planning)

規(guī)劃是Agent的核心大腦,也是最能體現(xiàn)智能的部分。在這個(gè)階段,Agent需要基于感知到的信息和自身的目標(biāo),思考如何一步步實(shí)現(xiàn)這個(gè)目標(biāo)。這就像我們接到一個(gè)任務(wù)后,會(huì)在腦子里盤算”第一步該做什么,第二步該做什么,如果遇到XX情況該怎么辦”。

規(guī)劃過(guò)程通常包含幾個(gè)關(guān)鍵步驟:任務(wù)分解、優(yōu)先級(jí)排序、工具選擇。比如上面提到的行程規(guī)劃任務(wù),Agent可能會(huì)先把它分解成”確定具體日期”、”查詢航班”、”預(yù)訂酒店”、”規(guī)劃每日行程”等子任務(wù)。然后根據(jù)依賴關(guān)系確定執(zhí)行順序——通常需要先確定日期,才能查詢航班和酒店。最后,為每個(gè)子任務(wù)選擇合適的工具,比如用航班API查詢機(jī)票,用酒店預(yù)訂API查詢房間等。

這個(gè)過(guò)程中,大模型的”;思維鏈”(Chain-of-Thought)能力起到了關(guān)鍵作用。Agent不是簡(jiǎn)單地給出答案,而是模擬人類的思考過(guò)程,一步步推理出該怎么做。有時(shí)候?yàn)榱俗龀龈玫囊?guī)劃,Agent甚至?xí)M(jìn)行”內(nèi)心獨(dú)白”——在不執(zhí)行任何外部行動(dòng)的情況下,先在內(nèi)部進(jìn)行多步推理。

行動(dòng)(Action)

有了規(guī)劃之后,下一步就是執(zhí)行行動(dòng)了。行動(dòng)可以是調(diào)用外部工具(比如查詢數(shù)據(jù)庫(kù)、調(diào)用API、發(fā)送郵件),也可以是直接生成回答或建議。行動(dòng)的關(guān)鍵是準(zhǔn)確執(zhí)行規(guī)劃階段確定的步驟,并將結(jié)果返回給系統(tǒng)。

工具調(diào)用是Agent行動(dòng)能力的重要體現(xiàn)。一個(gè)強(qiáng)大的Agent通常會(huì)配備多種工具,就像一個(gè)人會(huì)使用不同的工具完成不同的任務(wù)一樣。比如查詢天氣用天氣API,查詢股票用股票API,發(fā)送消息用消息API等。Agent需要知道在什么情況下該用什么工具,以及如何正確使用這些工具。

DeepTrip的偽代碼里有一段很好地展示了這個(gè)過(guò)程:當(dāng)需要查詢杭州天氣時(shí),Agent會(huì)調(diào)用天氣工具;當(dāng)需要預(yù)訂酒店時(shí),會(huì)調(diào)用酒店預(yù)訂工具;當(dāng)需要推薦景點(diǎn)時(shí),會(huì)調(diào)用本地推薦工具。每個(gè)工具調(diào)用都有明確的輸入和預(yù)期輸出,Agent會(huì)根據(jù)這些信息來(lái)使用工具。

觀察(Observation)

行動(dòng)之后,Agent需要觀察行動(dòng)的結(jié)果,看看事情是否按照計(jì)劃進(jìn)行。這就像我們做完一件事后會(huì)檢查一下,確保沒(méi)有問(wèn)題。觀察到的結(jié)果會(huì)作為下一輪循環(huán)的輸入,幫助Agent判斷是否需要調(diào)整后續(xù)的規(guī)劃。

比如Agent調(diào)用航班API查詢機(jī)票后,可能會(huì)觀察到”下周上海的航班大部分已經(jīng)售罄,只剩下早上7點(diǎn)的早班機(jī)和晚上10點(diǎn)的紅眼航班”。這個(gè)結(jié)果會(huì)讓Agent重新規(guī)劃——可能需要詢問(wèn)用戶是否接受這些時(shí)間段,或者是否考慮調(diào)整出行日期。

這個(gè)”感知-規(guī)劃-行動(dòng)-觀察”的循環(huán)會(huì)一直持續(xù),直到Agent認(rèn)為目標(biāo)已經(jīng)完成為止。整個(gè)過(guò)程中,Agent不斷根據(jù)新的信息調(diào)整自己的計(jì)劃和行動(dòng),表現(xiàn)出很強(qiáng)的適應(yīng)性和自主性。

《深入淺出,關(guān)于智能體(AI Agent)入門》中有一張示意圖很好地展示了這個(gè)循環(huán)過(guò)程。Agent就像一個(gè)永不停歇的思考者和行動(dòng)者,通過(guò)這個(gè)循環(huán)不斷逼近目標(biāo)。理解了這個(gè)循環(huán),你就理解了Agent的核心工作原理。

落地實(shí)踐三步走:從想法到可運(yùn)行的Agent

講了這么多理論,大家可能更關(guān)心如何落地實(shí)踐。畢竟理論再美好,不能落地也是白搭。結(jié)合我自己的經(jīng)驗(yàn)和看到的案例,我總結(jié)出了一套”Agent落地三步走”方法論,希望能給大家一些實(shí)際的指導(dǎo)。

第一步:場(chǎng)景選擇與邊界定義

落地Agent的第一步不是急著選技術(shù)、搭框架,而是先選對(duì)場(chǎng)景。不是所有場(chǎng)景都適合用Agent,選錯(cuò)了場(chǎng)景,后面做得再好也很難成功。那么什么樣的場(chǎng)景適合Agent呢?我認(rèn)為要滿足”高價(jià)值、高復(fù)雜度、中低風(fēng)險(xiǎn)”這三個(gè)條件。

“高價(jià)值”意味著這個(gè)場(chǎng)景如果能用Agent解決,能帶來(lái)明顯的效益提升,可能是節(jié)省人力成本,也可能是提升用戶體驗(yàn)。”高復(fù)雜度”指的是這個(gè)場(chǎng)景中的任務(wù)流程不固定,輸入信息多變,傳統(tǒng)Workflow難以處理。”中低風(fēng)險(xiǎn)”則是考慮到Agent目前還不夠成熟,在風(fēng)險(xiǎn)過(guò)高的場(chǎng)景(比如醫(yī)療診斷、金融交易)中使用需要格外謹(jǐn)慎。

具體來(lái)說(shuō),比較適合的場(chǎng)景有:內(nèi)容創(chuàng)作助手(比如幫助營(yíng)銷人員撰寫和優(yōu)化文案)、智能客服升級(jí)(處理復(fù)雜的客戶問(wèn)題,而不只是回答FAQ)、內(nèi)部知識(shí)查詢Agent(幫助員工快速找到需要的文檔和信息)等。這些場(chǎng)景通常有明確的價(jià)值,復(fù)雜度適中,風(fēng)險(xiǎn)可控。

選定場(chǎng)景后,接下來(lái)要做的是明確定義Agent的邊界。也就是回答清楚”這個(gè)Agent能做什么,不能做什么”。很多團(tuán)隊(duì)在落地Agent時(shí)容易犯的一個(gè)錯(cuò)誤是想做一個(gè)”萬(wàn)能Agent”,什么都能處理。結(jié)果往往是樣樣通樣樣松,最后哪個(gè)場(chǎng)景都做不好。

我的建議是從”小切口”開(kāi)始,聚焦一個(gè)具體的子場(chǎng)景,把它做深做透。比如做智能客服Agent,可以先聚焦在”處理退款請(qǐng)求”這個(gè)具體場(chǎng)景,而不是一開(kāi)始就想處理所有客服問(wèn)題。這樣可以快速驗(yàn)證價(jià)值,積累經(jīng)驗(yàn),為后續(xù)擴(kuò)展打下基礎(chǔ)。

第二步:技術(shù)選型與工具鏈搭建

場(chǎng)景確定后,就進(jìn)入技術(shù)選型和工具鏈搭建階段了。這一步需要根據(jù)場(chǎng)景需求和團(tuán)隊(duì)能力做出合適的選擇。Agent的技術(shù)棧通??梢苑譃槿龑樱耗P蛯?、框架層和工具層。

模型層是Agent的”大腦”;,負(fù)責(zé)理解指令、進(jìn)行規(guī)劃和決策。目前有兩種主要選擇:思考模型和非思考模型。思考模型(比如GPT-4、DeepSeek等)擅長(zhǎng)復(fù)雜推理和規(guī)劃,但成本較高;非思考模型(比如一些開(kāi)源的7B、13B模型)推理能力較弱,但成本低、更可控。同程團(tuán)隊(duì)在做DeepTrip時(shí)就發(fā)現(xiàn),對(duì)于簡(jiǎn)單的查詢和執(zhí)行任務(wù),非思考模型可能更合適,因?yàn)轫憫?yīng)更快,成本更低;而對(duì)于復(fù)雜的規(guī)劃任務(wù),則需要思考模型的能力。

框架層負(fù)責(zé)實(shí)現(xiàn)Agent的核心循環(huán)(感知-規(guī)劃-行動(dòng)-觀察),以及狀態(tài)管理、記憶機(jī)制等。目前比較流行的Agent框架有LangGraph、AutoGen、LangChain等。這些框架各有特點(diǎn):LangGraph強(qiáng)調(diào)狀態(tài)管理和循環(huán)控制,適合構(gòu)建復(fù)雜的Agent邏輯;AutoGen擅長(zhǎng)多Agent協(xié)作,適合需要多個(gè)Agent配合完成任務(wù)的場(chǎng)景;LangChain則提供了豐富的工具集成,上手門檻較低。

如果團(tuán)隊(duì)技術(shù)能力有限,或者想快速驗(yàn)證想法,也可以考慮低代碼平臺(tái),比如華為云的Versatile。這些平臺(tái)提供了可視化的Agent構(gòu)建工具,不需要寫太多代碼就能搭建一個(gè)簡(jiǎn)單的Agent原型。

工具層是Agent與外部世界交互的橋梁,包括各種API、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)等。工具設(shè)計(jì)的好壞直接影響Agent的能力和效率。DeepTrip團(tuán)隊(duì)總結(jié)的”LLM-Friendly API”原則給了我很大啟發(fā),比如API的輸入輸出應(yīng)該使用自然語(yǔ)言描述,而不是復(fù)雜的JSON結(jié)構(gòu);應(yīng)該提供明確的錯(cuò)誤信息,幫助Agent理解失敗原因;應(yīng)該支持增量結(jié)果返回,方便Agent逐步處理等。這些原則看似簡(jiǎn)單,但在實(shí)際開(kāi)發(fā)中往往被忽視。

第三步:構(gòu)建評(píng)估飛輪與持續(xù)迭代

很多人以為Agent開(kāi)發(fā)完成后就大功告成了,但實(shí)際上這只是開(kāi)始。Agent不是一次開(kāi)發(fā)完成的產(chǎn)品,而是需要持續(xù)優(yōu)化的系統(tǒng)。就像人類需要通過(guò)學(xué)習(xí)和實(shí)踐不斷提升能力一樣,Agent也需要通過(guò)持續(xù)迭代變得越來(lái)越聰明。

要實(shí)現(xiàn)持續(xù)迭代,關(guān)鍵是構(gòu)建一個(gè)評(píng)估飛輪:收集數(shù)據(jù)→評(píng)估表現(xiàn)→發(fā)現(xiàn)問(wèn)題→優(yōu)化模型→部署更新→再收集數(shù)據(jù)。這個(gè)飛輪不斷轉(zhuǎn)動(dòng),Agent的能力就會(huì)不斷提升。

評(píng)估體系的建立尤為重要。目前主要有兩種評(píng)估方式:Rule-Based評(píng)估和Model-Based評(píng)估。Rule-Based評(píng)估是設(shè)定一些明確的規(guī)則,比如”是否成功完成了所有子任務(wù)”、”是否在規(guī)定時(shí)間內(nèi)完成”、”用戶滿意度評(píng)分是否達(dá)標(biāo)”等。這種方式簡(jiǎn)單直接,但可能無(wú)法覆蓋所有情況。Model-Based評(píng)估則是用一個(gè)專門的評(píng)估模型來(lái)判斷Agent的表現(xiàn),它可以從更全面的角度評(píng)估Agent的回答質(zhì)量、規(guī)劃合理性、工具使用適當(dāng)性等。

有了評(píng)估結(jié)果后,就可以針對(duì)性地進(jìn)行優(yōu)化了。常見(jiàn)的優(yōu)化方法包括監(jiān)督微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)(RL)。監(jiān)督微調(diào)是讓人工標(biāo)注一些高質(zhì)量的思考過(guò)程和行動(dòng)示例,然后用這些數(shù)據(jù)微調(diào)Agent模型。強(qiáng)化學(xué)習(xí)則是通過(guò)獎(jiǎng)勵(lì)機(jī)制來(lái)引導(dǎo)Agent學(xué)習(xí)更好的行為——做得好就給予獎(jiǎng)勵(lì),做得不好就給予懲罰,讓Agent在不斷嘗試中逐漸學(xué)會(huì)最優(yōu)策略。

OpenAI的一篇訪談中提到”評(píng)估是Agent成敗的關(guān)鍵”,我非常認(rèn)同這個(gè)觀點(diǎn)。很多團(tuán)隊(duì)花了大量精力開(kāi)發(fā)Agent,卻忽視了評(píng)估體系的建設(shè),結(jié)果就是不知道Agent到底表現(xiàn)如何,也不知道該如何改進(jìn)。沒(méi)有評(píng)估,就沒(méi)有迭代;沒(méi)有迭代,Agent就無(wú)法真正成長(zhǎng)。

挑戰(zhàn)與應(yīng)對(duì):繞過(guò)Agent落地的那些”坑”

可靠性(幻覺(jué)問(wèn)題)

除了用工具調(diào)用驗(yàn)證、多步推理校驗(yàn)和人工審核機(jī)制外,行業(yè)在應(yīng)對(duì)AI“幻覺(jué)”方面已發(fā)展出更多系統(tǒng)性的工程實(shí)踐。

  • 知識(shí)增強(qiáng)與源頭治理:從根本上減少幻覺(jué)的方法是為Agent提供準(zhǔn)確、專有的知識(shí)庫(kù)。檢索增強(qiáng)生成(RAG)技術(shù)是當(dāng)前最主流的方案之一。它讓Agent在回答問(wèn)題前,先從企業(yè)內(nèi)部的權(quán)威知識(shí)庫(kù)(如產(chǎn)品手冊(cè)、法規(guī)文檔、歷史工單)中檢索相關(guān)信息,以此為基礎(chǔ)生成答案,顯著提升了在垂直領(lǐng)域的準(zhǔn)確性。更進(jìn)一步,阿里云的實(shí)踐是構(gòu)建API知識(shí)圖譜,將Agent從基于概率的“閱讀理解”模式,轉(zhuǎn)變?yōu)檠貓D譜關(guān)系進(jìn)行確定性查詢的“查字典”模式,從而將API選擇的準(zhǔn)確率提升至接近100%。
  • 多智能體協(xié)作與博弈:通過(guò)引入多個(gè)智能體對(duì)同一問(wèn)題進(jìn)行獨(dú)立分析和討論,可以有效提升回復(fù)的客觀性和準(zhǔn)確性。哈爾濱工業(yè)大學(xué)(深圳)等機(jī)構(gòu)的研究表明,這種“多智能體交互”是緩解幻覺(jué)的有效方式。例如,可以設(shè)置一個(gè)“批判性審查Agent”,專門負(fù)責(zé)對(duì)主Agent生成的結(jié)果進(jìn)行挑錯(cuò)和驗(yàn)證。
  • 建立分層防御與可追溯機(jī)制:企業(yè)需要構(gòu)建從數(shù)據(jù)到輸出的全鏈路可靠性保障。這包括:在數(shù)據(jù)層,治理非結(jié)構(gòu)化數(shù)據(jù),構(gòu)建高質(zhì)量知識(shí)庫(kù);在過(guò)程層,要求Agent輸出“決策依據(jù)報(bào)告”,使其思考過(guò)程透明化、可解釋;在輸出層,所有Agent行為與生成日志都應(yīng)被記錄,實(shí)現(xiàn)可追蹤、可審計(jì),便于問(wèn)題定位和持續(xù)優(yōu)化。

成本與控制

成本控制與安全可控是Agent能否規(guī)?;涞氐年P(guān)鍵,企業(yè)已從架構(gòu)設(shè)計(jì)和治理流程上總結(jié)出了有效經(jīng)驗(yàn)。

  • 精細(xì)化成本管控與效能評(píng)估:OPPO人工智能團(tuán)隊(duì)的研究為成本優(yōu)化提供了系統(tǒng)性思路。他們引入了“單次通過(guò)成本”這一綜合衡量指標(biāo),強(qiáng)調(diào)不盲目追求最高性能的模型,而是根據(jù)任務(wù)復(fù)雜度選擇合適的模型,以實(shí)現(xiàn)性價(jià)比最優(yōu)。例如,簡(jiǎn)單任務(wù)可選用參數(shù)較小的開(kāi)源模型,復(fù)雜推理再調(diào)用頂級(jí)模型。同時(shí),要警惕“Best-of-N”采樣(多次嘗試取最優(yōu))帶來(lái)的邊際效應(yīng)遞減,設(shè)置嘗試次數(shù)的上限以避免成本激增而效果提升有限。
  • 權(quán)限分級(jí)與安全守護(hù)機(jī)制:對(duì)于控制難題,除了“Human-in-the-loop”,還需建立技術(shù)化的安全護(hù)欄。權(quán)限分級(jí)機(jī)制至關(guān)重要:基礎(chǔ)任務(wù)(如信息查詢)可賦予Agent較高自主權(quán),而核心業(yè)務(wù)操作(如財(cái)務(wù)審批、生產(chǎn)計(jì)劃調(diào)整)則必須設(shè)定為“Agent提議+人類審批”的模式。此外,可以引入“守護(hù)者Agent”,專門監(jiān)督其他核心Agent的決策,若發(fā)現(xiàn)異常(如預(yù)算分配偏差超閾值),立即觸發(fā)告警或人工審核。
  • 架構(gòu)優(yōu)化與模塊化設(shè)計(jì):阿里云的實(shí)踐表明,通過(guò)架構(gòu)重構(gòu)能帶來(lái)成本的數(shù)量級(jí)優(yōu)化。他們將單體Agent解構(gòu)為規(guī)劃、推理、執(zhí)行三個(gè)獨(dú)立層次,并通過(guò)“上下文工程”大幅減少不必要的Token消耗,從而將一次云環(huán)境創(chuàng)建交互的Token消耗從6萬(wàn)的高位顯著降低。九科信息的bit-Agent則采用“能力固化”機(jī)制,將已驗(yàn)證成功的任務(wù)流程固化為標(biāo)準(zhǔn)化模板,后續(xù)同類任務(wù)直接調(diào)用,避免了重復(fù)調(diào)用大模型生成計(jì)劃,實(shí)現(xiàn)了100%的流程可控與成本節(jié)約。

系統(tǒng)集成

面對(duì)企業(yè)復(fù)雜異構(gòu)的系統(tǒng)環(huán)境,Agent的集成需要清晰的策略和適配的架構(gòu)。

  • “漸進(jìn)式”集成策略與切入點(diǎn)選擇:切忌追求“大而全”的一步到位。成功的經(jīng)驗(yàn)是:從非核心、重復(fù)性高、數(shù)據(jù)較規(guī)范的流程試點(diǎn),例如質(zhì)檢報(bào)告生成、維修通知、巡檢日志填寫等。這有助于用低風(fēng)險(xiǎn)驗(yàn)證價(jià)值,積累經(jīng)驗(yàn)。同時(shí),優(yōu)先選擇可明確衡量投資回報(bào)率(ROI)的場(chǎng)景(如智能客服解決率、理賠處理周期)作為切入點(diǎn),更容易獲得后續(xù)支持。
  • 構(gòu)建協(xié)同的“多Agent系統(tǒng)”:對(duì)于復(fù)雜業(yè)務(wù)鏈條,單一Agent往往力不從心,需要多個(gè)Agent各司其職、協(xié)同工作。例如,某快消企業(yè)構(gòu)建的供應(yīng)鏈多Agent系統(tǒng),由“市場(chǎng)Agent”、“物流Agent”和“生產(chǎn)Agent”共同組成,在臺(tái)風(fēng)季成功協(xié)同預(yù)測(cè)風(fēng)險(xiǎn)并調(diào)整計(jì)劃,將損失減少了80%。這需要Agent編排器(Orchestrator)來(lái)協(xié)調(diào)調(diào)度多個(gè)Agent的工作流。
  • 采用標(biāo)準(zhǔn)化的集成框架與中間件:為降低集成復(fù)雜度,業(yè)界正積極采用如MCP(Model Context Protocol)等標(biāo)準(zhǔn)化協(xié)議。MCP可以視為Agent的“工具插槽”,通過(guò)它將各種企業(yè)系統(tǒng)(CRM、ERP、數(shù)據(jù)庫(kù))封裝成統(tǒng)一的工具接口供Agent調(diào)用。卓世科技和OpenAI Agents SDK的實(shí)踐都證明,基于MCP的架構(gòu)能實(shí)現(xiàn)低耦合、高可用的智能集成。對(duì)于沒(méi)有開(kāi)放API的遺留系統(tǒng),RPA(機(jī)器人流程自動(dòng)化)是一個(gè)實(shí)用的橋梁,通過(guò)模擬用戶界面操作來(lái)完成任務(wù),讓Agent能夠間接操作這些系統(tǒng)。

未來(lái)展望:Agent將如何重塑互聯(lián)網(wǎng)產(chǎn)品與組織

聊完了落地實(shí)踐和挑戰(zhàn),我們?cè)賮?lái)看看更遠(yuǎn)的未來(lái)。Agent不僅僅是一項(xiàng)技術(shù),它很可能會(huì)重塑整個(gè)互聯(lián)網(wǎng)的產(chǎn)品形態(tài)和組織運(yùn)作方式。這種變革可能比我們想象的來(lái)得更快、更深刻。

產(chǎn)品形態(tài):從”功能堆砌”到”任務(wù)完成”

現(xiàn)在的互聯(lián)網(wǎng)產(chǎn)品,大多是功能的堆砌。打開(kāi)任何一個(gè)App,你都會(huì)看到各種各樣的按鈕、菜單、頁(yè)面,用戶需要自己弄清楚”點(diǎn)這個(gè)按鈕能做什么”、”要完成XX任務(wù)需要點(diǎn)哪幾個(gè)步驟”。這種”功能導(dǎo)向”的產(chǎn)品設(shè)計(jì),把大量的認(rèn)知負(fù)擔(dān)轉(zhuǎn)移給了用戶。

Agent時(shí)代的產(chǎn)品將會(huì)完全不同,它會(huì)從”功能導(dǎo)向”轉(zhuǎn)變?yōu)?#8221;任務(wù)導(dǎo)向”。用戶不再需要關(guān)心具體的功能和操作步驟,只需要告訴產(chǎn)品”我想完成什么任務(wù)”,產(chǎn)品就會(huì)自動(dòng)規(guī)劃并執(zhí)行。這就像現(xiàn)在我們使用導(dǎo)航App,不需要知道具體走哪條路,只需要告訴它目的地,它就會(huì)幫你規(guī)劃好路線。

想象一下未來(lái)的購(gòu)物App:你不再需要瀏覽商品列表、篩選條件、比較價(jià)格,只需要說(shuō)”幫我買一件適合30歲女性的生日禮物,預(yù)算500元左右”,Agent就會(huì)幫你完成從挑選、比價(jià)到下單的全過(guò)程。如果收到后不滿意,它還會(huì)幫你處理退換貨。整個(gè)過(guò)程中,你幾乎不需要與任何”功能”交互,只需要與Agent對(duì)話。

這種產(chǎn)品形態(tài)的轉(zhuǎn)變,不僅會(huì)改變用戶體驗(yàn),還會(huì)重塑產(chǎn)品設(shè)計(jì)的方法論。未來(lái)的產(chǎn)品經(jīng)理可能不再需要設(shè)計(jì)界面和交互流程,而是需要設(shè)計(jì)Agent的目標(biāo)、能力邊界和行為準(zhǔn)則。

開(kāi)發(fā)模式:從”編寫邏輯”到”定義目標(biāo)、配置工具、調(diào)優(yōu)Agent”

Agent不僅會(huì)改變產(chǎn)品形態(tài),還會(huì)改變軟件開(kāi)發(fā)的模式。傳統(tǒng)的軟件開(kāi)發(fā),本質(zhì)上是編寫邏輯——告訴計(jì)算機(jī)”如果A發(fā)生,就執(zhí)行B;如果C發(fā)生,就執(zhí)行D”。這種方式在處理簡(jiǎn)單、確定的邏輯時(shí)很有效,但面對(duì)復(fù)雜、不確定的場(chǎng)景時(shí),就顯得力不從心。

Agent時(shí)代的開(kāi)發(fā)模式將會(huì)完全不同。開(kāi)發(fā)者不再需要編寫具體的執(zhí)行邏輯,而是需要做三件事:定義目標(biāo)、配置工具、調(diào)優(yōu)Agent。定義目標(biāo)就是明確告訴Agent要做什么;配置工具就是為Agent提供完成任務(wù)所需的各種能力(API、數(shù)據(jù)庫(kù)、應(yīng)用等);調(diào)優(yōu)Agent則是通過(guò)反饋和訓(xùn)練,讓Agent更好地理解目標(biāo)、更有效地使用工具。

這種開(kāi)發(fā)模式的轉(zhuǎn)變,會(huì)模糊產(chǎn)品經(jīng)理和工程師的職責(zé)邊界。產(chǎn)品經(jīng)理需要更懂技術(shù),知道哪些目標(biāo)是Agent可以實(shí)現(xiàn)的,哪些工具是必要的;工程師則需要更懂業(yè)務(wù),知道如何定義合適的目標(biāo),如何設(shè)計(jì)有效的反饋機(jī)制。未來(lái)可能會(huì)出現(xiàn)一種新的角色——Agent設(shè)計(jì)師,專門負(fù)責(zé)Agent的目標(biāo)定義、能力配置和行為調(diào)優(yōu)。

組織協(xié)同:出現(xiàn)”人機(jī)團(tuán)隊(duì)”,人類負(fù)責(zé)設(shè)定戰(zhàn)略目標(biāo)和審核,Agent負(fù)責(zé)執(zhí)行戰(zhàn)術(shù)任務(wù)

Agent對(duì)組織的影響可能比對(duì)產(chǎn)品和開(kāi)發(fā)的影響更為深遠(yuǎn)。傳統(tǒng)的組織架構(gòu)是圍繞”人”來(lái)設(shè)計(jì)的,我們有各種部門、團(tuán)隊(duì)、崗位,每個(gè)崗位負(fù)責(zé)特定的工作。這種架構(gòu)的效率往往受到溝通成本、協(xié)調(diào)難度、人員能力等因素的限制。

Agent的普及可能會(huì)催生”人機(jī)團(tuán)隊(duì)”的新型組織模式——人類和Agent組成團(tuán)隊(duì),各自發(fā)揮優(yōu)勢(shì)。人類更擅長(zhǎng)設(shè)定戰(zhàn)略目標(biāo)、做出價(jià)值判斷、處理突發(fā)情況;Agent則更擅長(zhǎng)執(zhí)行戰(zhàn)術(shù)任務(wù)、處理大量信息、保持持續(xù)工作。這種分工可以大大提高組織效率,同時(shí)讓人類從繁瑣的重復(fù)勞動(dòng)中解放出來(lái),專注于更有創(chuàng)造性的工作。

《非凡摯友》一書中提到”個(gè)體能力邊界被重塑”,我深有感觸。有了Agent的幫助,一個(gè)人的工作能力可以得到極大擴(kuò)展。比如一個(gè)營(yíng)銷人員,以前可能只能負(fù)責(zé)一個(gè)渠道的營(yíng)銷活動(dòng),現(xiàn)在借助Agent,可以同時(shí)策劃和執(zhí)行多個(gè)渠道的活動(dòng)——Agent負(fù)責(zé)收集數(shù)據(jù)、分析效果、生成報(bào)告,人類則負(fù)責(zé)制定策略、創(chuàng)意方向和關(guān)鍵決策。

這種人機(jī)協(xié)同的組織模式,可能會(huì)從根本上改變公司的運(yùn)作方式。我們可能會(huì)看到層級(jí)減少、流程簡(jiǎn)化、決策加快,組織變得更加敏捷和創(chuàng)新。當(dāng)然,這也會(huì)帶來(lái)新的挑戰(zhàn),比如如何管理人機(jī)團(tuán)隊(duì)、如何評(píng)估人類和Agent的貢獻(xiàn)、如何處理人機(jī)協(xié)作中的責(zé)任劃分等。

結(jié)語(yǔ):行動(dòng)的開(kāi)始

聊了這么多關(guān)于Agent的技術(shù)、實(shí)踐和未來(lái),不知道你有沒(méi)有一種躍躍欲試的感覺(jué)?我想說(shuō)的是,Agent技術(shù)已經(jīng)從未來(lái)的概念變成了當(dāng)下的實(shí)踐工具。現(xiàn)在就有很多開(kāi)源框架、API和案例可以參考,不需要等到技術(shù)”成熟”才開(kāi)始行動(dòng)。

回想互聯(lián)網(wǎng)發(fā)展的歷史,每一次重大的技術(shù)變革,都是由那些敢于在早期就嘗試的人推動(dòng)的。他們可能不是技術(shù)最頂尖的,但一定是最敢于實(shí)踐的。Agent革命也是如此,現(xiàn)在就有很多機(jī)會(huì)可以抓住。

我的建議是,不要一開(kāi)始就想著做一個(gè)”改變世界”的Agent,從一個(gè)具體的小場(chǎng)景開(kāi)始——可能是幫團(tuán)隊(duì)自動(dòng)整理會(huì)議紀(jì)要,可能是優(yōu)化客服回復(fù)流程,也可能是簡(jiǎn)化某個(gè)內(nèi)部審批環(huán)節(jié)。選擇一個(gè)你熟悉的場(chǎng)景,嘗試用Agent的思路去解決它。

在這個(gè)過(guò)程中,你會(huì)遇到各種問(wèn)題和挑戰(zhàn),但這正是學(xué)習(xí)和成長(zhǎng)的機(jī)會(huì)。重要的是開(kāi)始行動(dòng),在實(shí)踐中不斷迭代和改進(jìn)。記住,Agent的核心是”目標(biāo)導(dǎo)向、自主規(guī)劃、持續(xù)學(xué)習(xí)”,其實(shí)做Agent的我們,也應(yīng)該具備這樣的特質(zhì)。

從”自動(dòng)化”到”智能化”,從”功能使用”到”任務(wù)完成”,Agent正在開(kāi)啟一個(gè)新的人機(jī)交互時(shí)代。這個(gè)時(shí)代充滿了未知和挑戰(zhàn),但也充滿了機(jī)遇和可能。我相信,那些現(xiàn)在就開(kāi)始探索Agent的人,將會(huì)在未來(lái)的互聯(lián)網(wǎng)格局中占據(jù)有利位置。

那么,你準(zhǔn)備好開(kāi)始你的第一個(gè)Agent項(xiàng)目了嗎?

本文由 @餅屋 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!