對(duì)AI的實(shí)踐及思考

0 評(píng)論 323 瀏覽 1 收藏 16 分鐘

一場(chǎng)為期三個(gè)月的火車環(huán)游中國之旅,如何成為AI應(yīng)用的實(shí)戰(zhàn)演練場(chǎng)?本文將揭秘AI在旅行規(guī)劃、內(nèi)容創(chuàng)作與智能體開發(fā)中的驚人表現(xiàn),從10%預(yù)算誤差的精準(zhǔn)行程,到150萬用戶的智能體服務(wù),再到國內(nèi)外AI生態(tài)的深度對(duì)比,帶你見證AI如何重塑個(gè)人生產(chǎn)力與行業(yè)格局。

我從9月中旬開始火車環(huán)游中國,到12月中旬結(jié)束,已經(jīng)差不多3個(gè)月沒有更新文章。

但11月中旬在西安做過一次分享,現(xiàn)在在本文中把內(nèi)容整理一下,如有不對(duì)之處,還望指正,我也在不斷學(xué)習(xí)中。

將從以下四個(gè)方面展開分享:

  1. 個(gè)人AI實(shí)操經(jīng)驗(yàn):分享我運(yùn)用AI工具進(jìn)行旅行規(guī)劃、內(nèi)容創(chuàng)作與智能體(Agent)搭建的具體案例。
  2. 國內(nèi)外AI產(chǎn)品觀察:對(duì)比分析當(dāng)前AI產(chǎn)品的發(fā)展現(xiàn)狀與特點(diǎn)。
  3. AI發(fā)展趨勢(shì)猜想:探討技術(shù)演進(jìn)方向及其可能帶來的社會(huì)影響。
  4. 個(gè)人的應(yīng)對(duì)策略:面對(duì)AI時(shí)代的到來,我們應(yīng)如何思考和行動(dòng)。

一、個(gè)人AI實(shí)操經(jīng)驗(yàn)分享

1. AI輔助長途旅行規(guī)劃

我目前正在進(jìn)行一場(chǎng)坐火車環(huán)游中國的旅行。最初,我使用騰訊元寶AI助手規(guī)劃了一次自行車全國旅行,并生成了詳細(xì)的裝備清單。然而,在實(shí)際騎行兩天后,由于體力原因及廣州的臺(tái)風(fēng)天氣,我放棄了該方案。

隨后,我轉(zhuǎn)向讓AI規(guī)劃火車旅行方案。我向“騰訊元寶”提出了新的需求:

  • 旅行偏好:關(guān)注經(jīng)濟(jì)發(fā)達(dá)、產(chǎn)業(yè)特色明顯的地區(qū)。
  • 交通工具:明確以火車為主。
  • 規(guī)劃細(xì)節(jié):要求每日行程具有足夠的顆粒度,并最終提供費(fèi)用預(yù)算。

AI生成的完整方案涵蓋了以下細(xì)節(jié):

行程總覽:廣州出發(fā),經(jīng)沿海、山東、東北、陜西山西、新疆,最終返回四川。

每日詳情:包括行程區(qū)間、距離、交通時(shí)間、當(dāng)日詳細(xì)安排、考察重點(diǎn)、住宿地、以及交通、門票、食宿等分項(xiàng)與總計(jì)費(fèi)用。

實(shí)踐驗(yàn)證:我對(duì)比了AI生成的預(yù)算與實(shí)際支出(9月與10月數(shù)據(jù)),發(fā)現(xiàn)兩者偏差均在10%以內(nèi),說明當(dāng)前大模型在復(fù)雜規(guī)劃任務(wù)上已具備很高的實(shí)用性和參考價(jià)值。

2. 從旅行規(guī)劃延伸到內(nèi)容創(chuàng)作

基于AI生成的旅行方案,我進(jìn)一步探索其內(nèi)容創(chuàng)作潛力。

書籍框架搭建:我要求AI根據(jù)旅行路線,為我規(guī)劃一本旅行書的框架。AI迅速給出了包括書名、副標(biāo)題、序章及各章節(jié)(如東南、華北、東北、西北、西南地區(qū))的詳細(xì)大綱,并針對(duì)每個(gè)重點(diǎn)城市建議了寫作切入點(diǎn)。

自媒體賬號(hào)策劃:我請(qǐng)AI為旅行記錄設(shè)計(jì)一個(gè)自媒體賬號(hào)的運(yùn)營方案。它基于市場(chǎng)營銷的4P原則,輸出了包括品牌定位、名稱、Slogan(如“Go Go Go出發(fā)了”)、簡介、內(nèi)容方向、平臺(tái)選擇、發(fā)布節(jié)奏與頻率在內(nèi)的完整方案。

3. 智能體(Agent)的開發(fā)與實(shí)踐

我在國內(nèi)外主流AI平臺(tái)上有大量的智能體搭建實(shí)踐經(jīng)驗(yàn)。

開發(fā)規(guī)模:僅在騰訊元寶上就搭建了約300個(gè)智能體。

核心邏輯:高質(zhì)量的智能體需要一套結(jié)構(gòu)化的設(shè)計(jì)框架,包括:頭像、角色設(shè)定、基礎(chǔ)與延伸配置、參考案例等。這能確保智能體與用戶的交互更立體、感情更飽滿、考慮更周全。

應(yīng)用效果:我開發(fā)的一些智能體(如珠寶、兩性情感、機(jī)票、旅游等領(lǐng)域)在各大平臺(tái)累計(jì)服務(wù)用戶已超150萬,對(duì)話量巨大。

4. 使用AI的核心感受

  • 效率的極致壓縮:規(guī)劃一場(chǎng)全國性的火車旅行,傳統(tǒng)方式可能需要數(shù)天時(shí)間收集資料、安排行程,而借助AI,僅需2-3小時(shí)即可獲得詳盡方案。
  • 專業(yè)門檻的抹平:AI極大地拉平了多數(shù)行業(yè)的知識(shí)門檻。越是公開、易獲取的知識(shí)領(lǐng)域,AI的賦能效果越明顯。這讓我能夠快速切入無人機(jī)、口腔等陌生領(lǐng)域,開發(fā)相應(yīng)的智能體。
  • 持續(xù)工作與進(jìn)化:一旦創(chuàng)建,AI智能體可以7×24小時(shí)不間斷工作,并能隨著底層大模型的迭代而持續(xù)提升能力。

二、國內(nèi)外AI產(chǎn)品觀察

1. 技術(shù)能力布局

  • 基礎(chǔ)能力(語言、圖片、視頻、語音):已成為國內(nèi)外大廠及科技巨頭的標(biāo)配
  • 搜索整合:搜索與大模型天生契合。AI能在幾秒內(nèi)調(diào)用上百個(gè)信息源進(jìn)行分析。國內(nèi)外搜索公司及新興力量(如Kimi)都在強(qiáng)化此方向。
  • 延伸能力:從基礎(chǔ)能力衍生出的情緒識(shí)別、表情識(shí)別、圖片精修、商品圖生成、宣傳視頻制作、數(shù)字人、智能客服等技術(shù),大廠均已布局,同時(shí)涌現(xiàn)出像“美圖”這樣的垂直領(lǐng)域強(qiáng)者。

2. 應(yīng)用與解決方案

行業(yè)滲透

  • 智能客服:已廣泛應(yīng)用(如京東平臺(tái),需多次要求才轉(zhuǎn)人工)。
  • 商品推薦:京東、美團(tuán)等平臺(tái)的對(duì)話式推薦。
  • 解決方案:營銷方案、醫(yī)療輔助、辦公套件等領(lǐng)域均有成熟產(chǎn)品。
  • 垂類產(chǎn)品:音樂、游戲等領(lǐng)域也有大量創(chuàng)新。

3. 智能體(Agent)生態(tài)對(duì)比

  • 國內(nèi):模式豐富,包括提示詞、工作流、多智能體協(xié)作、插件等多種形式。
  • 國外:以提示詞為主,工作流和插件生態(tài)相對(duì)國內(nèi)較為簡單。

4. 產(chǎn)品交付與商業(yè)變現(xiàn)

產(chǎn)品交付:國內(nèi)在應(yīng)用層和用戶體驗(yàn)上目前做得更好。例如,OpenAI的GPT商店直到去年7月才推出,生態(tài)仍處早期。

商業(yè)變現(xiàn)

  • 國內(nèi):模式多樣,包括Token付費(fèi)、訂閱、線索售賣、商品售賣、廣告聯(lián)盟、知識(shí)付費(fèi)、客服等。
  • 國外:目前以訂閱和商品銷售為主,模式相對(duì)單一。

三、AI技術(shù)趨勢(shì)猜想

1. 技術(shù)演進(jìn)路徑

回顧歷史,從1950年代的構(gòu)想,到2017年Transformer架構(gòu)奠定基礎(chǔ),再到2022年底ChatGPT-3.5引發(fā)質(zhì)變,AI進(jìn)入大眾視野。目前正處于關(guān)鍵發(fā)展階段:

  • 多模態(tài):仍在發(fā)展中,未完全成熟。
  • 具身智能:讓AI與物理世界交互(如機(jī)器人),目前重點(diǎn)在解決基礎(chǔ)運(yùn)動(dòng)控制(如行走、平衡),相當(dāng)于在構(gòu)建“小腦”,與大模型的深度融合尚淺。
  • 未來方向:最終將走向具身智能與大模型的緊密融合,并由世界模型驅(qū)動(dòng),向通用人工智能(AGI)演進(jìn)。

2. 當(dāng)前架構(gòu)與未來形態(tài)

當(dāng)前:用戶與AI交互,AI調(diào)用工具、數(shù)據(jù)庫完成任務(wù)。

演進(jìn):從單一模型處理所有問題,轉(zhuǎn)向多智能體(Multi-Agent)協(xié)作。例如,一個(gè)“個(gè)人助理”Agent作為調(diào)度中心,將問題分類后,交由更專業(yè)的健身、租賃等垂直Agent處理,以提升效率、節(jié)省算力。

終極感知:AI的感知將不僅限于文字、語音、圖片、視頻,還將擴(kuò)展到物理世界,通過溫度、觸覺、味覺、壓力等傳感器獲取全方位數(shù)據(jù),經(jīng)各類模型處理,再反饋到數(shù)字或物理世界。

3. 商業(yè)落地邏輯

每一次技術(shù)革命都基于其核心特點(diǎn)找到切入點(diǎn):

PC互聯(lián)網(wǎng):核心是信息聯(lián)通與存儲(chǔ),從媒體、資訊、搜索起步,延伸至電商、在線娛樂。

移動(dòng)互聯(lián)網(wǎng):核心是基于位置的服務(wù)(LBS),從社交、O2O起步,發(fā)展出移動(dòng)支付、線上線下融合、萬物互聯(lián)。

AI大模型:核心是處理知識(shí)與內(nèi)容。當(dāng)前已從編程、創(chuàng)意等領(lǐng)域切入,正向著工作流優(yōu)化、產(chǎn)品形態(tài)創(chuàng)新發(fā)展,未來必將與各產(chǎn)業(yè)深度融合,并進(jìn)一步與物理世界結(jié)合。

競(jìng)爭判斷:對(duì)于絕大多數(shù)人和公司而言,機(jī)會(huì)在于應(yīng)用層的創(chuàng)新,而非投入巨大的基礎(chǔ)大模型研發(fā)。

四、社會(huì)影響與個(gè)人應(yīng)對(duì)

1. 對(duì)就業(yè)的潛在影響

技術(shù)革命總會(huì)重塑就業(yè)結(jié)構(gòu)。智能革命的特點(diǎn)是從自動(dòng)化走向智能化,從替代體力勞動(dòng)轉(zhuǎn)向替代需要經(jīng)驗(yàn)和判斷的認(rèn)知?jiǎng)趧?dòng)。一些崗位已受到影響:

明顯影響:電話客服、基礎(chǔ)程序員、風(fēng)控專員、線上運(yùn)營、卡車司機(jī)、演員等。

2. AGI(通用人工智能)面臨的約束

盡管發(fā)展迅速,但AGI的實(shí)現(xiàn)仍面臨多重硬約束,這為我們留下了應(yīng)對(duì)時(shí)間:

  • 模型規(guī)模:當(dāng)前頂級(jí)大模型參數(shù)在萬億級(jí)別,而人腦神經(jīng)連接規(guī)模在百萬億到千萬億級(jí),仍有數(shù)量級(jí)差距。
  • 能源供應(yīng):AI算力消耗巨大,能源基礎(chǔ)設(shè)施建設(shè)(如核電站需十幾年周期)是長期瓶頸。
  • 芯片性能:需持續(xù)提升算力、產(chǎn)能,并大幅降低能耗(當(dāng)前AI芯片能耗遠(yuǎn)高于人腦)。
  • 傳感器與具身智能:要實(shí)現(xiàn)AGI,需從環(huán)境持續(xù)學(xué)習(xí),這依賴更微型、多樣的傳感器(MEMS技術(shù)),以及與物理世界安全、靈活交互的軀體,這些都需要時(shí)間發(fā)展。

3. 個(gè)人的策略與選擇

賽道選擇

  • 基礎(chǔ)模型:僅極少數(shù)公司有能力涉足。
  • 行業(yè)模型:對(duì)多數(shù)公司而言,微調(diào)大模型的成本和門檻也很高。
  • 應(yīng)用開發(fā):這是最廣闊的天地。基于現(xiàn)有大模型,結(jié)合行業(yè)專家知識(shí),開發(fā)解決實(shí)際問題的應(yīng)用,是主流方向。

核心建議:深化與真實(shí)世界的鏈接

我們對(duì)真實(shí)世界的認(rèn)知本就有限,而能被數(shù)字化、用于訓(xùn)練AI的知識(shí)則更少。因此,人的核心優(yōu)勢(shì)在于身處真實(shí)世界。我們應(yīng)更深入行業(yè),更理解人性,在實(shí)際場(chǎng)景中發(fā)現(xiàn)問題、創(chuàng)造價(jià)值,這將是人類區(qū)別于和領(lǐng)先于AI的關(guān)鍵所在。

本文由人人都是產(chǎn)品經(jīng)理作者【markzou】,微信公眾號(hào):【markzou的筆記】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!