2025年距離HER變成現(xiàn)實,還有多久?

0 評論 666 瀏覽 1 收藏 9 分鐘

你以為AI Agent只是效率工具?它正在變得更像“人”。本文通過對Agent技術(shù)的拆解,分析其在感知、理解、表達等方面的演進趨勢,并提出產(chǎn)品人在設(shè)計AI產(chǎn)品時應(yīng)關(guān)注的關(guān)鍵維度。

今天來聊聊怎么做好AI聊天這個基礎(chǔ)簡單的功能,以及背后的架構(gòu)是怎樣的。說直白點,怎樣實現(xiàn)一個HER里的薩曼莎,而不是做成一個語音的問答機器人。

現(xiàn)在所有的AI聊天模型都有這個問題,就是用戶在沒有問題想問的時候,是不會想起來主動來找AI的,因為AI缺少“主動性”。對我來說,聊天是雙方消費信息的過程,我跟AI聊天,它永遠不能給出一個我意料之外的話題。這是最根本的問題。

我為什么想要刷視頻?因為我雖然有自己偏好的領(lǐng)域,但是我并不能提前知道我會看到什么樣的內(nèi)容,現(xiàn)在推薦算法提供給我的信息是“新”的,是我預(yù)料不到的。

如果現(xiàn)在的抖音還需要我提前說一句“我想看羅翔最近有啥新動態(tài)”,使用門檻就太高了,但現(xiàn)在的AI聊天就類似有一個這樣的門檻。

如何做一個更主動的聊天功能

上面大概解釋了一下為什么要讓AI更具有主動性,那現(xiàn)在拆解一下怎么實現(xiàn)。

首先從產(chǎn)品的角度來拆,就是如何用AI來復(fù)刻用戶和真實朋友之間的對話,這個話題乍一想很復(fù)雜,因為你不可能窮舉所有聊天的話題和場景。但是從用戶視角來看,無論是跟誰對話,無非分成三步:開始對話、聊某一個話題、結(jié)束對話。我們依次來分析。

第一步,發(fā)起對話

指從零開始打一通電話(忘記說了,既然是HER,我們聚焦于一個AI角色跟你語音進行聊天的場景)。以往這個動作都是由用戶完成的,但是未來必定更多是AI主動發(fā)起的。

AI發(fā)起對話的動機有兩類,一是消息通知,類似app的彈窗,另一類就是AI角色自己有找你的動機。前者非常簡單,后者非常難。

難不在于實現(xiàn),而在于真正把體驗做好,哪怕是真人主動找你聊天,太頻繁會讓人心煩、話題太瑣碎會讓人覺得你大題小做、話題太無聊會讓人毫無興趣??傊鲃影l(fā)起語音的對話,相比彈窗要更謹(jǐn)慎,因為聽覺的迫聽性,對于用戶的打擾非常大。只要發(fā)起的話題不對,就會適得其反,讓用戶極其厭煩。

第二步,聊好一個話題

假設(shè)AI成功的從海量信息中找到了一個用戶感興趣、愿意花幾分鐘跟你聊一會的話題,如何把這個話題聊好,也是非常難的。比如話術(shù),AI的話術(shù)至今仍然沒有變得特別口語化,這個問題是因為缺少數(shù)據(jù),缺少語音聊天的、口語化的數(shù)據(jù),因為AI模型本質(zhì)就是數(shù)據(jù)。

另一個大模塊是記憶,記憶是跟用戶聊好一個話題的重要基礎(chǔ)。這個記憶的范圍非常廣,但是簡單說就是讓AI知道,它在跟“誰”說話。假如選了一個話題《黑神話:鐘馗》,對面的人是喜歡游戲還是無感?是否知道游科和馮驥?是否之前聊過?是否甚至是游科的一員?

上面每一個分類的不同,都可能導(dǎo)致分享這些信息時,策略完全不同,或者語氣也完全不同。

對于話題的內(nèi)容,還有一個點在于AI能否主動提供新信息?,F(xiàn)在哪怕跟豆包聊天,也有一個最大的硬傷(在我看來),就是你很難從她那里知道一些你意想不到的信息,但這一點是真人聊天最重要的部分,即互相的信息消費。

比如我跟朋友聊周杰倫,他可能隨口聯(lián)想到周杰倫最近發(fā)了新歌,但我完全不知道,于是我繼而聯(lián)想到最近另一個明星也發(fā)了新歌,朋友剛好也不知道。

這個過程就能看到,對話的過程是一個線狀的、由聯(lián)想串起來的,而這是目前AI缺少的?,F(xiàn)在的AI更像是一個語音版的搜索引擎,它很難提供給我“聯(lián)想”,我基本每次和豆包聊天前,都能預(yù)想到整個對話的大概走向,從來沒有哪一次聊天結(jié)束后,想的是“我咋跟一個AI聊到這去了”。

但是跟真人朋友,對話是很容易從“周杰倫”聊到美國最近的社會動蕩,過程甚至自然到雙方都感知不到。

第三步,結(jié)束對話

如何把話題聊好,其實還有很多方面的細(xì)節(jié),還是先繼續(xù)聊完整個流程吧。對話的結(jié)束也很簡單,一個是用戶主動結(jié)束,另一個就是AI主動結(jié)束,后者其實仔細(xì)一想,是非常有趣的,甚至很大程度能塑造AI人格的方式。

比如AI能否看到現(xiàn)在時間晚了,主動讓我別熬夜了,去睡覺吧。甚至能否說“我今天心情也有點差,先不跟你聊了”,讓AI也偶爾耍耍小脾氣?

情感構(gòu)建的一些深入思考

其實深入想為什么要做AI的聊天,甚至為什么要給AI做一個人格出來,當(dāng)一個AI有了人格,就能讓用戶更愿意表達自身了嗎?

很多人一直以來認(rèn)為AI聊天不可替代,是因為AI永遠不會像真人一樣“批判”你,你跟AI聊天心里是有預(yù)期的,知道自己可以說出任何事,而且對方都會非常耐心的善待自己,這種情緒價值是現(xiàn)實生活中真的沒有替代的。

但是另一個方向,正是這樣的設(shè)計,也讓AI越來越難擁有自己的人格,因為前面可以得知,用戶的目的是在于“輸出”,在于找個地方表達自己,然后獲得“輸入”,這個輸入最好是結(jié)合記憶的、善意的輸入。

之前gpt4o事件也體現(xiàn)出了用戶對AI記憶的重視程度。但是我個人也有個疑問,即用戶到底希望AI記住ta的什么?

會有一個現(xiàn)象:一個人打開一個AI窗口,故意跟AI說一些挑釁甚至惡意的話,抱有試探的心態(tài),這種話題通常不會跟一個真實的陌生人說,因為這樣會影響自己的“形象”。但是跟AI聊天的時候,似乎打開一個新的聊天窗口,就是一個新的自己了。

這一點是個雙刃劍,可以讓用戶沒有心里壓力、隨心所欲的說;但是否也會導(dǎo)致用戶不把AI當(dāng)一個“真人”,只在意AI的工具屬性。還是說,用戶根本不需要把AI當(dāng)做“有性格的人”或是“代碼塊”,用戶的本質(zhì)只是需要獲得個性化的情緒價值、需求滿足。

總之對話作為人與人之間互動的最最基礎(chǔ)的方式,背后有非常多的細(xì)節(jié)和思考方式,甚至最好還能有一些社科類的專家共同討論。

而目前豆包也好、gpt也好,距離一個HER里的薩曼莎,還有挺遠的距離。

不過也并不是說HER就是終極的正確答案了,因為AI也不應(yīng)該把“占據(jù)人們的時間和情緒”作為目的,反而應(yīng)該是讓用戶去回歸現(xiàn)實生活,哪怕是情緒價值,也應(yīng)該是AI引領(lǐng)著用戶一步步從現(xiàn)實生活中學(xué)著找到。

本文由 @大橙子 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!