伯克利輟學生、部隊志愿者、中東背包客,三位“00后”華人做出世界首個“對話式視頻”

0 評論 1207 瀏覽 0 收藏 14 分鐘

00 后名校精英團隊打造全球首個對話式視頻平臺 Skylow,以 AI 實時互動、記憶適配打破視頻單向傳播壁壘,率先落地伯克利 CS61A 課程。低創(chuàng)作者門檻 + 教育場景破局,讓用戶可隨時提問、個性化學習,重構(gòu)人機視頻交互邏輯,開啟內(nèi)容新形態(tài)。

AI正在重塑著人機交互體驗,視頻也不例外。

如今,越來越多的人習慣從視頻中獲取信息、學習知識,不過,這一模式都是“單向的”,且基于視頻創(chuàng)作者的邏輯差異和觀眾理解深淺的不一,二者之間往往會形成一道“溝壑”。目前能使其建立聯(lián)系的途徑,大多仍局限于視頻評論、私信等文字上的交流。

若能借助AI,讓人們觀看視頻時可隨時與之進行交互對話,便能有效解決這一問題。例如,不理解某句話時,可以讓視頻換種方式解釋或舉例說明;不同意其中的某些觀點時,能夠直接語音打斷、展開“辯論”;覺得視頻過長時,也可以讓其快速總結(jié)核心內(nèi)容等。

基于這樣的構(gòu)想,三位懷揣著夢想、優(yōu)秀而又叛逆的“00后”走到了一起,推出了“世界首個對話式視頻平臺”——Skylow。

與一般的合伙創(chuàng)業(yè)不同,這三個人能聚在一起,除了擁有共同的創(chuàng)業(yè)目標外,更源于各自人生歷程中那份獨特的精彩,甚至可以用傳奇、自我與個性來形容,這也讓他們之間在精神上形成了更深的“靈魂共鳴”。

創(chuàng)始人兼CEO Henry Song,高中時期曾因病瀕臨死亡,經(jīng)歷兩周昏迷后重生,從此變得無所畏懼,后來更毅然從加州大學伯克利分校計算機專業(yè)輟學去創(chuàng)業(yè);

聯(lián)合創(chuàng)始人兼CTO King Han,高中時是常年年級第一的“學霸”,卻曾翹課獨自前往中亞附近的駐地部隊,進行為期一個月的志愿服務(wù),與士兵一同站崗。且作為Henry的大學校友,他大二在微軟實習期間,獨立開發(fā)了Excel AI的原型,并發(fā)表過多個頂會論文。

另一位聯(lián)合創(chuàng)始人David Meng,本碩均畢業(yè)于劍橋大學數(shù)學系,畢業(yè)后僅背著一個背包,通過借宿搭車,在中東獨自旅行了三個月。

(Skylow創(chuàng)始團隊,左:Henry Song,中:King Han,右:David Meng)

這三位有著名校背景、高學歷的技術(shù)精英,不僅打破了人們對“IT技術(shù)男”的刻板印象,更以他們自己的方式,開創(chuàng)了AI在視頻場景中的一大全新賽道。

獲學界背書,視頻從此“有問必答”

一個新的視頻平臺在剛剛起步,缺乏流量的階段,往往難以吸引創(chuàng)作者入駐。這是行業(yè)普遍面臨的冷啟動難題,Skylow也不例外。

然而,Skylow并未像傳統(tǒng)平臺那樣,在初期就尋求與KOL合作以實現(xiàn)快速引流,而是將重點放在了與“互動對話”功能更契合、傳播效率更高、同時也更具社會價值的教育領(lǐng)域,這一方向也很快獲得了伯克利教授們的支持。

目前,伯克利“CS 61A課程”(全球公認的高質(zhì)量計算機入門課)已入駐Skylow,并被轉(zhuǎn)化為“可對話”的視頻內(nèi)容。課程不僅詳細講解了函數(shù)、編程等基礎(chǔ)知識,學習者在遇到不理解的部分時,還可以發(fā)散思維,直接與視頻對話,要求它以更通俗的方式解釋術(shù)語,甚至可以讓其生成測驗題目,以檢驗自己的學習效果。

在這樣的教育場景下,將普通的單向觀看視頻轉(zhuǎn)化為可交互對話的視頻,對于創(chuàng)作者來說有哪些門檻?對于學習者來說,可提問的邊界又在哪里?Skylow在二者之間又做了哪些事情呢?

這些問題從Skylow的技術(shù)邏輯、內(nèi)容處理到AI使用的閉環(huán)中,或許可以找到答案。

“首先,創(chuàng)作者會給到Skylow一些素材,而這些素材不一定都是視頻,也可以是教學PPT、PDF文件等等,通過AI將這些素材進行預(yù)處理和分析,形成一個資料庫,再用更小的模型,在資料庫中檢索信息,實現(xiàn)實時問答。由此也降低了創(chuàng)作者進入平臺的門檻,他們不用花更多精力在視頻制作上,而是可以交給AI來處理?!盞ing Han向我們解釋了平臺的技術(shù)及設(shè)計邏輯。

通俗來說,可以將Skylow想象成一個嵌入視頻中的ChatGPT,觀眾可以隨時提問各種問題,而這些問題并不一定是與視頻完全相關(guān)的,還可以是天馬行空的。例如對教授的個人經(jīng)歷感興趣,也可以隨時提問,系統(tǒng)會基于對教授社交媒體等相關(guān)信息的檢索,進而給出相應(yīng)回答。

這一過程就涉及到了AI邊界的問題,David Meng表示,在視頻預(yù)處理階段,創(chuàng)作者可以設(shè)定一些指令,比如AI角色的設(shè)定是幽默風趣的,還是嚴肅認真的,可以回答什么問題,不可以回答什么問題等等。

在回答提問時,AI就會代入這些設(shè)定好的指令,去進行相應(yīng)的“人物模擬”。能力上來說,AI是可以回答任何問題的,但具體如何回答視頻內(nèi)容之外的問題,還要看創(chuàng)作者最初給予AI的“人設(shè)”指令是怎樣的。

從陌生到默契,AI有“記”可循

“傳統(tǒng)的視頻是一個靜態(tài)的,按照計算機概念中的數(shù)據(jù)結(jié)構(gòu)來說,它是線性的,沿著一條線沒有任何變化?!盚enry Song表示,而對話式視頻則能將這條固定的線,轉(zhuǎn)化為無數(shù)個分支。它并非按照創(chuàng)作者的設(shè)定,從開頭到結(jié)尾一成不變,而是能隨著觀眾的行為而產(chǎn)生變化。

同時,AI具備記憶能力,在Skylow平臺上,隨著對話互動次數(shù)的增加,AI的記憶會不斷累積。且在后續(xù)每一次與視頻的交互中,系統(tǒng)都會基于先前的記憶進行適應(yīng)性調(diào)整,輸出的回答也將更貼合用戶的實際需求。

比如,AI會記得用戶是哪個國家的人,習慣用什么語言,后續(xù)就會直接翻譯成對應(yīng)語言;AI還能記得用戶喜歡聽通俗易懂的舉例,它就會在解釋某些專業(yè)術(shù)語的時候增加更多便于理解的例子。

基于這一記憶機制,Skylow評價視頻成功與否的關(guān)鍵指標,除了傳統(tǒng)的觀看時長外,還包括互動對話次數(shù)、AI積累的記憶量等。

雖然AI會通過對話內(nèi)容不斷累積記憶,但相關(guān)內(nèi)容并不會被用于模型訓(xùn)練,而是主要用于優(yōu)化用戶體驗,因此不涉及隱私安全問題。

就用戶體驗而言,響應(yīng)速度也是十分關(guān)鍵的一點。為此,Skylow在模型選擇上并未采用類似DeepSeek這類推理模型,而是選用了一些響應(yīng)更快、能夠即時生成回答的模型。除了某些特定任務(wù),如需繪制圖表來解釋問題,可能需要短暫處理時間,大部分回答都不需要用戶長時間等待。

以教育為起點,以互動為核心

單從形式上看,Skylow可以看作是類似于YouTube和ChatGPT的結(jié)合體,但二者想要更好地融合,還是需要一個獨立的平臺,也就是互動視頻平臺,才能真正解決傳統(tǒng)單向觀看視頻的痛點。Henry Song認為,這也代表了未來視頻平臺的一大發(fā)展趨勢。

內(nèi)容策略上,Skylow一方面專注于已跑通的教育領(lǐng)域,除了團隊的背景資源優(yōu)勢外,也因教育場景下的文本密集度極高。當前,大語言模型對文本的理解要優(yōu)于視頻,因此團隊會主動邀請一些教育者入駐平臺。這些教育者中,許多人并非追求流量,而是希望提升內(nèi)容質(zhì)量。在這一點上,Skylow 與教育者形成了相輔相成的關(guān)系。

另一方面,Skylow正在逐步推進以內(nèi)容效果驅(qū)動用戶增長,吸引更多其他領(lǐng)域的創(chuàng)作者加入。但對創(chuàng)作者來說,這是一種全新的創(chuàng)作模式,涉及AI設(shè)定、內(nèi)容互動等環(huán)節(jié),因此也需通過實際效果逐步提升他們對新模式的接受度。

在這樣的內(nèi)容策略下,Skylow在商業(yè)模式上也展開了進一步的探索。從創(chuàng)作者層面來說,對話交互過程中會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)對于創(chuàng)作者來說是至關(guān)重要的,可以幫助其在后續(xù)創(chuàng)作更好的內(nèi)容。數(shù)據(jù),就是一個可變現(xiàn)的點。另外就是在素材方面,比如PDF素材就會需要一定的AI分析和預(yù)處理,這一過程也是可變現(xiàn)的。

另一個商業(yè)方向則是視頻廣告。傳統(tǒng)視頻中的廣告常常引起用戶反感,甚至有人為避免廣告而開通會員。而Skylow則能將枯燥的廣告轉(zhuǎn)變?yōu)橛腥さ幕樱纬梢环N全新的廣告形態(tài)。例如,用戶可以向廣告表示“最近想學編程”,廣告便會推薦相關(guān)學習網(wǎng)站。這種方式不僅不易引起反感,還能提升效率,具有實際使用價值。

未來,Skylow期望從教育場景延伸至播客、體育賽事等泛娛樂領(lǐng)域。而團隊的目標更為長遠:他們更希望構(gòu)建的不只是視頻,更是以“AI交互”為核心的多元化內(nèi)容形態(tài)。

“目前團隊已開發(fā)出一款可邊寫代碼邊與AI交互的應(yīng)用,日后若能將VR與這類AI系統(tǒng)實現(xiàn)交互,體驗可能會更加豐富?!盚enry Song表示。

寫在最后

從單向觀看到雙向?qū)υ?,交互式視頻正開啟一個新的內(nèi)容時代。三位年輕人的創(chuàng)業(yè)故事仍在繼續(xù),他們能否將在教育領(lǐng)域驗證的模式拓展至更多場景,將AI交互邏輯融入更多行業(yè),這需要時間和市場給出答案。但可以確定的是,當技術(shù)開始真正理解人類,人機“對話”才真正開始。

撰文:子墨,火狐貍

本文由人人都是產(chǎn)品經(jīng)理作者【揚帆出?!?,微信公眾號:【揚帆出海】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!