伯克利輟學生、部隊志愿者、中東背包客，三位“00后”華人做出世界首個“對話式視頻”

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

伯克利輟學生、部隊志愿者、中東背包客，三位“00后”華人做出世界首個“對話式視頻”

揚帆出海

2025-12-14

0 評論 1207 瀏覽 0 收藏

14 分鐘

00 后名校精英團隊打造全球首個對話式視頻平臺 Skylow，以 AI 實時互動、記憶適配打破視頻單向傳播壁壘，率先落地伯克利 CS61A 課程。低創(chuàng)作者門檻 + 教育場景破局，讓用戶可隨時提問、個性化學習，重構(gòu)人機視頻交互邏輯，開啟內(nèi)容新形態(tài)。

AI正在重塑著人機交互體驗，視頻也不例外。

如今，越來越多的人習慣從視頻中獲取信息、學習知識，不過，這一模式都是“單向的”，且基于視頻創(chuàng)作者的邏輯差異和觀眾理解深淺的不一，二者之間往往會形成一道“溝壑”。目前能使其建立聯(lián)系的途徑，大多仍局限于視頻評論、私信等文字上的交流。

若能借助AI，讓人們觀看視頻時可隨時與之進行交互對話，便能有效解決這一問題。例如，不理解某句話時，可以讓視頻換種方式解釋或舉例說明；不同意其中的某些觀點時，能夠直接語音打斷、展開“辯論”；覺得視頻過長時，也可以讓其快速總結(jié)核心內(nèi)容等。

基于這樣的構(gòu)想，三位懷揣著夢想、優(yōu)秀而又叛逆的“00后”走到了一起，推出了“世界首個對話式視頻平臺”——Skylow。

與一般的合伙創(chuàng)業(yè)不同，這三個人能聚在一起，除了擁有共同的創(chuàng)業(yè)目標外，更源于各自人生歷程中那份獨特的精彩，甚至可以用傳奇、自我與個性來形容，這也讓他們之間在精神上形成了更深的“靈魂共鳴”。

創(chuàng)始人兼CEO Henry Song，高中時期曾因病瀕臨死亡，經(jīng)歷兩周昏迷后重生，從此變得無所畏懼，后來更毅然從加州大學伯克利分校計算機專業(yè)輟學去創(chuàng)業(yè)；

聯(lián)合創(chuàng)始人兼CTO King Han，高中時是常年年級第一的“學霸”，卻曾翹課獨自前往中亞附近的駐地部隊，進行為期一個月的志愿服務(wù)，與士兵一同站崗。且作為Henry的大學校友，他大二在微軟實習期間，獨立開發(fā)了Excel AI的原型，并發(fā)表過多個頂會論文。

另一位聯(lián)合創(chuàng)始人David Meng，本碩均畢業(yè)于劍橋大學數(shù)學系，畢業(yè)后僅背著一個背包，通過借宿搭車，在中東獨自旅行了三個月。

（Skylow創(chuàng)始團隊，左：Henry Song，中：King Han，右：David Meng）

這三位有著名校背景、高學歷的技術(shù)精英，不僅打破了人們對“IT技術(shù)男”的刻板印象，更以他們自己的方式，開創(chuàng)了AI在視頻場景中的一大全新賽道。

獲學界背書，視頻從此“有問必答”

一個新的視頻平臺在剛剛起步，缺乏流量的階段，往往難以吸引創(chuàng)作者入駐。這是行業(yè)普遍面臨的冷啟動難題，Skylow也不例外。

然而，Skylow并未像傳統(tǒng)平臺那樣，在初期就尋求與KOL合作以實現(xiàn)快速引流，而是將重點放在了與“互動對話”功能更契合、傳播效率更高、同時也更具社會價值的教育領(lǐng)域，這一方向也很快獲得了伯克利教授們的支持。

目前，伯克利“CS 61A課程”（全球公認的高質(zhì)量計算機入門課）已入駐Skylow，并被轉(zhuǎn)化為“可對話”的視頻內(nèi)容。課程不僅詳細講解了函數(shù)、編程等基礎(chǔ)知識，學習者在遇到不理解的部分時，還可以發(fā)散思維，直接與視頻對話，要求它以更通俗的方式解釋術(shù)語，甚至可以讓其生成測驗題目，以檢驗自己的學習效果。

在這樣的教育場景下，將普通的單向觀看視頻轉(zhuǎn)化為可交互對話的視頻，對于創(chuàng)作者來說有哪些門檻？對于學習者來說，可提問的邊界又在哪里？Skylow在二者之間又做了哪些事情呢？

這些問題從Skylow的技術(shù)邏輯、內(nèi)容處理到AI使用的閉環(huán)中，或許可以找到答案。

“首先，創(chuàng)作者會給到Skylow一些素材，而這些素材不一定都是視頻，也可以是教學PPT、PDF文件等等，通過AI將這些素材進行預(yù)處理和分析，形成一個資料庫，再用更小的模型，在資料庫中檢索信息，實現(xiàn)實時問答。由此也降低了創(chuàng)作者進入平臺的門檻，他們不用花更多精力在視頻制作上，而是可以交給AI來處理?！盞ing Han向我們解釋了平臺的技術(shù)及設(shè)計邏輯。

通俗來說，可以將Skylow想象成一個嵌入視頻中的ChatGPT，觀眾可以隨時提問各種問題，而這些問題并不一定是與視頻完全相關(guān)的，還可以是天馬行空的。例如對教授的個人經(jīng)歷感興趣，也可以隨時提問，系統(tǒng)會基于對教授社交媒體等相關(guān)信息的檢索，進而給出相應(yīng)回答。

這一過程就涉及到了AI邊界的問題，David Meng表示，在視頻預(yù)處理階段，創(chuàng)作者可以設(shè)定一些指令，比如AI角色的設(shè)定是幽默風趣的，還是嚴肅認真的，可以回答什么問題，不可以回答什么問題等等。

在回答提問時，AI就會代入這些設(shè)定好的指令，去進行相應(yīng)的“人物模擬”。能力上來說，AI是可以回答任何問題的，但具體如何回答視頻內(nèi)容之外的問題，還要看創(chuàng)作者最初給予AI的“人設(shè)”指令是怎樣的。

從陌生到默契，AI有“記”可循

“傳統(tǒng)的視頻是一個靜態(tài)的，按照計算機概念中的數(shù)據(jù)結(jié)構(gòu)來說，它是線性的，沿著一條線沒有任何變化?！盚enry Song表示，而對話式視頻則能將這條固定的線，轉(zhuǎn)化為無數(shù)個分支。它并非按照創(chuàng)作者的設(shè)定，從開頭到結(jié)尾一成不變，而是能隨著觀眾的行為而產(chǎn)生變化。

同時，AI具備記憶能力，在Skylow平臺上，隨著對話互動次數(shù)的增加，AI的記憶會不斷累積。且在后續(xù)每一次與視頻的交互中，系統(tǒng)都會基于先前的記憶進行適應(yīng)性調(diào)整，輸出的回答也將更貼合用戶的實際需求。

比如，AI會記得用戶是哪個國家的人，習慣用什么語言，后續(xù)就會直接翻譯成對應(yīng)語言；AI還能記得用戶喜歡聽通俗易懂的舉例，它就會在解釋某些專業(yè)術(shù)語的時候增加更多便于理解的例子。

基于這一記憶機制，Skylow評價視頻成功與否的關(guān)鍵指標，除了傳統(tǒng)的觀看時長外，還包括互動對話次數(shù)、AI積累的記憶量等。

雖然AI會通過對話內(nèi)容不斷累積記憶，但相關(guān)內(nèi)容并不會被用于模型訓(xùn)練，而是主要用于優(yōu)化用戶體驗，因此不涉及隱私安全問題。

就用戶體驗而言，響應(yīng)速度也是十分關(guān)鍵的一點。為此，Skylow在模型選擇上并未采用類似DeepSeek這類推理模型，而是選用了一些響應(yīng)更快、能夠即時生成回答的模型。除了某些特定任務(wù)，如需繪制圖表來解釋問題，可能需要短暫處理時間，大部分回答都不需要用戶長時間等待。

以教育為起點，以互動為核心

單從形式上看，Skylow可以看作是類似于YouTube和ChatGPT的結(jié)合體，但二者想要更好地融合，還是需要一個獨立的平臺，也就是互動視頻平臺，才能真正解決傳統(tǒng)單向觀看視頻的痛點。Henry Song認為，這也代表了未來視頻平臺的一大發(fā)展趨勢。

內(nèi)容策略上，Skylow一方面專注于已跑通的教育領(lǐng)域，除了團隊的背景資源優(yōu)勢外，也因教育場景下的文本密集度極高。當前，大語言模型對文本的理解要優(yōu)于視頻，因此團隊會主動邀請一些教育者入駐平臺。這些教育者中，許多人并非追求流量，而是希望提升內(nèi)容質(zhì)量。在這一點上，Skylow 與教育者形成了相輔相成的關(guān)系。

另一方面，Skylow正在逐步推進以內(nèi)容效果驅(qū)動用戶增長，吸引更多其他領(lǐng)域的創(chuàng)作者加入。但對創(chuàng)作者來說，這是一種全新的創(chuàng)作模式，涉及AI設(shè)定、內(nèi)容互動等環(huán)節(jié)，因此也需通過實際效果逐步提升他們對新模式的接受度。

在這樣的內(nèi)容策略下，Skylow在商業(yè)模式上也展開了進一步的探索。從創(chuàng)作者層面來說，對話交互過程中會產(chǎn)生大量的數(shù)據(jù)，這些數(shù)據(jù)對于創(chuàng)作者來說是至關(guān)重要的，可以幫助其在后續(xù)創(chuàng)作更好的內(nèi)容。數(shù)據(jù)，就是一個可變現(xiàn)的點。另外就是在素材方面，比如PDF素材就會需要一定的AI分析和預(yù)處理，這一過程也是可變現(xiàn)的。

另一個商業(yè)方向則是視頻廣告。傳統(tǒng)視頻中的廣告常常引起用戶反感，甚至有人為避免廣告而開通會員。而Skylow則能將枯燥的廣告轉(zhuǎn)變?yōu)橛腥さ幕樱纬梢环N全新的廣告形態(tài)。例如，用戶可以向廣告表示“最近想學編程”，廣告便會推薦相關(guān)學習網(wǎng)站。這種方式不僅不易引起反感，還能提升效率，具有實際使用價值。

未來，Skylow期望從教育場景延伸至播客、體育賽事等泛娛樂領(lǐng)域。而團隊的目標更為長遠：他們更希望構(gòu)建的不只是視頻，更是以“AI交互”為核心的多元化內(nèi)容形態(tài)。

“目前團隊已開發(fā)出一款可邊寫代碼邊與AI交互的應(yīng)用，日后若能將VR與這類AI系統(tǒng)實現(xiàn)交互，體驗可能會更加豐富?！盚enry Song表示。

寫在最后

從單向觀看到雙向?qū)υ?，交互式視頻正開啟一個新的內(nèi)容時代。三位年輕人的創(chuàng)業(yè)故事仍在繼續(xù)，他們能否將在教育領(lǐng)域驗證的模式拓展至更多場景，將AI交互邏輯融入更多行業(yè)，這需要時間和市場給出答案。但可以確定的是，當技術(shù)開始真正理解人類，人機“對話”才真正開始。

撰文：子墨，火狐貍

本文由人人都是產(chǎn)品經(jīng)理作者【揚帆出?！?，微信公眾號：【揚帆出海】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App