AI,個(gè)人隨筆 十分鐘讀懂RAG 大語(yǔ)言模型雖強(qiáng),卻面臨幻覺、知識(shí)截止和上下文限制三大痛點(diǎn)。RAG技術(shù)應(yīng)運(yùn)而生,讓AI能夠'帶書考試',通過分片、索引、召回和生成四步精準(zhǔn)解決問題。本文將深入解析RAG的工作原理、應(yīng)用場(chǎng)景與局限,助你掌握這套AI工程體系的核心邏輯。 諸葛鐵鐵 AI應(yīng)用RAG向量計(jì)算
AI,個(gè)人隨筆 OpenAI正開發(fā)大語(yǔ)言模型“Garlic” 當(dāng) Google 的 Gemini 3 在各大榜單 "碾壓"GPT-5.1 時(shí),OpenAI 果斷按下所有商業(yè)化項(xiàng)目暫停鍵,將 "大力出奇跡" 的 "紅蔥頭"(Shallotpeat) 方案徹底埋葬,轉(zhuǎn)而押注更皮實(shí)、更高效的 "大蒜" 路線 ——從 "什么都懂" 的虛胖型全能選手,轉(zhuǎn)型為精通代碼和邏輯推理的 "專家型" 武器。 王智遠(yuǎn) OpenAI大語(yǔ)言模型行業(yè)動(dòng)態(tài)
AI 閉源越跑越快之后,DeepSeek V3.2 如何為開源模型殺出一條新路 當(dāng)閉源模型加速領(lǐng)跑,開源陣營(yíng)如何突圍?DeepSeek V3.2 以稀疏注意力架構(gòu)、超10%后訓(xùn)練算力投入和大規(guī)模Agent合成數(shù)據(jù),在成本壓縮的同時(shí)逼近GPT-5級(jí)推理能力,為開源生態(tài)開辟了一條技術(shù)驅(qū)動(dòng)的新路徑。 深思 SenseAI DeepSeek大語(yǔ)言模型開源生態(tài)
AI,個(gè)人隨筆 互聯(lián)網(wǎng)AI進(jìn)化論:Transformer到智能體的躍遷 AI技術(shù)的演進(jìn)正在重新定義互聯(lián)網(wǎng)生態(tài)。從Transformer架構(gòu)到智能體,AI如何在搜索、內(nèi)容生成、客服、代碼開發(fā)和智能決策等領(lǐng)域重塑我們的數(shù)字生活?本文深入探討AI技術(shù)如何推動(dòng)互聯(lián)網(wǎng)行業(yè)的變革。 漫說AI行業(yè) AI技術(shù)Transformer大語(yǔ)言模型
AI AI 訓(xùn)練師入職必備的大模型訓(xùn)練流程,新手也能看懂 你知道ChatGPT背后到底經(jīng)歷了哪些訓(xùn)練流程嗎?AI訓(xùn)練師在其中扮演了什么角色?本篇文章用最接地氣的方式,拆解大模型訓(xùn)練的三大階段,帶你看懂那些“看不見的幕后工程”。新手也能讀懂,老手也能復(fù)盤——這是一份真正實(shí)用的訓(xùn)練流程全景圖。 小五- AI訓(xùn)練師業(yè)務(wù)流程大模型
AI,個(gè)人隨筆 大語(yǔ)言模型產(chǎn)品經(jīng)理必知:研發(fā)過程中不可或缺的三大核心要素 在大語(yǔ)言模型產(chǎn)品的研發(fā)過程中,技術(shù)突破只是起點(diǎn),真正決定產(chǎn)品成敗的,是對(duì)“能力邊界”“交互機(jī)制”“落地路徑”的系統(tǒng)把握。本文將從這三大核心要素出發(fā),幫助產(chǎn)品經(jīng)理構(gòu)建面向未來的認(rèn)知框架與協(xié)作模型。 而立與拾遺 AI產(chǎn)品經(jīng)理基礎(chǔ)知識(shí)大語(yǔ)言模型
AI 多模態(tài)文生圖 / 文生視頻模型:應(yīng)用、訓(xùn)練與規(guī)則維度全景解析 文生圖、文生視頻模型不只是“生成能力”的升級(jí),更是“表達(dá)機(jī)制”的系統(tǒng)躍遷。本文系統(tǒng)梳理多模態(tài)模型在應(yīng)用、訓(xùn)練與規(guī)則維度的全景路徑,幫助產(chǎn)品人理解如何在“能力邊界”與“合規(guī)表達(dá)”之間構(gòu)建新的認(rèn)知閉環(huán),實(shí)現(xiàn)從“能生成”到“能落地”的躍遷。 Xyu 多模態(tài)大語(yǔ)言模型技術(shù)原理
AI,個(gè)人隨筆 “大語(yǔ)言模型是死路一條“ 人工智能領(lǐng)域,大語(yǔ)言模型(LLMs)一直是研究和應(yīng)用的熱點(diǎn)。然而,2024年圖靈獎(jiǎng)得主、強(qiáng)化學(xué)習(xí)之父理查德·薩頓(Richard Sutton)卻提出了一個(gè)驚人的觀點(diǎn):“大語(yǔ)言模型是死路一條”。這一觀點(diǎn)在技術(shù)界引發(fā)了廣泛的討論和反思。 微果醬 個(gè)人觀點(diǎn)發(fā)展趨勢(shì)大語(yǔ)言模型
個(gè)人隨筆 ALL About AI 系列(五):智能體(Agent) 從自動(dòng)寫代碼、做財(cái)報(bào),到幫運(yùn)營(yíng)發(fā)郵件、做客服,Agent 正在把 AI 能力拆解成可執(zhí)行、可編排、可商業(yè)化的“數(shù)字員工”。但 Agent 到底怎么“想”、怎么“動(dòng)”、怎么“記住”?Function Calling、MCP、多智能體協(xié)同,這些技術(shù)路線誰(shuí)更適合你的業(yè)務(wù)?本篇用 1 張架構(gòu)圖、3 個(gè)實(shí)戰(zhàn)案例、5 段核心代碼,帶你從零看懂智能體的底層邏輯、能力邊界與落地路徑,讓 AI 真正為你打工。 大波子 Agent基礎(chǔ)知識(shí)大語(yǔ)言模型
AI,個(gè)人隨筆 ALL About AI 系列(六):多智能體 當(dāng)單個(gè)大模型開始“卷”不出新花樣,硅谷把目光投向“多智能體”——讓一群AI像公司一樣分工:產(chǎn)品經(jīng)理寫需求、架構(gòu)師出方案、程序員敲代碼、測(cè)試員找Bug,24小時(shí)自我迭代。實(shí)測(cè)把4個(gè)Agent關(guān)進(jìn)同一頻道,3晚跑出1個(gè)完整SaaS原型,成本只要15美元。本篇文章帶你拆解多智能體的底層協(xié)議、通信機(jī)制與3個(gè)主流框架,外加1份可復(fù)制的“虛擬團(tuán)隊(duì)”Prompt模板,讓你立刻把AI從“聊天框”升級(jí)成“數(shù)字員工”。 大波子 A2A協(xié)議基礎(chǔ)知識(shí)大語(yǔ)言模型
個(gè)人隨筆 ALL About AI 系列(三):RAG:檢索增強(qiáng)生成 在人工智能領(lǐng)域,大語(yǔ)言模型(LLM)雖然功能強(qiáng)大,但仍然存在知識(shí)更新困難和幻覺問題。為了解決這些問題,RAG(Retrieval Augmented Generation,檢索增強(qiáng)生成)框架應(yīng)運(yùn)而生。 大波子 RAG基礎(chǔ)知識(shí)大語(yǔ)言模型
AI,個(gè)人隨筆 ALL About AI 系列(一):大語(yǔ)言模型基礎(chǔ) 在人工智能領(lǐng)域,大語(yǔ)言模型已經(jīng)成為了一個(gè)熱門話題。從GPT到各種多模態(tài)模型,這些強(qiáng)大的工具正在改變我們的工作和生活方式。這篇文章將帶你深入了解大語(yǔ)言模型的基礎(chǔ)原理、核心能力以及潛在風(fēng)險(xiǎn)。 大波子 基礎(chǔ)知識(shí)大語(yǔ)言模型行業(yè)觀察