ALL About AI 系列(三):RAG:檢索增強生成

0 評論 2038 瀏覽 0 收藏 6 分鐘

在人工智能領(lǐng)域,大語言模型(LLM)雖然功能強大,但仍然存在知識更新困難和幻覺問題。為了解決這些問題,RAG(Retrieval Augmented Generation,檢索增強生成)框架應(yīng)運而生。

RAG(Retrieval Augmented Generation,檢索增強生成)是一個將大語言模型(LLM)與來自外部知識源的檢索相結(jié)合的框架,以改進問答能力的工程框架。通俗來說就是給大語言模型外掛一個知識庫(通常是向量數(shù)據(jù)庫),使其獲得自身未能掌握的數(shù)據(jù)、知識。因此RAG基本解決了LLM知識更新困難以及幻覺問題。

RAG工程相較于微調(diào)大語言模型的成本會低很多,且目前隨著 RAG 工程的發(fā)展,其最終實現(xiàn)效果也很不錯。

RAG的實現(xiàn)流程

??第一個大步驟就是將文本數(shù)據(jù)處理并進行向量化轉(zhuǎn)化處理。這一步一般會用到?embedding 模型將文本塊轉(zhuǎn)化為向量并存儲到向量數(shù)據(jù)庫。

??第二個大步驟則是根據(jù)用戶輸入的問題,在向量數(shù)據(jù)庫中進行檢索臨近的文本塊,整合個大模型輸出最后的回復(fù)。

傳統(tǒng)的文件知識庫是用關(guān)鍵詞匹配檢索,而向量數(shù)據(jù)庫是用語義匹配檢索。

RAG的優(yōu)化

優(yōu)化其實就是針對RAG實現(xiàn)流程的各個節(jié)點進行優(yōu)化,其中可能有些名詞過于技術(shù),產(chǎn)品經(jīng)理做個了解即可,主要還是對可以優(yōu)化的方向有個整體認知。

優(yōu)化分塊(chunk)

1??選擇合適的分塊大小,并使用語義分塊等高級分塊策略,以確保檢索到的Chunk 包含完整的上下文信息。同時可以使用滑動窗口增加上下文信息。

2??有些時候文檔內(nèi)容會比較冗余,此時可以考慮對文檔進行總結(jié),減少冗余信息。

優(yōu)化embedding

1.挑選合適的 embedding 模型:檢索任務(wù)通常是判斷兩段內(nèi)容是否相關(guān),相似任務(wù)是判斷兩段內(nèi)容是否相似,相關(guān)的內(nèi)容不一定相似。

2.針對任務(wù)進行微調(diào):embedding 模型的訓(xùn)練預(yù)料和實際檢索的語料分布可能并不相同,此時在對應(yīng)語料上進行 finetuning 可以顯著提升檢索到的內(nèi)容的相關(guān)性。比如 OpenAI 也提供了代碼相關(guān)的 code embedding 模型。

3.Adapter:也有研究者引入Adapter,在提取 query embedding 后進一步讓 embedding 經(jīng)過 Adapter,以便實現(xiàn)與索引更好的對齊。

優(yōu)化提示詞(prompt)

設(shè)計清晰、明確的Prompt,指導(dǎo)LLM 更好地利用檢索到的上下文信息。同時要使用Prompt 工程技巧,詳情可以參考ALL About AI 系列(二):提示詞工程。

優(yōu)化Query

1.Query 改寫:對用戶輸入 query 進行修改或重寫,通常只調(diào)整 query 結(jié)構(gòu)、添加或刪除關(guān)鍵詞,或者通過近義詞替換來擴展檢索范圍。

2.Query 糾錯:通常是指嘗試修正用戶 query 中可能的拼寫或語法錯誤。

3.Query Clarification:通常是指修正或分解用戶 query 中不明確或模糊的內(nèi)容,使系統(tǒng)更好地理解并執(zhí)行相應(yīng)的檢索,有助于避免歧義。

優(yōu)化生成

1.使用更強大的LLM,提高生成能力。根據(jù)具體任務(wù),對LLM進行Finetune,提高生成效果。

2.使用合適的解碼策略,如Top-ksampling、Nucleus sampling等,避免生成重復(fù)、不連貫的內(nèi)容??刂粕砷L度,避免生成過于冗長的內(nèi)容。

以上就是 RAG 技術(shù)最基礎(chǔ)的內(nèi)容,隨著 RAG 技術(shù)的不斷發(fā)展,市面上也在有層出不窮的技術(shù),包括多模態(tài) RAG、graphRAG 等,當然實際使用時還是要根據(jù)具體業(yè)務(wù)選擇投入產(chǎn)出比最優(yōu)的技術(shù)路線。

本文由人人都是產(chǎn)品經(jīng)理作者【大波子】,微信公眾號:【波仔的雜貨鋪】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!