精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于大模型的群體智能解決方案

人工智能
目前最炙手可熱的大模型應(yīng)用應(yīng)該是 Agent,它是一個能夠自主完成目標(biāo)的智能體,具有規(guī)劃和執(zhí)行的能力。用車類比的話,大模型的推出相當(dāng)于汽車引擎的技術(shù)突破。而 Agent 就像一個整車,只有引擎是不夠的,還需要配骨架、座位、方向盤才能搭載人從一個地方駛向另外一個地方。

易慧智能成立時間不長,背后依托的是易車公司 20 多年來積累的客戶、數(shù)據(jù)以及行業(yè)經(jīng)驗。公司圍繞智能體以及群體智能方向于今年初與清華大學(xué)自然語言處理實驗室、面壁智能達(dá)成戰(zhàn)略合作,結(jié)合他們先進(jìn)的技術(shù)與易車的數(shù)據(jù)積累以及行業(yè) Know-How,推出了面向 ToB 端的基于大模型的汽車行業(yè)群體智能解決方案以及相應(yīng)的技術(shù)白皮書,白皮書中對于群體智能的整體方案有比較詳細(xì)的解讀。

一、群體智能解決方案概覽

1. LLM 與 Agent

圖片

群體智能,與其緊密相關(guān)的兩大模塊為:LLM(大模型)和 Agent(智能體)。如果說 2023 年是大模型技術(shù)元年,那 2024 年應(yīng)該是大模型應(yīng)用的元年。目前最炙手可熱的大模型應(yīng)用應(yīng)該是 Agent,它是一個能夠自主完成目標(biāo)的智能體,具有規(guī)劃和執(zhí)行的能力。用車類比的話,大模型的推出相當(dāng)于汽車引擎的技術(shù)突破。而 Agent 就像一個整車,只有引擎是不夠的,還需要配骨架、座位、方向盤才能搭載人從一個地方駛向另外一個地方。所以 Agent 是基于大模型之上包了個外殼,使它能夠做一些具體的事情。

2. AI 傳統(tǒng)工具 VS AI Agent

圖片

Agent 與傳統(tǒng)人工智能的差別是什么呢?其差別在于傳統(tǒng)工具是人定義好一個流程,比如要質(zhì)檢一通邀約客戶到店的對話,我們首先需要行業(yè)專家去定義質(zhì)檢流程及質(zhì)檢項。人工智能在這個過程中能在某個質(zhì)檢項的檢測中提升質(zhì)檢的準(zhǔn)確率,但整個流程和質(zhì)檢規(guī)則實際上還是人類主導(dǎo)。而 Agent 是不需要人去干預(yù),它自己做規(guī)劃,包括判斷通話流程是否專業(yè),中間有哪些不合規(guī)的地方。所以 Agent 相對 AI 傳統(tǒng)工具根本性的一個差別就是原來是以人為主導(dǎo),現(xiàn)在則是以大模型 AI 為主導(dǎo)。

3. 超級個體 VS 群體智慧

圖片

那是不是可以認(rèn)為有一個超級智能體就能解決所有問題?從人類社會、自然界角度來看,通過多個個體共同去完成一件事,往往能夠比超級個體達(dá)到更好的效果,中國有句老話:三個臭皮匠,頂個諸葛亮,就是這個意思。自然界的例子是蟻群效應(yīng):整個蟻群能夠根據(jù)環(huán)境變化快速進(jìn)行調(diào)整,并不是依賴于既有的分工和流程。例如,當(dāng)螞蟻在同時發(fā)現(xiàn)食物后,會分別走兩條路線回到巢穴,并釋放信息素,最終整個蟻群會選擇最近的路線去搬運(yùn)食物,這個就是群體智慧的體現(xiàn)

圖片

當(dāng)前學(xué)術(shù)界群體智能方向的進(jìn)展也非常快,比如有個 paper 設(shè)計了一個實驗,通過構(gòu)造 2 個 Agent,去解決同一個問題,其中一個 Agent 扮演負(fù)責(zé)人,另外一個 Agent 扮演咨詢師,他們通過多輪對話、啟發(fā)、討論的方式去把解決方案從 0 到 1 的打磨完善出來。這個最終的解決方案對比只用單一 Agent 生成的解決方案要更加專業(yè)。我們認(rèn)為這是“智能的第二次涌現(xiàn)”,即群體智能。智能的第一次涌現(xiàn)是大模型,現(xiàn)在是多個 Agent 去交互碰撞,產(chǎn)生第二次智能。

圖片

兩次智能涌現(xiàn)的本質(zhì)是什么呢?第一次智能涌現(xiàn)是神經(jīng)網(wǎng)絡(luò)的神經(jīng)元達(dá)到一定量級后產(chǎn)生了質(zhì)變,大模型技術(shù)其實已經(jīng)發(fā)展很多年了,包括最早 2018 年 Bert 本身也是大模型,之所以 GPT 帶來革命性的影響,是因為其參數(shù)超過了一定量級,突破了 100 億、1000 億,甚至到 1 萬億,量變產(chǎn)生質(zhì)變。第二次群體智能的涌現(xiàn)的本質(zhì)是,當(dāng)單體 Agent 足夠多,各行各業(yè)都有專業(yè)的 Agent,如果把這些 Agent 都聚集起來,協(xié)同合作的去完成某項任務(wù),這個過程中有可能會產(chǎn)生新的發(fā)現(xiàn)。我們預(yù)判接下來群體智能技術(shù)將會受到更多關(guān)注。

圖片

從實踐上看也是會經(jīng)歷這樣的過程,比如有一個具體任務(wù),寫行業(yè)報告,現(xiàn)在通過單智能體,可能需要準(zhǔn)備一個非常復(fù)雜的 prompt,里面需要涵蓋如何去寫摘要,框架、調(diào)研、總結(jié),每個篇章要去找數(shù)據(jù)支撐,然后完善篇章內(nèi)容,整理成報告。這樣一個任務(wù)用一個 Agent 是很難實現(xiàn)的。但是如果我們把任務(wù)進(jìn)行拆分,比如設(shè)計 4 個 Agent,第一個 Agent 專注去做需求分析;第二個 Agent 去找素材和論據(jù);第三個 Agent 把前面素材整理成報告;最后一個 Agent 審核校驗。實際上現(xiàn)實中人們也是這么做的,用多個 Agent 實現(xiàn),每個 Agent 只需要把一項技能在 Prompt 中描述清楚,把單個 Agent 的能力做到極致。所以在真正落地的時候,我們自然就會向群體智能方向走。從理論和實踐上來看,群體智能一定是未來的一個發(fā)展方向。

4. 基于大模型的汽車行業(yè)群體智能業(yè)務(wù)架構(gòu)

圖片

如上圖所示是基于大模型的汽車行業(yè)群體智能整體的業(yè)務(wù)架構(gòu)。主要分為三層:

最底層是 YiCPM 汽車行業(yè)大模型,它不是某一個具體的模型,而是多個大模型的集合,包括語言模型、圖像模型、視頻模型、語音模型等,考慮到大模型發(fā)展日新月異,一方面我們會積極擁抱和嘗試技術(shù)領(lǐng)先的開源大模型,另一方面我們也會探索自研,自研還是往能交付的小參數(shù)模型方向走。因為幾十億、上百億參數(shù)的模型成本太高,企業(yè)不會買單,所以為了降低交付成本我們主要在小模型方向進(jìn)行探索。

中間層是整個解決方案的核心,智能體平臺。我們與清華大學(xué)自然語言處理實驗室、面壁智能公司合作,依托于 XAgent 和 AgentVerse 兩個開源框架,構(gòu)建了我們自研的 YiAgents 群體智能框架。

再往上是依托于這個框架的上層應(yīng)用,主要是從營銷場景出發(fā)找到的五個落地場景。

上圖右側(cè)是生態(tài)矩陣,數(shù)據(jù)和行業(yè) know how 對于做大模型很關(guān)鍵,真正要解決行業(yè)具體的問題,需要行業(yè)的一些工具和能力,這是一個共創(chuàng)的過程。

二、Yi Agents 群體智能平臺

1. 構(gòu)建多智能體框架面臨的關(guān)鍵問題

圖片

要設(shè)計多智能體的框架,會面臨以下幾個比較關(guān)鍵的問題:

  • 要做群體智能,先得有單體的 Agent,再利用單體智能組合產(chǎn)生群體智能,對單智能體進(jìn)行設(shè)計和劃分,單體智能體劃分得越明確,群體智能方案越好做。
  • 有了多個單智能體之后,智能體們所在的環(huán)境也需要做定義,所有的智能體都在一個環(huán)境里面工作。
  • 最后是多個智能體之間如何交流,需要定義他們之間的交流鏈,是串行的或者并行的,要考慮不同應(yīng)用場景智能體間的通信方式。

2. 設(shè)計多智能體交互框架的四大關(guān)鍵要素

圖片

設(shè)計多智能體交互有四個關(guān)鍵要素:

  • 基礎(chǔ)設(shè)施:是否足夠通用。
  • 協(xié)作模式:需要支持多種協(xié)作模式,人類社會也是如此,比如有串行、并行,先串行再并行,兩個智能體之間是合作還是競爭等等。
  • 執(zhí)行能力:需要有能夠使用工具的能力。垂直領(lǐng)域的壁壘就在于其不是解決一個通用的問題,需要用行業(yè)特有的一些工具去實現(xiàn)。如果沒有工具,就要能夠創(chuàng)造工具。
  • 人類參與:系統(tǒng)是否允許人類在執(zhí)行過程中參與以及如何參與。

3. 技術(shù)框架

圖片

上圖所示是白皮書里偏流程的技術(shù)框架,包括五個具體的技術(shù)點:

  • 首先做目標(biāo)和任務(wù)拆解,即任務(wù)分成幾步,每一步驟怎么做。
  • 拆解出的每一個任務(wù),誰去做,這里需要有單體智能,每一個智能體要足夠?qū)I(yè)能去完成這個任務(wù),這里涉及到智能體的技術(shù)。
  • 多個智能體協(xié)作:多個智能體之間要有交流鏈和 workflow,它們之間是怎么交流的。
  • context:即環(huán)境,多個智能體在一起需要共享和沉淀一些信息。
  • 對齊技術(shù):大模型的優(yōu)勢是很有創(chuàng)造性,但又可能容易產(chǎn)生幻覺,這是一對不可調(diào)和的矛盾,這兩者之間要有一個 trade off。

圖片

多智能體技術(shù)框架按上述五個點拆解來講。

(1)目標(biāo)驅(qū)動的任務(wù)管理

圖片

群體智能如何保證多個單智能體都能完成任務(wù)?利用通用的群體智能框架,它讓不同角色完成不同的任務(wù)。首先對任務(wù)進(jìn)行規(guī)劃,根據(jù)任務(wù)的 know-how 和經(jīng)驗知識,拆解成一個工作流,分配好任務(wù)需要多少角色去完成,每個角色干什么。任務(wù)規(guī)劃完之后開始執(zhí)行,Agent 需要按照任務(wù)規(guī)劃的每一步驟去執(zhí)行。Agent 的輸入來自 prompt,因為大模型所有的輸入都是 prompt, 為了讓其通用化,需要把大模型 prompt 的 template 實例化。所以當(dāng)需要執(zhí)行一個任務(wù)時,流程執(zhí)行到了哪個步驟,把該步驟的 prompt 實例化,然后去執(zhí)行即可。最后是任務(wù)總結(jié),目的是不斷地反思以做得更好,可以迭代一輪或者迭代多輪,依據(jù)實際應(yīng)用場景而定。

(2)LLM 驅(qū)動的智能體

圖片

群體智能的核心就是單體 Agent,而 Agent 的核心要素包括記憶、規(guī)劃、感知、執(zhí)行和使用工具的能力等。這些能力都是大語言模型提供的,上述架構(gòu)也是當(dāng)前 Agent 比較通用的技術(shù),未來隨著發(fā)展,會擴(kuò)展記憶,記憶越多,能容納的知識經(jīng)驗就更多,但是大模型上下文空間始終是有限的,因此會更多考慮擴(kuò)展上下文長度,比如當(dāng)前的 Kimi,如果空間仍然不夠就會考慮壓縮。

圖片

我們的底層框架是 XAgent,XAgent 在基礎(chǔ) Agent 框架基礎(chǔ)上引入了自我反思的過程。類比人類也是如此,優(yōu)秀員工和普通員工的差別在于優(yōu)秀員工干完一件事自己就會總結(jié)反思。XAgent 框架在單體 Agent 的基礎(chǔ)上加了兩個循環(huán),即內(nèi)外循環(huán),內(nèi)循環(huán)是執(zhí)行+自我反思,即任務(wù)執(zhí)行完畢后自我反思這個結(jié)果是否滿意,是否還能再優(yōu)化。外循環(huán)是通過多輪反思實現(xiàn)整個迭代過程。

(3)多智能體協(xié)作

圖片

多智能體協(xié)作本質(zhì)是一個 workflow,從一個 Agent 到下一個 Agent 要解決的最關(guān)鍵的問題是 prompt 實例化,即要把 Prompt Template 里面的占位符具體化。目前業(yè)內(nèi)一般通過消息總線存儲信息,比如從任務(wù)下達(dá),任務(wù)拆解,到第一個 Agent 執(zhí)行完,第二個 Agent 執(zhí)行完、人類交互等所有這些信息都可以以 message 形式存在于消息總線里面,當(dāng)某個 Agent 準(zhǔn)備執(zhí)行時,它的上下文就是當(dāng)前消息總線里面的所有消息歷史,Agent 可以自己分析現(xiàn)在處于哪個環(huán)節(jié),累計產(chǎn)出了哪些中間成果,接下來干什么,所以協(xié)作的本質(zhì)就是通過消息總線傳遞信息。如果信息復(fù)雜的話可以再用一個單獨(dú)的 Agent 把信息進(jìn)行提煉總結(jié)抽取,把 Prompt Template 實例化,這樣每個 Agent 自然就能串起來。

(4)上下文交互

圖片

消息總線等同于上下文、全局變量、智能體執(zhí)行的環(huán)境,消息總線可以用 message 隊列簡單實現(xiàn)。智能體執(zhí)行過程中產(chǎn)生的所有信息都是 message,message 包含以下元素:

  • 發(fā)送者:可能是用戶發(fā)的,也可能是上一個 Agent 發(fā)的,還可能是系統(tǒng)發(fā)的。
  • 接收者:要定義好一個 workflow,得知道下游是誰,誰能接收該消息,誰可以忽視。
  • 消息類型:消息類型有很多,任務(wù)描述、Agent 輸出結(jié)果、系統(tǒng)的狀態(tài)等。
  • 消息內(nèi)容

(5)平衡自主性與一致性

圖片

大模型非常具有創(chuàng)造性,但問題是太讓其自主發(fā)揮會出現(xiàn)幻覺、前后表述不一致等現(xiàn)象,所以需要考慮自主性和一致性的折中,當(dāng)前階段它還是離不開人的干預(yù)和反饋,需要不斷的進(jìn)化,找到一個平衡點。

圖片

群體智能框架的技術(shù)實現(xiàn)如上圖所示:首先有一個 Planner 生成計劃,然后分配任務(wù)給 performer 或叫 executor,來對每個 Agent 進(jìn)行 Prompt Template 實例化,等所有 Agent 執(zhí)行完畢后,由 Reviewer 對整個任務(wù)執(zhí)行過程和結(jié)果進(jìn)行復(fù)盤總結(jié),依復(fù)盤情況可以執(zhí)行多輪。

三、群體智能技術(shù)在行業(yè)中的應(yīng)用

圖片

大模型為汽車行業(yè)帶來的價值包括:

  • 高效的流程管理
  • 定制化的營銷體驗
  • 增強(qiáng)用戶服務(wù)感受
  • 市場分析與預(yù)測
  • 跨部?協(xié)作的促進(jìn)

圖片

以營銷場景為例,營銷首先是要獲客,獲客后要做線索清洗,一般業(yè)內(nèi)是根據(jù) DCC 電話進(jìn)行第一輪篩選,區(qū)分高意向、低意向客戶,針對高意向客戶直接邀約到店,低意向就開展后續(xù)的用戶運(yùn)營,比如通過加企業(yè)微信通過 IM 做一些轉(zhuǎn)化,轉(zhuǎn)換成高意向,再邀約到店,最后購車成交。

圖片

整個流程里衍生出來五個核心落地場景:

  • 數(shù)智研究院:整個造車流程有新車設(shè)計、研發(fā)生產(chǎn)、新車發(fā)售、口碑反饋,行業(yè)調(diào)研、戰(zhàn)略規(guī)劃等等需要數(shù)據(jù)決策的環(huán)節(jié),之前可能需要咨詢公司專業(yè)人士去做,現(xiàn)在可以把它拆成幾個 Agent 協(xié)作完成,比如業(yè)務(wù)分析、數(shù)據(jù)抓取、數(shù)據(jù)分析、報告整理和校對。
  • 輿情運(yùn)營:輿情運(yùn)營比如說對于公關(guān)部門,有時候需要危機(jī)公關(guān),我們可以幫助車企及時發(fā)現(xiàn)有風(fēng)險的輿情能挽回很多損失。這部分需要監(jiān)控主流社交媒體上的輿情數(shù)據(jù),Agent 需要對評論做正向、負(fù)向、中性的判斷評估,找到熱點事件,評控引導(dǎo)輿論,并提醒廠商人員介入。
  • 新媒體運(yùn)營:主要用于生產(chǎn)營銷素材,比如當(dāng)前依賴人工生產(chǎn)短視頻和海報,現(xiàn)在機(jī)器可以生成素材,生成后到社交媒體上投放,然后關(guān)注投放效果,查找數(shù)據(jù)并進(jìn)行效果分析。
  • 用戶運(yùn)營
  • 集約 DCC

圖片

以用戶運(yùn)營為例的話,主要有以下 Agent:用戶運(yùn)營專員、質(zhì)檢專員、標(biāo)注專員、建檔專員等。

圖片

如上圖中的案例,要邀約一個用戶到店,首先提供一些用戶信息,智能助手會給出一個工作流,這個任務(wù)需要 5 個步驟去完成。先給客戶評級,接著生成邀約的開口話術(shù),參照話術(shù)進(jìn)行客戶對話邀約。對話結(jié)束后進(jìn)行建檔,最后進(jìn)行質(zhì)檢。全部流程都是自動執(zhí)行的。

圖片

接下來按照流程逐一完成各個步驟。

圖片

整個任務(wù)完成之后,做復(fù)盤總結(jié),自我反思是否存在漏洞,哪些環(huán)節(jié)可以改進(jìn)。

(是否需要插入視頻演示)

四、汽車行業(yè)群體智能技術(shù)生態(tài)

圖片

汽車行業(yè)群體智能生態(tài)包括 4 個部分:

1. 行業(yè)解決方案伙伴

圖片

需要依賴一些行業(yè) know how,比如專業(yè)的調(diào)研報告、分析用戶群體等,需要基于行業(yè)方法論。當(dāng)前在某些具體場景,我們希望能夠得到行業(yè)伙伴們提供的一些行業(yè)經(jīng)驗,并將其放入知識庫。隨著 Agent 積累的經(jīng)驗越來越多,其能力也會不斷提升。

2. 行業(yè)數(shù)據(jù)伙伴

圖片

大模型本身差異不大,而影響其效果的核心還是數(shù)據(jù)。易車更多偏 C 端的數(shù)據(jù),我們也希望獲得一些車企經(jīng)銷商對話的語料,以及機(jī)構(gòu)的行業(yè)咨詢報告等,有了這些數(shù)據(jù)才能訓(xùn)練模型。

3. 大模型伙伴

圖片

我們系統(tǒng)底層模型是一系列語言模型、多模態(tài)模型的集合,我們會持續(xù)接納業(yè)內(nèi)專業(yè)的大模型,因為不同模型在不同任務(wù)上的效果是不一樣的,不可能用一個模型解決所有問題。

企業(yè)側(cè)模型選型,考慮到成本因素,未來還是將會向小參數(shù)量模型方向發(fā)展。

4. 行業(yè)工具伙伴

圖片

當(dāng)前業(yè)內(nèi)做 Agent 的企業(yè)很多,最終的壁壘有一部分會體現(xiàn)在行業(yè)工具上,比如營銷場景需要托管企微、生成海報等,很多公司在某些領(lǐng)域已經(jīng)深入,沒有必要所有工具都自行研發(fā),每一個環(huán)節(jié)應(yīng)該由更專業(yè)的人去完成,才能最終把事做成做好。所以希望整個生態(tài)能夠?qū)崿F(xiàn)開放共贏。

圖片

各個企業(yè)貢獻(xiàn)各自的力量,才能合作共贏,促進(jìn)整個生態(tài)的發(fā)展。

五、總結(jié)和展望

技術(shù)的飛速發(fā)展,幫助我們站在了一個全新的視角,眺望汽車行業(yè)即將踏入的遼闊天地。在智能化的浪潮下,我們預(yù)見一個更加智慧、高效能、用戶至上的汽車新時代正在加速到來。

未來大模型群體智能將幫助企業(yè)進(jìn)一步降本增效,并開啟用戶運(yùn)營新篇章,做到千人千面,進(jìn)一步提升客戶體驗。在各大企業(yè)的創(chuàng)新與合作下,整個行業(yè)將共建智慧汽車新生態(tài)。

六、Q&A

Q1:技術(shù)框架關(guān)于任務(wù)的規(guī)劃,如何把一個大的任務(wù)拆解成一個個小的子任務(wù),如果拆分的力度過細(xì),調(diào)用鏈就可能會比較臃腫,如果拆的力度過粗,子任務(wù)完成的正確率就會降低。在這方面是否有一些方法論或?qū)嶋H經(jīng)驗可以參考?

A1:這方面肯定是沒有標(biāo)準(zhǔn)答案的,對 Agent 的定義,包括我們現(xiàn)在拆解一些行業(yè)場景,一件事是由一個 Agent 做還是三個 Agent 做也是沒有標(biāo)準(zhǔn)答案的,需要通過實踐去檢驗。從我的經(jīng)驗來講:

  • 第一點,planner 是非常重要的,對于某些任務(wù)來講,它要有一些行業(yè) know how 知識。比如一個行業(yè)報告,我們跟羅蘭貝格、IBM 合作,他們給我們寫出來一個命題到底該怎么拆、怎么做;
  • 第二點,每個 Agent 的定義設(shè)計,要描述得足夠清晰,每個 Agent 干什么,比如要用戶運(yùn)營,第一步,是一個評級專員,有了評級才有后面的針對不同的用戶,才有不同的策略,這些信息一定要放到 Agent description 里面,給到 planner。提示越多它執(zhí)行起來越簡單。
  • 第三點,一次規(guī)劃可能達(dá)不到理想狀態(tài),要反復(fù)嘗試,經(jīng)過多輪調(diào)整,才能達(dá)到更好的效果。

以上是一些建議。

Q2:大模型 Agent 在輿情分析這塊具體參與了什么樣的工作,和傳統(tǒng)的NLP 技術(shù)相比,其優(yōu)勢在哪里?現(xiàn)在很多 NLP 分析工作都已經(jīng)被大語言模型替代掉。

A2:Agent 其實與大模型不在一個維度。原來 NLP 只是在解決某一個節(jié)點,某一個工作發(fā)揮了作用,比如分析輿情,要有一個情緒識別模型判斷評論到底正向負(fù)向,是在研究其中一個事如何能做得更好。現(xiàn)在,大模型的厲害之處在于原來干一件事要訓(xùn)練一個模型,現(xiàn)在一個大語言模型可以把所有事情都做了,大大提高了效率。而 Agent 的作用是什么呢?比如輿情這件事首先得去監(jiān)控全網(wǎng)的數(shù)據(jù),定期收集這些數(shù)據(jù),然后去分析,生成一些 action,比如簡單的回復(fù)等等,有一些 todo 拆解。Agent 就是對一件事進(jìn)行拆解,每一步完成不同的工作,從規(guī)劃到執(zhí)行自動化地完成整個任務(wù)。

Q3:多智能體架構(gòu)如何利用外界信息形成一套反饋和調(diào)節(jié)機(jī)制?因為反思其實是內(nèi)部的

A3:反思還是需要借助消息總線,所有信息包括它自己生成的數(shù)據(jù)、外界給它的數(shù)據(jù)、人工的一些指令,都可以變成消息,然后放到消息池里,下一次 Agent 要具體的操作時,會有輸入 prompt,可以從 Prompt 定義很多 context,包括實時消息,上一次做完的結(jié)果等。比如質(zhì)檢,剛開始沒有任何知識,先質(zhì)檢了一輪后質(zhì)檢主管反饋有問題,就可以把這個信息反饋也加到 message history 里面,下一次質(zhì)檢就有上一次這個經(jīng)驗。并沒有改變模型的參數(shù)而是把知識都沉淀到經(jīng)驗庫里,這個經(jīng)驗庫可以全部或者部分進(jìn)入到 Prompt 中,如果上下文空間足夠的話,全放進(jìn)去,如果不夠的話,可以通過抽取摘要進(jìn)行提煉再加入進(jìn)去。這就是反思的實現(xiàn)原理,沒有改變模型參數(shù),只是增加了上下文的經(jīng)驗數(shù)據(jù)。

Q4:現(xiàn)在已經(jīng)把傳統(tǒng)的工作流 Agent,后續(xù)它肯定還存在一些問題,那多智能體的這樣一個系統(tǒng)迭代方向的衡量的標(biāo)準(zhǔn)怎么衡量的?

A4:多智能體處于一個比較前沿的階段,受限于知識,它目前還只能處理有限的一些任務(wù)。后面經(jīng)過自我學(xué)習(xí),不斷進(jìn)化沉淀經(jīng)驗,其對于任務(wù)的覆蓋能力會增強(qiáng)。所以整個數(shù)據(jù)飛輪反饋機(jī)制是至關(guān)重要的。另外,隨著一些周邊工具的積累,其能力邊界也將得到拓展。

Q5:關(guān)于反思,內(nèi)循環(huán)的那種反思可能更多的是將歷史的一些經(jīng)驗數(shù)據(jù)帶到下一次的上下文里面,如果有過多的較為龐雜的歷史經(jīng)驗的話,會不會影響到最終的產(chǎn)出結(jié)果?目前對于反思是如何去評判的?我們?nèi)祟惖囊恍┙?jīng)驗可能并不可靠,那機(jī)器提示自己的一些經(jīng)驗,該如何保證其正確性呢?

A5:針對第一個問題,很多數(shù)據(jù)是質(zhì)量較差,而放到消息總線的經(jīng)驗庫的應(yīng)該是比較高質(zhì)量的數(shù)據(jù),把經(jīng)驗和知識提煉成一個高質(zhì)量的經(jīng)驗庫。精煉一方面也得通過人工的標(biāo)注,比如離線的標(biāo)注,或者通過大模型的幫助進(jìn)行提煉,我們有一個數(shù)據(jù)標(biāo)注訓(xùn)練師的 Agent,就是在做這件事。它也需要人工進(jìn)行干預(yù)。

第二個問題,怎么評判反思的結(jié)果。設(shè)計這個產(chǎn)品的機(jī)制,在產(chǎn)品側(cè)可能要預(yù)埋一些東西,比如一個對話,判斷對話效果好不好,如果回答一個問題以后,后面客戶又追問了好幾次,那通常情況下首次回答的效果就是不夠好的。再比如質(zhì)檢,要評判質(zhì)檢效果的好壞,很重要的標(biāo)準(zhǔn)就是評判完了客服沒有異議。所以這其中涉及工程化的內(nèi)容,把人類反饋融合到整個系統(tǒng)里并標(biāo)記。除此之外,它不一定是自反思,也可以引入中介,比如再引入一個模型 GPT4,作為一個裁判,讓它來判斷。甚至可以引入多個裁判,最后投票選出來一個結(jié)果,我們一般做自反饋最好的方式是再引入它的 partner,它干任何事有個 partner 去對應(yīng)找漏洞,然后觸發(fā)兩個人思辨,效果會比一個反思更好。

Q6:多個 Agent,每個Agent 里面有自己的 prompt,還有一些相關(guān)的設(shè)計。一是關(guān)于 prompt 內(nèi)容的結(jié)構(gòu),二是 prompt 的內(nèi)容,應(yīng)該是跟領(lǐng)域或者您現(xiàn)在嘗試的結(jié)構(gòu)或者體系是有關(guān)系的。這部分是不是做了很多的嘗試?

A6:Prompt 針對不同模型和不同的訓(xùn)練數(shù)據(jù)是不一樣的。但 prompt 也會有一定套路,比如首先給背景、目標(biāo)、聽眾,然后明確輸出結(jié)果等等。

Q7:在這種套路下,每次出來的結(jié)果差別大嗎?

A7:大模型運(yùn)行多次的結(jié)果肯定是不一樣的。當(dāng)然你可以調(diào)節(jié),讓它盡可能別發(fā)散,那就是一個發(fā)散創(chuàng)新和不發(fā)散之間度的平衡,但即使不一樣,也可以通過正則等抽出來一些核心關(guān)鍵點。

Q8:我們設(shè)計了多個 Agent 和不同的 prompt 結(jié)構(gòu),那是我們基于當(dāng)前的 LLM 的底座的能力去設(shè)計的,會不會隨著 LLM 技術(shù)的發(fā)展,我們在以前的 Agent 基礎(chǔ)上面做的內(nèi)容和生態(tài)就沒辦法繼續(xù)了?

A8:隨著各項技術(shù)的發(fā)展,原來代碼肯定是要調(diào)整的,這是必然的。

Q9:長期來說,我們當(dāng)前的工作是起個大早,是不是做了很多工作都是沒有意義的?

A9:行業(yè)最后會積累下來一些不變的東西,比如沉淀下來的數(shù)據(jù)、行業(yè)知識經(jīng)驗庫,還有工具,當(dāng)你有了這些東西,有了知識和行業(yè) know how,有了數(shù)據(jù)和工具,那么未來模型改變,我們也能夠快速改造出一套新的系統(tǒng)。系統(tǒng)本身的價值遠(yuǎn)不如其背后的行業(yè)優(yōu)質(zhì)數(shù)據(jù)的價值更大。

責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2010-02-04 11:57:32

ibmdw商務(wù)智能

2014-11-20 20:40:54

聯(lián)想公交能解決方案

2024-09-23 08:36:45

華為全聯(lián)接大會數(shù)據(jù)智能

2022-11-08 14:17:39

2023-07-21 09:57:06

2023-10-31 15:04:12

人工智能自然語言處理

2010-02-25 15:19:43

SAPSaaSBI

2023-10-31 16:20:12

2019-01-18 05:22:39

區(qū)塊鏈智能合約網(wǎng)絡(luò)安全

2025-03-03 01:25:00

SpringAOP日志

2024-01-02 10:46:13

2022-05-20 06:14:57

人工智能AI

2021-01-21 15:48:56

物聯(lián)網(wǎng)智慧城市5G

2023-08-02 11:30:13

自動化人工智能

2023-08-02 15:12:20

人工智能交通運(yùn)輸

2025-04-24 11:09:13

2025-06-05 00:00:00

向量數(shù)據(jù)庫線程安全Redis
點贊
收藏

51CTO技術(shù)棧公眾號

美女100%无挡| 精品无码一区二区三区爱欲| 中文字幕免费在线看| 97久久视频| 精品女同一区二区| 岳毛多又紧做起爽| 免费观看在线黄色网| 国产成人一级电影| 欧美最猛性xxxx| 日韩一区二区三区四区视频| 4438全国亚洲精品观看视频| 日韩欧美在线第一页| 超碰成人在线免费观看| 青青色在线视频| 韩国精品久久久| 欧美亚洲国产日韩2020| 国产精品丝袜一区二区| 在线日本制服中文欧美| 日韩美女在线视频| jizzzz日本| 小早川怜子影音先锋在线观看| 国产精品久久久久久亚洲伦| 九色综合日本| 亚洲av永久无码国产精品久久| 天天干天天干天天干天天| 91大神精品| 欧美日韩日日骚| av动漫在线看| av手机在线观看| 国产精品国产三级国产三级人妇| 久久精品国产精品国产精品污 | 欧美成人免费| 高清国产一区二区三区| 国产欧美在线观看| 无码人妻丰满熟妇区bbbbxxxx| 欧美日韩一视频区二区| 日韩在线视频网| 亚洲成人av免费在线观看| 免费欧美网站| 91麻豆精品国产91久久久久| 欧美伦理片在线观看| 欧美成人ⅴideosxxxxx| 精品成人在线视频| 国产精品无码人妻一区二区在线| 国产黄色在线网站| 亚洲欧洲国产日本综合| 翔田千里亚洲一二三区| 大片免费播放在线视频| 亚洲成人国产| 久久久噜噜噜久噜久久综合| 国产欧美日韩精品专区| 中文字幕+乱码+中文字幕明步| 久久综合亚州| 国产精品久久激情| 在线免费观看中文字幕| 免费av成人在线| 国产精品最新在线观看| 国产又粗又猛又爽又黄的| 老司机免费视频一区二区三区| 国产精品久久久精品| 亚洲 小说区 图片区| 日韩福利电影在线| 国产精品视频yy9099| 亚洲中文字幕一区二区| 精品在线你懂的| 51成人做爰www免费看网站| 国产黄色大片网站| 丁香桃色午夜亚洲一区二区三区| 国产一区不卡在线观看| 日韩av免费观影| 国产婷婷一区二区| 艳色歌舞团一区二区三区| 五月天婷婷丁香| 蜜桃视频在线入口www| 国产做a爰片久久毛片| 亚洲一区二区三| 国产小视频免费观看| 91首页免费视频| 欧美在线日韩精品| 免费av网站在线观看| 一区二区三区在线免费播放| 国产v片免费观看| 精品成人免费一区二区在线播放| 欧美日韩日日骚| 特级特黄刘亦菲aaa级| 日本午夜精品久久久| 尤物精品国产第一福利三区| 成年人午夜剧场| 亚洲欧洲综合| 国产精品免费观看在线| 国产肥老妇视频| 91视频一区二区三区| 永久久久久久| av漫画网站在线观看| 日本乱人伦一区| 亚洲丝袜在线观看| 宅男在线一区| 久久99久久99精品中文字幕| av网站中文字幕| 国产一区二区女| 免费中文日韩| 少女频道在线观看免费播放电视剧| 精品久久久国产| 天天操狠狠操夜夜操| 卡一精品卡二卡三网站乱码| 色婷婷综合成人| 日韩欧美a级片| 狠狠色2019综合网| 欧美精品一区在线发布| caoporn免费在线视频| 一本到高清视频免费精品| 少妇欧美激情一区二区三区| 亚洲日本三级| 久久久最新网址| 亚洲图片视频小说| 91蝌蚪porny| 国产一区 在线播放| 成人在线免费| 亚洲男子天堂网| 九九视频免费观看| 青青草超碰在线| 久久久99久久精品欧美| 男人天堂网站在线| 男女啪啪999亚洲精品| 亚洲免费福利视频| 久久午夜免费视频| 国产91高潮流白浆在线麻豆| 自拍偷拍一区二区三区| 亚洲精品555| 亚洲欧洲自拍偷拍| wwwxxx亚洲| av色综合久久天堂av综合| 日韩精品福利片午夜免费观看| 你懂得影院夜精品a| 日韩国产精品一区| 日韩精品在线免费看| 国产91在线看| 成人在线免费观看视频网站| 国产精品色婷婷在线观看| 中文字幕一区电影| 中文字幕你懂的| 国产精品蜜臀av| 国产一级做a爰片久久| 精品日本12videosex| 国产成人激情视频| 欧美18xxxxx| 一本色道综合亚洲| 欧洲美一区二区三区亚洲| 午夜一区不卡| 欧美成人第一区| 欧美日韩大片| 亚洲香蕉在线观看| 中文字幕乱码中文字幕| 中文字幕在线一区| 欧美一级特黄aaa| 亚洲激情五月| 亚洲自拍中文字幕| 肉体视频在线| 亚洲国产小视频在线观看| 日韩三级小视频| 久久综合色一综合色88| www.欧美日本| 欧美丰满日韩| 亚洲伊人成综合成人网| 国产精品偷拍| 亚洲国产高潮在线观看| 9i精品福利一区二区三区| 久久久久国产精品厨房| 国产一伦一伦一伦| 午夜欧美精品久久久久久久| 国产精品二区二区三区| 在线播放国产视频| 欧美一级做一级爱a做片性| 日日狠狠久久偷偷四色综合免费| 97国产成人无码精品久久久| 亚洲精品videosex极品| 你懂得在线视频| 日韩成人午夜精品| 亚洲一区 在线播放| 欧美aaaaaaaa牛牛影院| 国产精品久久久久久亚洲影视| 在线激情免费视频| 亚洲精品一线二线三线| 久久久久女人精品毛片九一 | 欧美日韩中文字幕视频| 国产一区二区三区免费在线观看| 国产aaa免费视频| 国产一区二区三区天码| 亚洲一区亚洲二区亚洲三区| 色资源二区在线视频| 最近2019年好看中文字幕视频| 国产suv一区二区| 色综合天天综合网天天看片| 激情无码人妻又粗又大| www.亚洲激情.com| 亚洲精品久久久久久宅男| 亚洲全部视频| 亚洲一区美女| 偷拍视屏一区| 99久久国产免费免费| 免费亚洲电影| 久久久噜噜噜久久中文字免| 触手亚洲一区二区三区| 亚洲精品国产精品国自产观看浪潮| 一区二区视频免费观看| 精品久久久久久国产| 97免费中文视频在线观看| 四虎永久在线观看| 欧美高清性hdvideosex| 日韩黄色在线播放| 一区二区三区不卡视频| 99自拍偷拍视频| 久久亚区不卡日本| 蜜臀av粉嫩av懂色av| 激情偷乱视频一区二区三区| 国产视频一区二区三区在线播放 | 国产videos久久| 粉嫩av免费一区二区三区| 成人av色网站| 欧美又大又硬又粗bbbbb| 日韩少妇视频| 日韩专区在线观看| 成人在线观看黄色| 亚洲欧洲xxxx| 香蕉视频黄在线观看| 欧美一区二区三区公司| 一级全黄裸体免费视频| 在线视频国内自拍亚洲视频| 日韩 欧美 综合| 亚洲国产精品嫩草影院| 东方av正在进入| 亚洲人成精品久久久久久| 超薄肉色丝袜一二三| 国产视频在线观看一区二区三区 | 午夜先锋成人动漫在线| 成人欧美一区二区| 日韩视频一二区| 亚洲一区二区三区视频| 免费日韩成人| 成人在线精品视频| 国产国产一区| 国产欧美亚洲精品| 亚洲久草在线| 91丝袜美腿美女视频网站| 五月天色综合| 91久久国产精品| 91麻豆精品国产91久久久更新资源速度超快| 国产福利精品在线| 久久99久久99精品免观看软件| 欧美中文字幕在线| 日韩新的三级电影| 国产精品久久不能| 日韩毛片网站| 亚洲综合精品伊人久久| 视频一区在线| 国产亚洲福利社区| 青青操综合网| 日本a级片久久久| 精品国产一区二区三区久久久蜜臀| 日韩电影在线播放| 久久神马影院| 日本道在线视频| 亚洲福利久久| 久久久久狠狠高潮亚洲精品| 日韩精品欧美精品| 午夜剧场高清版免费观看| 国产精品中文字幕欧美| 国模私拍在线观看| 国产亚洲精品aa| 日韩激情小视频| 亚洲一区二区影院| 中文字幕视频网| 欧美日韩国产中文| 亚洲国产中文字幕在线| 国产丝袜一区视频在线观看| av基地在线| 欧美激情中文字幕乱码免费| 中文在线免费视频| 国产日韩欧美一二三区| 97人人澡人人爽91综合色| 欧美 日韩 国产在线| 欧美电影免费播放| 黄页免费在线观看视频| 免费精品视频最新在线| 老司机av网站| 国产午夜精品一区二区三区四区| 男人在线观看视频| 日韩欧美在线一区| 国产精品伦一区二区三区| 亚洲精品国产精品自产a区红杏吧| 爱久久·www| 午夜精品一区二区三区在线| 久久麻豆视频| 精品国产乱码久久久久软件 | 亚洲精品不卡在线观看| 蜜桃导航-精品导航| 婷婷精品进入| 精品99在线视频| 国产成人精品一区二区三区四区 | 久久精品国产99久久| 99在线免费视频观看| 理论片日本一区| 朝桐光av一区二区三区| 亚洲三级在线免费观看| 日韩美一区二区| 精品av久久707| 女女色综合影院| 国产成人精品在线观看| 国产 日韩 欧美 综合 一区| 夜夜爽www精品| 久久在线精品| 国产精品久久久免费观看| 亚洲精品日韩综合观看成人91| 黄色av网站免费| 日韩电影大片中文字幕| 婷婷色在线资源| 成人欧美一区二区三区黑人| 精品大片一区二区| 91精品91久久久中77777老牛| 丁香婷婷综合五月| 日韩成人短视频| 欧美日韩国产片| 成人午夜影视| 国产91免费看片| 亚洲v天堂v手机在线| 婷婷无套内射影院| 国产91露脸合集magnet| 粉嫩av性色av蜜臀av网站| 欧美日韩不卡视频| 一本一道波多野毛片中文在线| 欧洲美女免费图片一区| 麻豆一区一区三区四区| 国产美女永久无遮挡| 国产成人在线电影| 激情小说中文字幕| 日韩视频一区在线观看| av网站在线看| 96精品久久久久中文字幕| 国产精品传媒精东影业在线| 天天色综合社区| 国产精品另类一区| 一区二区国产欧美| www.国产一区| 亚洲精品三区| 欧美一级中文字幕| 国产白丝精品91爽爽久久 | 国产精品v欧美精品v日本精品动漫| 国产美女视频免费看| 日韩一区中文字幕| 国产超碰人人模人人爽人人添| 欧美超级乱淫片喷水| 日韩一二三区在线观看| 久久在线中文字幕| 97超碰欧美中文字幕| 国产99免费视频| 中文字幕综合在线| 国产精品99久久免费| 国产黄色激情视频| 91网站在线播放| 黄色av网站免费| 久久精品国产91精品亚洲 | 韩国三级中文字幕hd久久精品| 久久久久久久麻豆| 日韩精品一区二区三区四区| 懂色av一区| 欧美亚洲国产免费| 麻豆精品在线看| 欧美日韩激情在线观看| 亚洲国产高清自拍| 日韩在线观看不卡| 熟女视频一区二区三区| 国产jizzjizz一区二区| 日韩精品一区二区亚洲av| 在线不卡国产精品| 国产精品一区二区精品| 男人的天堂狠狠干| 国产喷白浆一区二区三区| 国产精品爽爽久久| 97国产精品久久| 日韩欧美中字| 中文字幕久久久久久久| 色欧美片视频在线观看在线视频| 日本免费视频在线观看| 国产欧美日韩在线播放| 日韩高清一级片| 久久国产在线观看| 亚洲人在线观看| 亚洲综合影院| 久久久久久三级| 亚洲自拍欧美精品| h视频在线播放| 国产精品一区二区欧美| 裸体在线国模精品偷拍| 日韩av在线播| 久久久精品国产网站| 亚洲97av| 国产伦精品一区二区三区88av| 欧洲国内综合视频| 精品极品在线| 久久精品在线免费视频|