精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

構(gòu)建可靠AI應(yīng)用的LLM三角原則 原創(chuàng)

發(fā)布于 2024-7-26 08:41
瀏覽
0收藏

本文將介紹一種經(jīng)精心設(shè)計(jì)的開發(fā)可靠的高性能LLM應(yīng)用程序所遵循的軟件設(shè)計(jì)原則——LLM三角原則。基于這一原則開發(fā)LLM應(yīng)用,有助于縮短應(yīng)用LLM的巨大潛力和現(xiàn)實(shí)世界實(shí)施面臨的挑戰(zhàn)之間的差距。

引言

大型語言模型(LLM)存在巨大的潛力,但是想開發(fā)出高可靠性的生產(chǎn)級(jí)LLM應(yīng)用程序仍然存在相當(dāng)大的挑戰(zhàn)。在經(jīng)歷過構(gòu)建了數(shù)十個(gè)LLM系統(tǒng)的實(shí)踐后,我將成功開發(fā)LLM應(yīng)用的公式提煉為任何團(tuán)隊(duì)都可以遵循的3+1基本原則。

“LLM原生應(yīng)用程序有10%是訓(xùn)練復(fù)雜模型相關(guān)的工作,而另外90%則是實(shí)驗(yàn)數(shù)據(jù)驅(qū)動(dòng)的工程開發(fā)工作。”

構(gòu)建生產(chǎn)級(jí)實(shí)用型LLM應(yīng)用程序需要非常細(xì)致的工程實(shí)踐。當(dāng)用戶無法直接與LLM交互時(shí),必須精心編寫有關(guān)提示,以涵蓋所有細(xì)微差別,因?yàn)榈脩舻姆答佇畔⒖赡苁遣豢捎玫摹?/p>

LLM三角原則介紹

LLM三角原則概括了構(gòu)建有效LLM原生應(yīng)用程序的基本指導(dǎo)方針。這一原則提供了一個(gè)堅(jiān)實(shí)的概念框架,指導(dǎo)開發(fā)人員構(gòu)建健壯可靠的LLM原生應(yīng)用程序,并提供指導(dǎo)和支持。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

從SOP視角優(yōu)化三個(gè)突出的原則,從而實(shí)現(xiàn)最佳的LLM使用

關(guān)鍵點(diǎn)

總體來看,LLM三角原則引入了四種編程原則,以幫助你設(shè)計(jì)和構(gòu)建LLM原生應(yīng)用程序。

其中,第一個(gè)原則是標(biāo)準(zhǔn)操作程序(SOP:Standard Operating Procedure)。SOP提出我們?nèi)切蔚娜齻€(gè)頂點(diǎn):模型、工程技術(shù)和上下文數(shù)據(jù)。

通過SOP的視角優(yōu)化上述三角形的三個(gè)頂點(diǎn)的原則是確保高性能LLM原生應(yīng)用程序的關(guān)鍵。

1.標(biāo)準(zhǔn)操作程序(SOP)

標(biāo)準(zhǔn)操作程序(SOP)是工業(yè)界眾所周知的術(shù)語。這是一套由大型組織編寫的分步驟說明,旨在幫助員工進(jìn)行日常操作,同時(shí)每次都能保持高質(zhì)量和相似的結(jié)果。通過編寫詳細(xì)的說明,這將缺乏經(jīng)驗(yàn)或低技能的工人變成了專家。

LLM三角原則借鑒了SOP范式,并鼓勵(lì)你將該模型視為缺乏經(jīng)驗(yàn)/不熟練的工人。我們可以通過向模型“講授”專家應(yīng)該如何執(zhí)行這項(xiàng)任務(wù),來確保更高質(zhì)量的結(jié)果。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

SOP指導(dǎo)原則

“如果沒有SOP,即使是最強(qiáng)大的LLM也無法提供始終如一的高質(zhì)量結(jié)果。”

在思考SOP指導(dǎo)原則時(shí),我們應(yīng)該確定哪些技術(shù)將幫助我們最有效地實(shí)施SOP。

(1)認(rèn)知建模

為了創(chuàng)建SOP,我們需要選取表現(xiàn)最佳的員工(領(lǐng)域?qū)<?,模擬他們?nèi)绾嗡伎己凸ぷ鳎詫?shí)現(xiàn)相同的結(jié)果,并記錄下他們所做的一切。

在經(jīng)過精心編輯和正式確定之后,我們將提供詳細(xì)的說明來幫助每一位缺乏經(jīng)驗(yàn)或低技能的工人取得成功,并做出優(yōu)秀的工作業(yè)績。

與人類一樣,通過簡(jiǎn)化或拆分任務(wù)來減少任務(wù)的認(rèn)知難度至關(guān)重要。遵循簡(jiǎn)單的循序漸進(jìn)的指導(dǎo)比冗長復(fù)雜的程序更直接。

在這個(gè)過程中,我們識(shí)別出隱藏于其中的隱式認(rèn)知“跳躍”——專家們采取的小而無意識(shí)的步驟,這些步驟會(huì)顯著影響結(jié)果。這些微妙的、無意識(shí)的、往往不言而喻的假設(shè)或決定會(huì)對(duì)最終結(jié)果產(chǎn)生重大影響。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

“隱式認(rèn)知跳躍”的一個(gè)例子

假設(shè)我們想為SQL分析師建模。我們將首先采訪他們,并問他們幾個(gè)問題,例如:

  • 當(dāng)要求你分析一個(gè)業(yè)務(wù)問題時(shí),你會(huì)怎么做?
  • 你如何確保你的解決方案滿足要求?
  • <向受訪者反映我們所理解的過程>
  • 這能準(zhǔn)確地捕捉到你所理解的過程嗎<獲得更正>
  • 等等……

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

一個(gè)分析師所經(jīng)歷的認(rèn)知過程及對(duì)其進(jìn)行建模的舉例

隱式認(rèn)知過程呈現(xiàn)出多種形態(tài)和形式;一個(gè)典型的例子是“特定領(lǐng)域的定義”。例如,“暢銷書”可能是我們領(lǐng)域?qū)<业囊粋€(gè)突出術(shù)語,而不是其他所有人都了解的術(shù)語。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

在我們的SQL分析示例中擴(kuò)展隱式認(rèn)知過程

最終,我們將獲得一個(gè)完整的SOP“配方”,讓我們能夠模仿我們表現(xiàn)最佳的分析師。

在繪制這些復(fù)雜的過程時(shí),將其可視化為圖形可能會(huì)有所幫助。當(dāng)整個(gè)過程微妙且涉及許多步驟、條件和拆分時(shí),這尤其有用。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

圖形形式顯示的“SQL Analyst SOP”包括所有必需的技術(shù)步驟

我們的最終解決方案應(yīng)該模仿SOP中定義的步驟。在此階段,請(qǐng)盡量忽略最終的實(shí)現(xiàn)部分。稍后,你可以在整個(gè)解決方案中的一個(gè)或多個(gè)步驟/鏈上實(shí)現(xiàn)它。

與其他原則不同,認(rèn)知建模(SOP寫作)是唯一獨(dú)立的過程。強(qiáng)烈建議你在編寫代碼之前先對(duì)流程進(jìn)行建模。話雖如此,在實(shí)施它的同時(shí),你可能會(huì)根據(jù)你獲得的新見解或理解來加以改變。

現(xiàn)在,我們了解了創(chuàng)建一個(gè)定義良好的SOP的重要性,該SOP指導(dǎo)我們對(duì)問題的業(yè)務(wù)理解,讓我們探索如何使用各種工程技術(shù)有效地實(shí)施它。

2.工程技術(shù)

工程技術(shù)可幫助你實(shí)際實(shí)施SOP并充分利用模型。在考慮工程技術(shù)原則時(shí),我們應(yīng)該考慮工具箱中的哪些工具(技術(shù))可以幫助我們實(shí)施和塑造我們的SOP,并幫助模型實(shí)現(xiàn)與我們進(jìn)行良好的溝通。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

工程技術(shù)原理示意圖

值得注意的是,一些工程技術(shù)僅在提示層中實(shí)現(xiàn),而許多技術(shù)需要軟件層才能有效,還有些技術(shù)需要將兩層結(jié)合在一起。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

工程技術(shù)層架構(gòu)

雖然幾乎每天工程技術(shù)人員都會(huì)發(fā)現(xiàn)與發(fā)明一些細(xì)微差別和技術(shù)改進(jìn),在此我將介紹兩種主要技術(shù):工作流/鏈和代理。

(1)LLM原生架構(gòu)(又名“流工程”或“鏈”)

LLM原生架構(gòu)描述了應(yīng)用程序?yàn)樯扇蝿?wù)結(jié)果而經(jīng)歷的代理執(zhí)行流程。

我們流程中的每一步都是一個(gè)獨(dú)立的過程,必須發(fā)生該過程才能完成我們的任務(wù)。其中,一些步驟將會(huì)以簡(jiǎn)單的確定性代碼方式執(zhí)行;而對(duì)于另外某些步驟,我們會(huì)使用LLM(代理)方式來執(zhí)行。

為此,我們可以進(jìn)一步反思我們繪制的標(biāo)準(zhǔn)操作程序(SOP)并思考如下問題:

  • 我們應(yīng)該將哪些SOP步驟分配到同一代理上?作為不同的代理,我們應(yīng)該采取哪些步驟?
  • 哪些SOP步驟應(yīng)該以獨(dú)立的方式執(zhí)行(但它們可能會(huì)收到之前步驟的信息)?
  • 在確定性代碼執(zhí)行方式中,我們可以執(zhí)行哪些SOP步驟?
  • 等等……

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

一個(gè)基于給定SOP的“維基百科作者”應(yīng)用的LLM原生架構(gòu)示例

在分析我們前面所給出的架構(gòu)/圖的下一個(gè)步驟之前,我們首先定義此步驟的關(guān)鍵屬性:

輸入和輸出——這一步驟的特征是什么?在我們采取行動(dòng)之前需要準(zhǔn)備些什么?(這也可以作為代理的輸出格式)

  • 質(zhì)量保證——是什么讓響應(yīng)“足夠好”?是否有需要人為干預(yù)的情況?我們可以配置哪些類型的斷言?
  • 自主水平——我們需要對(duì)結(jié)果的質(zhì)量進(jìn)行多少控制?這個(gè)階段可以處理哪些用例?換句話說,在這一點(diǎn)上,我們能在多大程度上相信模型能夠獨(dú)立工作?
  • 觸發(fā)器——下一步驟是什么?下一步驟的定義是什么?
  • 非功能性——所需的延遲是多少?我們需要特殊的業(yè)務(wù)監(jiān)控嗎?
  • 故障轉(zhuǎn)移控制——可能發(fā)生哪些類型的故障(系統(tǒng)性和代理性)?我們的退路是什么?
  • 狀態(tài)管理——我們需要一個(gè)特殊的狀態(tài)管理機(jī)制嗎?我們?nèi)绾螜z索/保存狀態(tài)(定義索引鍵)?我們需要持久性存儲(chǔ)嗎?這種狀態(tài)的不同用法是什么(例如緩存、日志記錄等)?
  • 等等……

(2)什么是代理?

LLM代理是LLM原生架構(gòu)中的一個(gè)獨(dú)立組件,其中會(huì)涉及到LLM調(diào)用。

這里給出的僅是LLM用法的一個(gè)實(shí)例,其中的提示將包含上下文內(nèi)容。并非所有代理都是同樣的執(zhí)行方式——有些會(huì)借助現(xiàn)成的“工具”執(zhí)行,有些則不會(huì),還有些可能在流程中“只使用一次”,而另一些則可能攜帶之前的輸入和輸出信息被遞歸調(diào)用或多次調(diào)用。

借助現(xiàn)成“工具”執(zhí)行的代理

一些LLM代理可以使用現(xiàn)成的“工具”,這些工具其實(shí)是一些用于計(jì)算或網(wǎng)絡(luò)搜索等任務(wù)的預(yù)定義函數(shù)。代理輸出指令,這些指令指定應(yīng)用程序執(zhí)行的工具和輸入數(shù)據(jù),并將最終執(zhí)行結(jié)果返回給代理。

為了理解這個(gè)概念,讓我們來看一個(gè)簡(jiǎn)單的工具調(diào)用的提示實(shí)現(xiàn)。這種實(shí)現(xiàn)方案甚至可以用于未經(jīng)過原生訓(xùn)練的調(diào)用工具的模型:

You are an assistant with access to these tools:
- calculate(expression: str) -> str - calculate a mathematical 
expression
- search(query: str) -> str - search for an item in the inventory
Given an input, Respond with a YAML with keys: `func`(str) and 
`arguments`(map) or `message`(str).Given input

區(qū)分具有工具的代理(因此是自主代理)和其輸出可以導(dǎo)致執(zhí)行某一動(dòng)作的代理是非常重要的。

“自主代理是能夠生成完成任務(wù)的方法的代理。”

自主代理有權(quán)決定是否采取行動(dòng)以及采取何種行動(dòng)。相比之下,一個(gè)(非自主)代理只是“處理”我們的請(qǐng)求(例如分類)。基于這個(gè)過程,我們的確定性代碼執(zhí)行一個(gè)動(dòng)作,而模型對(duì)此沒有控制權(quán)。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

自主代理與觸發(fā)動(dòng)作的代理比較

隨著我們?cè)黾哟碓谝?guī)劃和執(zhí)行任務(wù)方面的自主權(quán),我們?cè)鰪?qiáng)了其決策能力,但可能會(huì)降低對(duì)輸出質(zhì)量的控制。雖然這看起來像是一個(gè)讓它更“智能”或“先進(jìn)”的神奇解決方案,但這也伴隨著會(huì)失去對(duì)質(zhì)量控制的代價(jià)。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

自主代理的利弊權(quán)衡

值得注意的是,要警惕完全自主代理的誘惑。雖然它們的架構(gòu)可能看起來很吸引人,也更簡(jiǎn)單,但將其用于一切(或作為最初的PoC)可能會(huì)對(duì)“實(shí)際生產(chǎn)”情況產(chǎn)生很大的欺騙作用。另外,自主代理難以調(diào)試且不可預(yù)測(cè)(響應(yīng)質(zhì)量不穩(wěn)定),這使得它們無法用于生產(chǎn)。

目前,代理(沒有隱含的指導(dǎo))還不太擅長規(guī)劃復(fù)雜的流程,通常會(huì)跳過關(guān)鍵步驟。例如,在我們的“維基百科作者”應(yīng)用示例中,它們只會(huì)開始寫作,跳過系統(tǒng)化的過程。這使得代理(尤其是自主代理)僅與模型一樣好,或者更準(zhǔn)確地說,僅與它們相對(duì)于你的任務(wù)所訓(xùn)練的數(shù)據(jù)一樣好。

與其讓代理(或一群代理)自由地以端到端方式完成所有事情,不如嘗試將它們的任務(wù)限制在需要這種敏捷性或創(chuàng)造力的流程/SOP的特定區(qū)域。這可以產(chǎn)生更高質(zhì)量的結(jié)果,因?yàn)槟憧梢酝瑫r(shí)享受這兩個(gè)世界。

一個(gè)很好的例子是AlphaCodium(https://www.codium.ai/blog/alphacodium-state-of-the-art-code-generation-for-code-contests/):通過將結(jié)構(gòu)化流與不同的代理(包括一個(gè)負(fù)責(zé)以迭代方式編寫和測(cè)試代碼的新型代理)相結(jié)合,它們提高了在CodeContest上GPT-4的準(zhǔn)確性(pass@5),其準(zhǔn)確率從19%上升到44%。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

AlphaSodium的LLM架構(gòu)

雖然工程技術(shù)為實(shí)施我們的SOP和優(yōu)化LLM原生應(yīng)用程序奠定了基礎(chǔ),但我們還必須仔細(xì)考慮LLM三角原則的另一個(gè)關(guān)鍵組成部分:模型本身。

3.模型

我們選擇的模型是我們項(xiàng)目成功的關(guān)鍵組成部分。在這一方面,選擇使用大型模型(如GPT-4或Claude Opus)可能會(huì)產(chǎn)生更好的結(jié)果,但相當(dāng)昂貴,而較小的模型可能不那么“聰明”,但有助于資金預(yù)算。在思考模型原則這一方面時(shí),我們應(yīng)該著眼于確定我們的約束和目標(biāo),以及什么樣的模型可以幫助我們實(shí)現(xiàn)它們。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

模型原理

“并非所有LLM都是一樣的;因此,請(qǐng)將選定的模型與要完成的任務(wù)相匹配即可。”

事實(shí)上,我們并不總是需要最大的模型;這取決于任務(wù)。為了找到正確的匹配,我們必須有一個(gè)實(shí)驗(yàn)過程,并嘗試我們解決方案的多種不同版本。

不妨先讓我們來看一個(gè)“缺乏經(jīng)驗(yàn)的工人”的類比,這將會(huì)對(duì)作出決定有所幫助。例如,一個(gè)擁有許多學(xué)歷的非常“聰明”的工人可能很容易在某些任務(wù)中取得成功。盡管如此,他們可能對(duì)這份工作有些資歷過高;因此,雇傭一個(gè)“更便宜”的候選工人將更具成本效益。

在考慮模型時(shí),我們應(yīng)該根據(jù)我們?cè)敢獠扇〉臋?quán)衡來定義和比較解決方案:

  • 任務(wù)復(fù)雜性——較簡(jiǎn)單的任務(wù)(如摘要)更容易用較小的模型完成,而推理通常需要較大的模型。
  • 推理基礎(chǔ)設(shè)施——它應(yīng)該在云端還是邊緣設(shè)備上運(yùn)行?模型大小可能會(huì)影響小型手機(jī),但云服務(wù)可以容忍。
  • 定價(jià)——我們能容忍什么價(jià)格?考慮到業(yè)務(wù)影響和預(yù)期使用情況,它是否具有成本效益?
  • 延遲——隨著模型變大,延遲也會(huì)變大。
  • 標(biāo)記數(shù)據(jù)——我們是否有可以立即使用的數(shù)據(jù),用未經(jīng)訓(xùn)練的樣本或相關(guān)信息來豐富模型?

在許多情況下,在你擁有“內(nèi)部專業(yè)知識(shí)”之前,為經(jīng)驗(yàn)豐富的員工支付一點(diǎn)額外費(fèi)用是有幫助的——LLM也是如此。

如果你沒有標(biāo)定好的數(shù)據(jù),那么建議你從一個(gè)更強(qiáng)大(更大)的模型開始,收集數(shù)據(jù),然后利用它通過一些小樣本或微調(diào)來增強(qiáng)模型的能力。

(1)微調(diào)模型

在對(duì)模型進(jìn)行微調(diào)之前,你必須考慮幾個(gè)方面:

  • 隱私——你的數(shù)據(jù)可能包括必須從模型中保留的私人信息。如果你的數(shù)據(jù)包含私人信息,你必須首先匿名處理你的數(shù)據(jù)以避免法律責(zé)任。
  • 法律、合規(guī)性和數(shù)據(jù)權(quán)利——在訓(xùn)練模型時(shí)可能會(huì)提出一些法律問題。例如,OpenAI使用條款政策阻止你在沒有OpenAI的情況下使用生成的響應(yīng)來訓(xùn)練模型。另一個(gè)典型的例子是遵守GDPR(即《?通用數(shù)據(jù)保護(hù)條例》,是?歐盟的一項(xiàng)重要法律,旨在保護(hù)歐盟境內(nèi)個(gè)人的數(shù)據(jù)隱私和安全)的法律,該法律要求“撤銷權(quán)”,用戶可以要求公司從系統(tǒng)中刪除信息。這引發(fā)了關(guān)于該模型是否應(yīng)該重新訓(xùn)練的法律問題。
  • 更新延遲——在訓(xùn)練一個(gè)模型時(shí),延遲(或數(shù)據(jù)截止)時(shí)間要比預(yù)計(jì)高得多。與通過上下文嵌入新信息不同(見下面的“上下文數(shù)據(jù)”一節(jié))——這種方式能夠提供即時(shí)延遲。訓(xùn)練模型則是一個(gè)漫長的過程,需要大量時(shí)間。因此,模型的再訓(xùn)練往往很少被采用。
  • 開發(fā)和操作——在持續(xù)評(píng)估結(jié)果性能的同時(shí),實(shí)施可重復(fù)、可擴(kuò)展和可監(jiān)控的微調(diào)流程至關(guān)重要。這個(gè)復(fù)雜的過程需要持續(xù)的維護(hù)。
  • 成本——再訓(xùn)練因其復(fù)雜性和每次訓(xùn)練所需的高強(qiáng)度資源(GPU)而被認(rèn)為是昂貴的。

LLM作為上下文學(xué)習(xí)者的能力,以及新模型支持更大的上下文窗口的事實(shí),極大地簡(jiǎn)化了我們的實(shí)現(xiàn);因此,即使沒有微調(diào),也能提供出色的結(jié)果。然而,由于微調(diào)的復(fù)雜性,建議將其作為最后手段或完全跳過。

相反,對(duì)特定任務(wù)(例如結(jié)構(gòu)化JSON輸出)或特定領(lǐng)域語言的模型進(jìn)行微調(diào)可能是非常高效的。一個(gè)小型的、特定于任務(wù)的模型可能非常有效,并且在推理方面比大型LLM便宜得多。但無論如何,確保明智地選擇你的解決方案,并在升級(jí)到LLM訓(xùn)練之前評(píng)估所有相關(guān)考慮因素。請(qǐng)牢記:

“即使是最強(qiáng)大的模型也需要相關(guān)且結(jié)構(gòu)良好的上下文數(shù)據(jù)才能發(fā)光。”

4.上下文數(shù)據(jù)

LLM是上下文情境學(xué)習(xí)者。這意味著,通過提供特定任務(wù)的信息,LLM代理可以幫助我們?cè)跊]有特殊訓(xùn)練或微調(diào)的情況下執(zhí)行它。這使我們能夠輕松地“講授”新知識(shí)或技能。在考慮上下文數(shù)據(jù)原則時(shí),我們應(yīng)該致力于組織和建模可用數(shù)據(jù),以及如何在提示中組合數(shù)據(jù)。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

上下文數(shù)據(jù)原則

為了構(gòu)建我們的上下文,我們需要在發(fā)送給LLM的提示中包含相關(guān)的(上下文)信息。歸納來看,我們可以使用兩種上下文:

  • 嵌入式上下文——作為提示的一部分提供的嵌入式信息。
You are the helpful assistant of , a at

  • 附件上下文——提示開始/結(jié)束時(shí)粘合的信息塊列表
Summarize the provided emails while keeping a friendly tone.
---

<email_0>
<email_1>

上下文通常使用“提示模板”來實(shí)現(xiàn)(例如jinja2或mustache,或者只是原生格式化文字字符串)。通過這種方式,我們便可以優(yōu)雅地組合它們,同時(shí)保持提示信息的精髓:

# Embedded context with an attachment context
prompt = f"""
You are the helpful assistant of {name}. {name} is a {role} at {company}.

Help me write a {tone} response to the attached email.
Always sign your email with:
{signature}

---

{email}
"""

(1)小樣本學(xué)習(xí)

小樣本學(xué)習(xí)是一種通過示例“教導(dǎo)”LLM而不需要大量微調(diào)的強(qiáng)大方法。在提示中提供一些代表性示例可以指導(dǎo)模型理解所需的格式、風(fēng)格或任務(wù)。

例如,如果我們希望LLM生成電子郵件回復(fù),我們可以在提示中包含一些寫得很好的回復(fù)示例。這有助于模型學(xué)習(xí)首選的結(jié)構(gòu)和音調(diào)。

我們可以使用不同的例子來幫助模型捕捉不同的極端情況或細(xì)微差別,并從中學(xué)習(xí)。因此,必須包含各種樣本示例,以涵蓋應(yīng)用程序可能遇到的一系列場(chǎng)景。

隨著應(yīng)用程序的增長,你可以考慮實(shí)現(xiàn)“動(dòng)態(tài)小樣本(https://arxiv.org/abs/1804.09458)”,這涉及以編程方式為每個(gè)輸入選擇最相關(guān)的示例。雖然它增加了你的實(shí)現(xiàn)方案的復(fù)雜性,但它確保了模型在每種情況下都能得到最合適的指導(dǎo),從而有助于顯著提高各種任務(wù)的性能,而無需進(jìn)行昂貴的微調(diào)。

(2)檢索增強(qiáng)生成

檢索增強(qiáng)生成(RAG:https://www.promptingguide.ai/techniques/rag)是一種在生成響應(yīng)之前為其他上下文檢索相關(guān)文檔的技術(shù)。這就像讓LLM快速瀏覽特定的參考資料,以便幫助提供需要的答案一樣。這種技術(shù)可以使響應(yīng)保持最新和真實(shí),而無需重新訓(xùn)練模型。

例如,在開發(fā)支持聊天機(jī)器人應(yīng)用程序時(shí),RAG可以提取相關(guān)的維基頁面幫助,以告知LLM相關(guān)的答案。

這種方法通過將反應(yīng)建立在檢索到的事實(shí)基礎(chǔ)上,幫助LLM保持最新狀態(tài)并減少虛幻的信息。RAG對(duì)于需要更新的或?qū)I(yè)化的知識(shí)而無需重新訓(xùn)練整個(gè)模型的任務(wù)特別方便。

例如,假設(shè)我們正在為我們的產(chǎn)品構(gòu)建一個(gè)支持聊天。在這種情況下,我們可以使用RAG從我們的維基幫助中檢索相關(guān)文檔,然后將其提供給LLM代理,并要求其根據(jù)問題撰寫答案并提供文檔。

在實(shí)施RAG時(shí),有三個(gè)關(guān)鍵部分需要注意:

  • 檢索機(jī)制——雖然RAG的傳統(tǒng)實(shí)現(xiàn)涉及使用向量相似性搜索檢索相關(guān)文檔,但有時(shí)使用基于關(guān)鍵字的搜索(如BM-25)等更簡(jiǎn)單的方法會(huì)更好或更便宜。
  • 索引數(shù)據(jù)結(jié)構(gòu)——在沒有預(yù)處理的情況下,對(duì)整個(gè)文檔進(jìn)行索引,可能會(huì)限制檢索過程的有效性。有時(shí),我們希望添加數(shù)據(jù)準(zhǔn)備步驟,例如根據(jù)文檔準(zhǔn)備問題和答案列表。
  • 元數(shù)據(jù)——存儲(chǔ)相關(guān)元數(shù)據(jù)可以更有效地引用和過濾信息(例如,將維基頁面縮小到僅與用戶特定產(chǎn)品查詢相關(guān)的頁面)。這個(gè)額外的數(shù)據(jù)層簡(jiǎn)化了檢索過程。

(3)提供相關(guān)背景

與你的代理相關(guān)的上下文信息可能會(huì)有所不同。雖然這似乎是有益的,但為模型(就好似一位“非技術(shù)工人”)提供過多的信息可能會(huì)讓它不知所措。理論上,這會(huì)導(dǎo)致模型學(xué)習(xí)不相關(guān)的信息(或令牌連接),這可能會(huì)導(dǎo)致混淆和幻覺(https://en.wikipedia.org/wiki/Hallucination_(artificial_intelligence))。

例如,當(dāng)模型Gemini 1.5作為LLM發(fā)布并投入使用時(shí),可以處理多達(dá)1000萬個(gè)符號(hào),這導(dǎo)致一些從業(yè)者質(zhì)疑上下文是否仍然是一個(gè)問題。雖然這是一項(xiàng)了不起的成就,特別是對(duì)于某些特定場(chǎng)景應(yīng)用(如與PDF聊天),但它仍然有限,尤其是在推理各種文檔時(shí)。

因此,濃縮一下提示信息并僅向LLM代理提供相關(guān)的信息至關(guān)重要。這降低了模型在無關(guān)符號(hào)上的處理能力,提高了質(zhì)量,優(yōu)化了延遲,并降低了成本。

當(dāng)然,已經(jīng)有許多技巧可以提高所提供上下文的相關(guān)性,其中大多數(shù)與你如何存儲(chǔ)和編目數(shù)據(jù)有關(guān)。

例如,對(duì)于RAG應(yīng)用程序來說,添加一個(gè)數(shù)據(jù)準(zhǔn)備來格式化一下你存儲(chǔ)的信息是很方便的(例如,基于文檔的問題和答案,然后只向LLM代理提供答案;這樣,代理就可以獲得一個(gè)總結(jié)和更短的上下文),并在檢索到的文檔上使用重新排序算法來優(yōu)化結(jié)果。

“數(shù)據(jù)為LLM原生應(yīng)用程序的引擎提供動(dòng)力。因此,上下文數(shù)據(jù)的有效性戰(zhàn)略設(shè)計(jì)會(huì)有助于更高效地釋放它們的真正潛力。”

結(jié)論

LLM三角原則提供了一種結(jié)構(gòu)化的方法來開發(fā)高質(zhì)量的LLM原生應(yīng)用程序,它有助于縮短應(yīng)用LLM的巨大潛力和現(xiàn)實(shí)世界實(shí)施面臨的挑戰(zhàn)之間的差距。開發(fā)人員可以通過專注于3+1關(guān)鍵原則(模型、工程技術(shù)和上下文數(shù)據(jù))來創(chuàng)建更可靠、更有效的LLM驅(qū)動(dòng)的解決方案,所有這些原則都以明確的SOP為指導(dǎo)。

構(gòu)建可靠AI應(yīng)用的LLM三角原則-AI.x社區(qū)

LLM三角原則

關(guān)鍵點(diǎn)歸納

從一個(gè)明確的SOP開始:模擬你的專家的認(rèn)知過程,為你的LLM應(yīng)用程序創(chuàng)建一個(gè)循序漸進(jìn)的指南。在思考其他原則時(shí),將其作為根本指南。

  • 選擇正確的模型:在能力和成本之間取得平衡,并考慮從較大的模型開始,然后再考慮轉(zhuǎn)向較小、微調(diào)的模型。
  • 利用工程技術(shù):實(shí)施LLM原生架構(gòu),并戰(zhàn)略性地使用代理來優(yōu)化性能和保持控制。嘗試不同的提示技巧,為你的應(yīng)用場(chǎng)景找到最有效的提示。
  • 提供相關(guān)上下文:在適當(dāng)?shù)那闆r下,在上下文學(xué)習(xí)中使用,包括RAG技術(shù),但要警惕切莫讓不相關(guān)的信息淹沒了模型。
  • 迭代和實(shí)驗(yàn):找到正確的解決方案通常需要不斷地測(cè)試和改進(jìn)你的工作。為此,我建議你閱讀和實(shí)施文章《構(gòu)建LLM應(yīng)用程序:清晰的步驟指南》(https://towardsdatascience.com/building-llm-apps-a-clear-step-by-step-guide-1fe1e6ef60fd)”中強(qiáng)調(diào)的有關(guān)技巧,以獲得詳細(xì)的LLM原生開發(fā)過程指南。

通過應(yīng)用LLM三角原則,開發(fā)公司就可以超越簡(jiǎn)單的概念驗(yàn)證,開發(fā)出強(qiáng)大的、可用于實(shí)戰(zhàn)型的LLM應(yīng)用程序,從而真正利用這項(xiàng)變革性技術(shù)的力量。

譯者介紹

朱先忠,51CTO社區(qū)編輯,51CTO專家博客、講師,濰坊一所高校計(jì)算機(jī)教師,自由編程界老兵一枚。

原文標(biāo)題:The LLM Triangle Principles to Architect Reliable AI Apps,作者:Almog Baku

鏈接:https://towardsdatascience.com/the-llm-triangle-principles-to-architect-reliable-ai-apps-d3753dd8542e。


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
av在线免费看片| 好吊色欧美一区二区三区 | 揄拍成人国产精品视频| 中文字幕 91| 国精一区二区三区| 国产午夜精品一区二区| 亚洲va男人天堂| 国产又黄又猛又粗又爽| 91蜜臀精品国产自偷在线| 精品久久一区二区三区| 亚洲 中文字幕 日韩 无码| www.欧美日本韩国| 久久久午夜精品| 97超级碰碰| 国产成人自拍偷拍| 一区在线观看| 最近日韩中文字幕中文| 日韩精品视频免费| 久久久久久久久久久成人| 污污内射在线观看一区二区少妇| 在线天堂资源www在线污| 久久国产高清视频| 亚洲女人毛茸茸高潮| 中文av在线全新| 亚洲日本在线视频观看| 久久综合精品一区| 国产福利资源在线| 日本va欧美va精品| 668精品在线视频| 人妻人人澡人人添人人爽| 网友自拍一区| 精品美女被调教视频大全网站| 欧美成人免费高清视频| 草莓视频丝瓜在线观看丝瓜18| 国产精品久久毛片| 欧洲久久久久久| 人妻精品一区一区三区蜜桃91 | 欧美日韩福利在线| 国产精品实拍| 中文字幕av一区 二区| 欧美精品尤物在线| 波多野结衣国产精品| 青青草视频在线免费观看| 国产成人午夜片在线观看高清观看| 国产精品久久久久不卡| 国产微拍精品一区| 99精品国产一区二区青青牛奶| 久久躁日日躁aaaaxxxx| x88av在线| 要久久爱电视剧全集完整观看| 欧美成人一区二区三区| 91日韩精品视频| 亚洲欧美专区| 欧美肥妇毛茸茸| av五月天在线| 亚洲日本在线观看视频| 色系网站成人免费| 欧美日韩大尺度| 丝袜美腿一区| 在线观看欧美黄色| 成人精品视频一区二区| 国产不卡人人| 欧美性猛交视频| 成人小视频在线看| 日韩美女在线看免费观看| 91国内精品野花午夜精品| 国产a视频免费观看| 欧美123区| 在线观看免费一区| 五月天婷婷影视| 九九99久久精品在免费线bt| 日韩欧美一二三区| 欧美激情 亚洲| 天天躁日日躁狠狠躁欧美巨大小说| 亚洲精品久久久久久久久久久久| 欲求不满的岳中文字幕| 精品影片在线观看的网站| 国产一级揄自揄精品视频| 精品在线观看一区| 欧美国产免费| 性色av一区二区三区在线观看| 六月丁香在线视频| 日韩电影在线观看网站| 91热精品视频| 日韩中文字幕影院| 国产午夜精品一区二区 | 初高中福利视频网站| 第四色在线一区二区| 亚洲欧洲一区二区三区久久| 国产视频精品免费| 亚洲天堂激情| 国产精品高潮在线| 国产伦精品一区二区三区免.费| 国产福利一区二区三区在线视频| 久久久综合香蕉尹人综合网| 日本在线看片免费人成视1000| 亚洲激情图片小说视频| 欧美在线观看成人| 日日夜夜亚洲精品| 亚洲成年人在线播放| 亚洲精品成人无码| 午夜性色一区二区三区免费视频| 欧美在线视频播放| 国产欧美久久久| 91免费观看视频| 日韩国产精品毛片| 成人免费网站视频| 日韩欧美国产综合| 美国一级黄色录像| 99精品国产在热久久婷婷| 国产精品一二三在线| 少妇高潮久久久| 亚洲欧美日本韩国| 久久久久久三级| 色婷婷综合久久久久久| 欧美插天视频在线播放| 五月婷婷丁香在线| 99精品视频在线播放观看| 亚洲免费久久| 丁香六月综合| 亚洲国产欧美一区二区三区同亚洲| av最新在线观看| 日韩在线一区二区三区| 国产无套精品一区二区| 中文字幕有码在线视频| 欧美日韩亚州综合| 97伦伦午夜电影理伦片| 亚洲无毛电影| 亚洲综合最新在线| 91欧美在线视频| 一本大道av伊人久久综合| 日韩女优在线视频| 午夜日韩电影| 99理论电影网| 欧美xxxx免费虐| 欧美一卡2卡三卡4卡5免费| 天美传媒免费在线观看| 日韩av在线免费观看不卡| 久久国产日韩欧美| 极品在线视频| 欧美va在线播放| 在线观看成人毛片| 国产电影精品久久禁18| 亚洲av综合色区| 亚洲高清影院| 久久久精品一区| 99热这里只有精品5| 亚洲欧洲av在线| 911福利视频| 99九九热只有国产精品| 99久久er热在这里只有精品66| 欧美艳星brazzers| 日韩av手机在线播放| 欧美日韩国产高清| 国产精品二区三区| 超碰资源在线| 日韩国产在线播放| 天堂网中文字幕| 久久久九九九九| 免费涩涩18网站入口| 精品视频网站| 国产精品视频永久免费播放| 福利在线播放| 7777精品伊人久久久大香线蕉超级流畅| 成年人看的免费视频| 麻豆国产一区二区| 欧洲金发美女大战黑人| 极品一区美女高清| 日韩免费观看网站| 免费高清在线观看| 欧美mv日韩mv亚洲| 51国产偷自视频区视频| 欧美国产一区在线| 99999精品| 国产情侣一区| 日韩精品欧美在线| 日本精品国产| 57pao成人永久免费视频| 国产日本在线| 91精品国产综合久久久久| 国产在线拍揄自揄拍无码视频| www.亚洲免费av| 老司机午夜av| 欧美精选一区| 蜜桃臀一区二区三区| 日韩成人精品一区二区三区| 欧美精品videos性欧美| 三级在线观看| 91麻豆精品国产91久久久资源速度| 久久久全国免费视频| 久久免费午夜影院| 原创真实夫妻啪啪av| 每日更新成人在线视频| 超碰超碰超碰超碰超碰| 国产精品午夜一区二区三区| 成人福利网站在线观看| av在线播放资源| 最近2019中文字幕一页二页| 亚洲精品成av人片天堂无码| 在线欧美日韩国产| 久热精品在线观看| 国产精品美女一区二区| 欧美熟妇精品一区二区蜜桃视频| 男人的j进女人的j一区| av片在线免费| 91久久夜色精品国产按摩| 精品久久久三级| 美女国产精品久久久| 国产精品av在线播放| 免费在线观看av电影| 中文字幕成人在线| 嫩草精品影院| 精品国产伦一区二区三区免费 | 欧美尤物美女在线| 日韩精品视频免费| 亚洲成人黄色片| 欧美日韩成人一区| 波多野结衣视频在线观看| 一区二区理论电影在线观看| 天天干天天操天天拍| 91视频免费播放| 久久久无码人妻精品无码| 久久99精品久久久久久动态图| 久久网站免费视频| 狠狠干成人综合网| 99久久久精品视频| 午夜精品视频| 大陆极品少妇内射aaaaaa| 久久精品国产大片免费观看| 日本一区二区三区四区在线观看 | 欧美性suv| 91国产高清在线| 黑人精品视频| 欧美日韩国产成人在线| av在线下载| 丝袜亚洲另类欧美重口| a黄色在线观看| 亚洲色图第一页| 国产精品一区二区三区四区色 | 免费大片黄在线观看视频网站| 亚洲视频在线看| 国产在线三区| 亚洲午夜性刺激影院| 欧美美女色图| 伊人av综合网| 91在线看黄| www.久久久久久.com| 欧美成人精品一区二区男人看| 色噜噜狠狠色综合网图区| 一级毛片视频在线观看| 中国china体内裑精亚洲片| 成人性爱视频在线观看| 一区二区三区视频免费在线观看| 国产免费a∨片在线观看不卡| 原创国产精品91| 亚洲1卡2卡3卡4卡乱码精品| 日韩中文字在线| h片在线播放| 久久免费成人精品视频| www.超碰在线| 日韩av电影国产| 成人福利一区二区| 亚洲一区二区中文字幕| 91精品久久久久久综合五月天| 成人欧美视频在线| 农村少妇一区二区三区四区五区| 鲁丝片一区二区三区| 国产影视一区| 一区二区三区欧美在线| 在线看片不卡| 99在线精品免费视频| 香蕉国产精品偷在线观看不卡| 少妇高清精品毛片在线视频 | 国产女人在线观看| 久久久精品视频成人| 少女频道在线观看高清 | 欧美成人免费全部网站| 91精品视频大全| 国产精品黄网站| 日本精品一区二区三区视频| 91麻豆精品国产91久久久平台| 中文字幕日韩精品无码内射| 国产亚洲一区在线| 爱爱爱爱免费视频| 成人激情av网| 国产精品酒店视频| 亚洲午夜三级在线| 五月激情丁香网| 精品国产91久久久久久久妲己| 视频二区在线| 欧美精品在线第一页| 午夜影院在线播放| 成人久久一区二区| 欧美亚洲国产日韩| 熟妇熟女乱妇乱女网站| 亚洲作爱视频| 亚洲国产综合av| 久久久精品免费观看| 久操视频免费在线观看| 91国模大尺度私拍在线视频| 亚洲男女视频在线观看| 亚洲丝袜一区在线| av有码在线观看| 成人在线激情视频| 精品国产一区二区三区噜噜噜| 17c丨国产丨精品视频| 日韩成人精品在线| wwwxxxx在线观看| 国产亚洲欧美日韩在线一区| 国产精品第二十页| 欧美一区二区视频在线观看2020| 黄色av免费在线看| 97成人精品视频在线观看| 亚洲三级av| 日本黄色播放器| 日韩电影一二三区| 免费a级黄色片| 亚洲自拍偷拍av| 999久久久久久| 在线电影av不卡网址| 免费看男女www网站入口在线| 99精品国产一区二区| 91久久夜色精品国产按摩| 久久久精品三级| 国产亚洲欧美一级| 丰满人妻老熟妇伦人精品| 亚洲激情自拍图| 91破解版在线观看| 国产高清精品一区二区| 欧美激情1区2区| 原创真实夫妻啪啪av| 亚洲欧美日韩国产综合在线| 欧美 亚洲 另类 激情 另类| 精品小视频在线| 樱花草涩涩www在线播放| 国产精品免费在线 | 久久久中文字幕| 一本色道69色精品综合久久| 国产成年人在线观看| 久久超碰97中文字幕| 国精产品久拍自产在线网站| 精品视频在线免费看| 成年人视频在线免费观看| 国产成人亚洲精品| 国模吧精品视频| 天天影视综合色| 中文字幕欧美国产| 一级片在线观看视频| 久久精品国产一区二区三区| 色综合久久久| 男人j进女人j| 丁香激情综合五月| 国产成人无码精品久久久久| 亚洲激情视频在线| 成人香蕉视频| 亚洲精品一区二区三区蜜桃久| 免费看日韩精品| 国精产品视频一二二区| 91超碰这里只有精品国产| 亚洲欧美成人影院| 狠狠干一区二区| 久久亚洲风情| 美女网站视频色| 日韩三级免费观看| 国模私拍视频在线播放| 欧美二区三区在线| 另类调教123区| 久草视频免费在线播放| 日韩电影免费观看在线观看| 午夜欧美巨大性欧美巨大 | 亚洲高清在线| 人妻精品久久久久中文字幕| 欧美亚洲综合在线| 中文av资源在线| 欧美激情第一页在线观看| 麻豆极品一区二区三区| 久久久久亚洲av无码专区| 亚洲欧美日韩在线一区| 亚洲综合伊人| 波多野结衣之无限发射| 中文字幕成人av| www.com欧美| 国产精品69久久| 欧美在线影院| 最新中文字幕视频| 在线成人免费观看| 国产拍在线视频| 亚洲综合五月天| av一区二区三区| 91亚洲视频在线观看| 久久人人爽人人爽人人片av高清| 亚洲人成精品久久久| 日本r级电影在线观看| 一本色道**综合亚洲精品蜜桃冫| a毛片在线观看| 日韩欧美精品久久| av午夜一区麻豆| 国产乱码精品一区二区| 日韩免费观看av| 亚洲大片在线|