精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RePrompt:提示詞自動化優化策略 精華

發布于 2024-6-21 15:50
瀏覽
0收藏

1. 為什么要提出 RePrompt?

大語言模型問世后,在多項任務上取得成功,并且通過LLM智能體的研發,拓展了大語言模型在自動駕駛、機器人控制等更廣泛領域的應用。

但是這些應用的成功,都得益于提示工程的作用。不同的提示詞可以顯著影響任務的成功率,所以有人提出了APE(自動提示工程),可以使得大語言模型自動撰寫提示詞,相比簡單提示詞,找到更快找到更好的提示詞。

但是APE在收斂到高質量提示詞需要時間和計算資源,且當前應用框架存在局限,難以超越精心編寫的提示。LLMs在理解不同提示對自身的影響上,并不比人類更勝一籌。無法學習新發現的范式,而人類在嘗試如GPT-4或LLAMA-2等流行模型時,能不斷獲得編寫優質提示的新思路。LLMs在面對潛在失敗時,往往無法識別正確解決方案,僅對提示進行微小調整,而未能實現真正的改進。

所以作者提出了一種新的自動提示詞優化方法:RePrompt,結合了CoT(思維鏈)和 ReAct的實踐,并利用這些結果的對話歷史更新提示詞,通過總結并逐句優化對話歷史。RePrompt聚焦于使用LLM進行特定推理任務的場景,比如旅行規劃、輔助編程等。

2. RePrompt的工作原理

RePrompt是一種基于交互式動作生成的提示優化工具,與傳統的機器學習訓練過程相似,但訓練對象是輸入模型的提示詞,而非模型參數本身。

本文致力于通過優化提示來完善LLM代理的規劃能力。我們著眼于任務已知的LLM代理問題,以OpenAI的多樣GPT模型為例。我們提出的RePrompt方法,是一種基于交互式動作生成的提示優化工具,

RePrompt訓練需要一個小規模的推理任務數據集,首先讓LLM使用當前的提示生成回答。這個過程可能包括與反饋提供者如ReAct或Reflexion的交互,但不對交互方式或反饋的準確性設限,也稱之為行為循環。

收集到一批聊天歷史后,將這些歷史數據輸入LLM模型中,以提煉出最關鍵的焦點。這些焦點可能是頻繁出現并導致長迭代的問題,或者是有助于生成更好回答的特定建議(比如ReAct里的thought)。

要求總結團隊對不同情景進行提煉,去除特定情景信息和建議,同時避免過度總結,以免需要額外推理能力或在LLM對任務不夠擅長時引入錯誤。

與先前的自動提示工程工作相比,如APE和ProTeGi,通過批量總結來防止提示優化過程過度擬合到單一異常數據點上。

利用總結的典型錯誤,使用另一個LLM來更新實際提示,并要求優化器LLM在提出潛在解決方案時遵循以下規則:

? 改進應集中于通用提示部分,而非隨著數據變化的情景特定提示。

? 改進應優先識別特定問題是否出現在給定情景中。例如,如果存在預算限制,而歷史記錄顯示這可能是導致解決方案失敗的主要問題,那么在提供解決方案時,應嘗試使用工具計算典型計劃的成本。如果違反了預算約束,應優先考慮預算約束;否則,應忽略這個問題。

根據上面提到的原則,RePrompt的具體實現步驟如下:

? 1.針對問題提出幾種可能的解決方案。

? 2.逐一分析這些方案,找出最符合規則的那一個。

? 3.挑選出最佳方案。與APE及后續一些研究不同,不要求LLM給出句子的具體數值評估

? 4.剖析原提示中的原始步驟,判斷所選方案是否應前置于當前步驟,或該方案是否為步驟的具體細節,需要用方案替換當前步驟的提示。如果屬于步驟,在此添加提示。

? 5.輸出融合了原始提示和更新提示的最終版本。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

上圖是RePrompt算法的偽代碼實現。

完成這些步驟后,將獲得一個經過更新的提示,并可以繼續迭代,類似于機器學習模型訓練的更多輪次,直至提示收斂。這個收斂后的提示詞有助于提升首輪生成結果的質量。

在測試階段,只需應用這個經過收斂的更新提示,并在新的測試集上進行測試。測試時,不必要求與生成響應完全相同的流程,例如,如果反饋生成成本高昂,可以完全從行為環節中移除。

請注意,在優化過程中,RePrompt僅調整分步指導環節,而非問題描述或格式要求的其他部分。這將導致算法最終可能形成兩種提示格式:

? 如果當前提示類似ReAct風格,已包含分步指導,例如ReAct中的思考步驟,用以囊括所有潛在分析,我們的提示將通過不斷添加提示來更新這一思考步驟。與動態引入提示的其他提示工程相比,RePrompt 成為一個提供更具體分析焦點的算法。

? 如果提示是分步的,如解決數學或邏輯問題,RePrompt 很可能向計劃生成的程序中增加更多步驟。這將為規劃過程提供更明確的嘗試和關注方向,引導LLM得出正確答案,并充當將高級任務細化的規劃者。

盡管ICL(語境學習)對推理效果影響很大,但是如果每一步都更新示例會存在一些困難,所以RePrompt沒有對提示詞中的示例進行修改。而且示例一般是對LLM的輸出格式、相關能力的指導,而不是如何給出具體的分步提示,所以作者也沒有發現不更新這些示例帶來的任何實際問題。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

上圖提示詞提取優化提示的損失值。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

上圖提示詞用于在優化后的提示中定位并修正占位符。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

3. 局限性

RePrompt 并不一定每次都能成功創建更優質的提示。作者列舉了常見的幾類錯誤:

3.1 不完整的提示詞

RePrompt:提示詞自動化優化策略-AI.x社區圖片

RePrompt 有時會生成不完整的提示詞。如上圖所示,LLMs可能僅輸出一個需要用戶自行復制粘貼補全的提示模板。這種情況通常發生在初始提示較長時,推測LLMs傾向于盡可能簡短地響應,卻未能遵循生成完整提示的指令。為解決這一問題,引入了一個額外的LLM來協助填充模板,并在附錄中提供了該LLM的提示。這一額外步驟幫助我們在旅行規劃領域成功生成了完整的提示。我們沒有采用基于規則的自動修復工具,因為生成的提示模板可能包含多種符號,如 <> 或 {}。為了簡化工作流程,我們讓LLM自動識別并替換這些符號。

3.2 偶然的錯誤更改

在某些情況下,特定領域的輸出格式可能與常用格式相似,導致LLMs錯誤地更改提示的某些部分。例如,在PDDL領域,要求LLMs生成動作的前提條件,而非完整的PDDL文件。實驗中,即便提示明確指示LLMs不得更改任何內容,尤其是輸出格式,但更新后的提示有時會錯誤地改變輸出格式,如將"Preconditions"的大寫錯誤地更改為小寫的"precondition"。為糾正這一問題,依賴語法檢查器的反饋。盡管生成的結果可能存在錯誤,但它們應當在語法上正確且完整。如果語法分析器無法從LLMs的輸出中找到"Precondition"一詞,即表明使用的提示有誤,會重新運行REPROMPT來生成正確的提示。鑒于當前代碼的失敗率不到10%,這一臨時方案已足夠應對。

3.3 其他局限性

? 首先,優化提示的過程與微調類似,意味著提示詞的質量受限于訓練數據,可能會影響LLMs的泛化能力。換言之,如果訓練數據中出現的特異性僅存在于特定場景而不具備普遍性,優化后的提示可能反而不如原始版本高效。

? 其次,提示有效性依賴于LLM代理能夠使用的全面工具集。由于優化策略直接源自LLMs,而非通過搜索算法得出,REPROMPT可能會提議使用一些在實際環境中并不可用的統計工具??紤]將LLM自行編碼那些額外的、常用但當前不可用的工具,作為未來研究的方向。

? 再者,無法控制的反饋生成器有時可能產生無效甚至錯誤和誤導的反饋。鑒于REPROMPT基于反饋進行總結,如果反饋經常出現錯誤,REPROMPT會將這些錯誤納入提示中。由于本文未考慮從提示中移除無效步驟,這樣的錯誤將徒增使用的標記數量,卻無助于提升結果質量。未來的研究可以考慮引入基于搜索的機制來識別并修復這類錯誤,但這可能需要更多來自環境的真實反饋,并可能限制其在特定領域的應用。

? 最后,RePrompt 在提示階段就進行規劃,這可能不適用于需要完全不同處理流程的廣泛領域,例如解決數學問題的LLM代理。然而,對于特定任務,如利用LLM代理解決高中幾何問題,我們的方法能夠高效地學習規劃,實驗結果已經證明了這一點。

? 論文原文: https://arxiv.org/abs/2406.11132

RePrompt:提示詞自動化優化策略-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2024-6-21 17:47:18修改
收藏
回復
舉報
回復
相關推薦
播放一区二区| 成年网站在线| 亚洲国产裸拍裸体视频在线观看乱了中文| 亚洲精品一区二区三区蜜桃下载 | 四虎精品一区二区三区| 一本色道精品久久一区二区三区| 亚洲人成网在线播放| 黄色小视频免费网站| 欧美1—12sexvideos| 久久亚区不卡日本| 91日本在线视频| 国产性xxxx高清| 青青草国产免费一区二区下载| 欧美一级片在线看| 久久精品免费网站| 国内小视频在线看| 国产精品毛片无遮挡高清| 国产精品加勒比| 在线观看亚洲一区二区| 日韩天天综合| 久热国产精品视频| 天天躁日日躁aaaa视频| 97成人在线| 欧美日韩精品系列| 青青草原成人网| 四虎影院观看视频在线观看| 国产欧美日韩三区| 国产一区二区视频在线免费观看 | 国产suv一区二区三区| 亚欧洲精品视频在线观看| 91麻豆精品91久久久久久清纯| 久久精品免费一区二区| 爱情岛亚洲播放路线| 亚洲国产精品成人综合色在线婷婷| 国产精品久久久久久久小唯西川 | 日韩在线视频国产| 女尊高h男高潮呻吟| 一区二区三区视频免费视频观看网站| 欧美日韩一区视频| 亚洲爆乳无码专区| 极品在线视频| 亚洲大片在线观看| 国产欧美123| 黄色在线视频网站| 国产精品成人免费| 午夜精品一区二区在线观看的 | 91porny九色| 亚洲一区二区动漫| 98视频在线噜噜噜国产| 国产主播在线播放| 欧美性久久久| 欧美极品欧美精品欧美视频| 四虎免费在线视频| 亚洲经典一区| 欧美高清电影在线看| 日韩在线观看视频一区二区| 亚洲xxx拳头交| 久久精品青青大伊人av| 国产又粗又长又黄的视频| 精品国产一区二区三区四区| 伊人久久男人天堂| 波多野结衣一二三四区| 欧美在线观看视频一区| 中文字幕精品视频| 亚洲综合久久av一区二区三区| 日韩不卡一区| 久久精品国产欧美激情| 九九精品视频免费| 女主播福利一区| 欧美精品xxx| 久久国产精品免费看| 久久久777| 国产精品99免视看9| 中文字幕制服诱惑| 激情五月婷婷综合| 91久久国产综合久久蜜月精品| 亚洲高清视频在线播放| 成人h精品动漫一区二区三区| 国产一级二级三级精品| 女人天堂在线| 中文字幕不卡在线| 日本三级中文字幕在线观看| 啦啦啦中文在线观看日本| 精品人伦一区二区三区蜜桃免费| 日韩久久一级片| 福利一区在线| 日韩午夜电影在线观看| 天天插天天射天天干| 国产一区二区在线| 久久av中文字幕| 国产又黄又爽又色| 蜜臀精品一区二区三区在线观看| 成人在线视频网站| 天天操天天干天天爽| 日本一区二区久久| 久久最新免费视频| 婷婷综合六月| 欧美成人精精品一区二区频| 蜜桃精品成人影片| 国产精品毛片久久| 欧美又大又粗又长| 国产婷婷在线视频| 久久久久久久精| 美女av免费观看| 欧美电影网站| 欧美激情理论| 99精品视频在线免费观看| 麻豆亚洲一区| 成人黄色网址| 色八戒一区二区三区| 欧美一区二区三区影院| 一本久久青青| 欧美极品少妇xxxxx| 中文字幕在线视频第一页| 成年人网站91| 女女同性女同一区二区三区按摩| 在线免费看h| 日韩欧美色综合| 成人在线观看免费高清| 亚洲激情综合| 成人激情直播| 日本中文字幕伦在线观看| 精品久久久久久久久久| 三级黄色片播放| 欧美日韩在线二区| 77777亚洲午夜久久多人| 国产超碰人人模人人爽人人添| 久久久久国产精品人| 99er在线视频| 韩国三级成人在线| 自拍亚洲一区欧美另类| 国产精品suv一区| av在线这里只有精品| 精品嫩模一区二区三区| 8av国产精品爽爽ⅴa在线观看 | 国产精品午夜视频| 你懂得网站在线| 天天色综合成人网| 国产精品成人免费一区久久羞羞| 亚洲免费二区| 成人激情视频在线| 在线看黄色av| 欧美色精品在线视频| 69视频在线观看免费| 久久精品人人| 久久青青草综合| 亚洲天堂资源| 亚洲欧美日韩一区二区三区在线| 日韩 欧美 精品| av一本久道久久综合久久鬼色| 天堂8在线天堂资源bt| 日韩中文字幕在线一区| 欧美猛交ⅹxxx乱大交视频| 国产免费一区二区三区最新不卡| 亚洲三级电影网站| 亚洲一级片免费观看| 一区二区电影| 国产精品jizz视频| 电影k8一区二区三区久久 | 成人h猎奇视频网站| 日韩美女网站| 91精品国产色综合久久不卡蜜臀 | jizzjizz日本少妇| 国产一区二区调教| 久久香蕉视频网站| 国产精品中文字幕制服诱惑| 8x拔播拔播x8国产精品| 三级在线视频| 欧美色爱综合网| 中文字幕手机在线观看| 懂色av一区二区夜夜嗨| 成人av一级片| 日韩国产一区二区三区| 亚洲综合av影视| 国产在线天堂www网在线观看| 国产婷婷成人久久av免费高清| 国语对白做受69按摩| 日韩毛片视频在线看| 天天躁日日躁狠狠躁av| 久久久久久网| 少妇高潮大叫好爽喷水| 日韩av网址大全| 成人乱人伦精品视频在线观看| 青春草在线视频| 亚洲夜晚福利在线观看| 国产精品视频一二区| 亚洲第一综合色| 9.1片黄在线观看| 国产成人av资源| 别急慢慢来1978如如2| 一区二区三区网站| 久久99精品国产99久久| 日本国产一区| 亚洲 日韩 国产第一| xxxxx日韩| 亚洲第一福利视频| 中文字幕日本人妻久久久免费 | 欧美中日韩在线| 精品久久影院| 国产欧美日韩亚洲| 日韩专区视频网站| 欧美有码在线观看视频| 制服丝袜中文字幕在线| 亚洲人成电影网站色www| 精品久久久免费视频| 91激情在线视频| 精品无码久久久久| 中文字幕日韩欧美一区二区三区| 精品人妻一区二区三区日产乱码卜| 国产中文字幕一区| 国产精品69页| 国产日韩一区| 男人添女人下部视频免费| 清纯唯美日韩| 欧美伦理一区二区| 国产66精品| 91中文在线视频| 日本一区二区中文字幕| 欧美野外猛男的大粗鳮| 青草青在线视频| 北条麻妃久久精品| 国产二区在线播放| 国产视频久久久久| 日韩一区二区三区在线观看视频 | 亚洲色图狠狠干| 精品国产99国产精品| 97人妻一区二区精品免费视频| 在线观看日韩国产| 久久久久久少妇| 黄网动漫久久久| 日韩av一二三区| 午夜精品免费在线观看| 劲爆欧美第一页| 亚洲理论在线观看| 成人免费毛片东京热| 亚洲欧美日韩久久精品| www.黄色com| 欧美国产一区视频在线观看| mm131丰满少妇人体欣赏图| 99精品国产热久久91蜜凸| 日韩Av无码精品| 99久久综合99久久综合网站| 国产婷婷在线观看| 成人avav影音| 欧美深性狂猛ⅹxxx深喉| 成人免费高清视频| 黄色av网址在线观看| 成a人片亚洲日本久久| 在线天堂www在线国语对白| 成人免费视频视频| 东京热av一区| 91影院在线观看| 欧美黄色激情视频| 欧美国产一区在线| 男人的午夜天堂| 亚洲欧美日韩在线| 久久精品女人毛片国产| 午夜精品久久久久久久久久| 日韩在线视频免费播放| 色婷婷激情久久| 国产在线观看第一页| 欧美精品高清视频| 精品国产免费无码久久久| 日韩欧美www| 亚洲欧美日本在线观看| 亚洲色图日韩av| 在线观看免费网站黄| 免费成人高清视频| 九色porny视频在线观看| 青草成人免费视频| 成人黄色免费网站| 91麻豆蜜桃| 任你躁在线精品免费| 日韩久久在线| 欧美国产专区| 精品欧美一区免费观看α√| 日韩电影在线免费| 三日本三级少妇三级99| www.欧美日韩| 在线观看天堂av| 亚洲成人av中文| 中文字幕 视频一区| 精品国精品自拍自在线| 日本a一级在线免费播放| 少妇激情综合网| 成人国产电影在线观看| 国产精品一区二区在线| 爱高潮www亚洲精品| 欧美一区二区三区四区五区六区| 久久伦理在线| 国产av天堂无码一区二区三区| 日日欢夜夜爽一区| 欧美一级片在线免费观看| 久久免费偷拍视频| 欧美黑人精品一区二区不卡| 色老汉av一区二区三区| h狠狠躁死你h高h| 国产亚洲精品久久久久久牛牛| 性网站在线观看| 日韩暖暖在线视频| 伊人久久影院| 咪咪色在线视频| 性欧美暴力猛交另类hd| 欧美性猛交乱大交| 国产色91在线| 色婷婷在线观看视频| 777色狠狠一区二区三区| 黄色小视频在线免费观看| 欧美激情喷水视频| 91精品在线免费视频| 神马欧美一区二区| 在线亚洲国产精品网站| 91超薄肉色丝袜交足高跟凉鞋| 国产精品色哟哟| 日本视频网站在线观看| 精品粉嫩超白一线天av| 国产最新在线| 国产日韩欧美成人| 成人免费av| 国产一级不卡毛片| 99久久精品99国产精品| 久久精品国产亚洲av高清色欲| 在线成人av影院| 色大18成网站www在线观看| 国产极品精品在线观看| 免费萌白酱国产一区二区三区| 国产女人18毛片| 久久国产精品99久久久久久老狼| 一区二区黄色片| 懂色av一区二区三区| 女人18毛片一区二区三区| 欧美国产日韩二区| 日韩精品视频中文字幕| avove在线观看| 精彩视频一区二区三区| 国产又粗又长又硬| 欧美日韩在线播放三区| 婷婷五月在线视频| 国产精品丝袜一区二区三区| jvid福利在线一区二区| 亚洲欧美国产日韩综合| 国产丝袜美腿一区二区三区| 日韩一级片中文字幕| 亚洲人成电影网站| 成人mm视频在线观看| 亚洲二区三区四区| 紧缚奴在线一区二区三区| 久久国产高清视频| 日韩亚洲欧美成人一区| 色呦呦在线免费观看| 国产精品果冻传媒潘| 国产精品腿扒开做爽爽爽挤奶网站| 国产老熟女伦老熟妇露脸| 天涯成人国产亚洲精品一区av| 天堂在线一二区| 日本视频久久久| 成人国产精品一级毛片视频| 人人干人人干人人| 亚洲免费观看高清完整| 国产成人无码www免费视频播放| 欧美激情在线有限公司| 欧美日韩破处| 国产高潮免费视频| 亚洲人成精品久久久久| 亚洲乱熟女一区二区| 91国在线精品国内播放 | 亚洲精品美女网站| 国产不卡网站| 伊人久久大香线蕉综合75| 国产成人在线视频网址| 五月婷婷亚洲综合| 在线视频中文亚洲| 免费一级欧美在线大片| 日韩av高清在线看片| 久久久久高清精品| 国产精品毛片一区视频播| 久久久久亚洲精品成人网小说| 亚洲+小说+欧美+激情+另类| 亚洲综合欧美激情| 依依成人精品视频| 色猫av在线| 亚洲一区二区三区在线免费观看| 99热免费精品| 国产中文字幕久久| 欧美变态凌虐bdsm| 电影一区电影二区| 成人免费在线网| 国产精品视频观看| 好吊视频一区二区三区| 国产精品视频久久久| 99精品视频免费观看视频| 中文字幕第69页| 亚洲国产另类 国产精品国产免费| 欧美色片在线观看| 亚洲 欧美 综合 另类 中字| 国产欧美日韩在线视频| 人妻丰满熟妇av无码区hd| 国产日韩精品一区二区| 中文在线不卡| 青青草偷拍视频|