精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Agent 應用于提示工程

原創 精選
人工智能
作為Agent 應用于提示工程的一種具體實現,ReAct 邁出通往通用人工智能和具象語言模型的一步。如果一個機器人有一種基于熟悉的特征對外部環境進行建模并使用該模型創建提示的方法,那么它至少可以嘗試在各種領域獨立行動,而不需要人工制作的示例。

如果Agent模仿了人類在現實世界中的操作方式,那么,能否應用于提示工程即Prompt Engingeering 呢?

從LLM到Prompt Engineering

大型語言模型(LLM)是一種基于Transformer的模型,已經在一個巨大的語料庫或文本數據集上進行了訓練,包括了互聯網上的大多數網頁。在訓練期間,需要花費大量的時間(和/或圖形處理器)、能量和水(用于冷卻) ,梯度下降法被用來優化模型的參數,以便它能夠很好地預測訓練數據。

圖片圖片

本質上,LLM 學習根據前面的詞序預測最可能的下一個詞。這可以用來執行推理即查找模型生成某些文本的可能性,或者用來生成文本,像 ChatGPT 這樣的 LLM 使用這些文本與人進行對話。一旦 LLM 完成了訓練,意味著它的參數被保存,不會向訓練數據或重新訓練的數據中添加輸入。值得注意的是,LLM 仍然會從訓練數據中學到偏見,而 ChatGPT 背后的 OpenAI 公司不得不增加安全措施,使用來自人類反饋的強化學習(RLHF)以防止該模型產生有問題的內容。此外,由于 LLM 默認情況下只是根據他們所看到的內容生成最有可能的下一個單詞,而沒有進行任何事實核查或推理,因此它們容易產生幻覺,或者編造事實,以及推理錯誤。

自從 ChatGPT 公開發布以來,LLM 風靡全球。這些模型的新興智能以及它們在我們生活中的各個方面的應用,使它們成為一種非常受歡迎的工具,每家公司都想從中分一杯羹。除了聊天機器人以及編碼和寫作助手,LLM 還被用來創建與包括互聯網在內的模擬環境交互的Agent。

如果嘗試過 ChatGPT,有時會發現它的回答很糟糕,但是如果重新措辭這個問題,可能會得到更好的結果。這就是提示工程的藝術,通過修改輸入使 LLM 以您希望的方式作出響應。提示語的背后只是嘗試通過提出一些事實來“喚醒LLM的記憶”,或者告訴它一個新的領域,然后從一個訓練好的 LLM 那里得到適當的響應。這就是所謂的上下文學習,一般主要有兩種類型: zero-shot和few-shot。zero-shot為 LLM 提供了一個提示,可以在問題/命令之前包含一些背景信息,以幫助 LLM 找到一個好的響應。few-shot給 LLM 提供了一些示例提示和可取的響應,然后提出一個新的提示,LLM 將以示例的格式響應這些提示。

提示工程可能是自然語言處理(NLP)的未來趨勢之一。這個領域正在從定制模型轉向定制提示,因為 LLM 比任何人在沒有大量時間和精力的情況下自己制作的語言模型要好得多。當 LLM 與正確的提示工程技術配對時,通常情況下,它可以完成專用模型所能完成的任何工作。

圖片圖片

從CoT到Agent

思維鏈推理(CoT)是一種流行的提示工程技術,旨在對抗推理錯誤。它包括給 LLM 提供一個或多個例子,說明如何通過語言推理解決問題,然后給它一個不同的問題,以這種方式解決。這可以幫助克服推理的錯誤,但它仍然受到幻覺的影響以及幻覺的“事實”可以通過推理傳播,導致模型得出錯誤的結論。

只提出一個問題的標準提示語被比作思維鏈(CoT)提示的輸入 ,需要多步推理才能解決問題。由于幻覺的問題,使用 CoT 提示的 LLM 有更令人信服的響應,但它仍然有可能是錯誤的。如果 LLM 要成為一個有用的工具,如果不能左右它胡編亂造,我們就永遠不能相信它們,最好還是自己做研究。而Agent似乎可以解決這個問題,允許 LLM 采取行動,比如搜索維基百科,以便從中找到事實和理由。

Agent 應用于提示工程示例——ReAct

與思維鏈推理一樣,ReAct 也是一種提示工程方法,它使用少量學習來教模型如何解決問題。CoT 被認為是模仿人類如何思考問題,ReAct 也包括了這個推理元素,但它更進一步,允許Agent操作文本,讓它與環境互動。人類使用語言推理來幫助我們制定策略并記住事情,但也可以采取行動來獲得更多的信息并實現目標。這就是 ReAct 的基礎。ReAct 提示包括行動的例子、通過行動獲得的觀察結果,以及人類在過程中各個步驟中轉錄的思想(推理策略)。LLM 學習模仿這種交叉思考和行動的方法,使其成為其環境中的Agent。

一定要記住,觀察結果不是由 LLM 生成的,而是由環境生成的,環境是一個單獨的模塊,LLM 只能通過特定的文本操作與之交互。因此,為了實現 ReAct,需要:

  1. 一種環境,它采取一個文本操作, 從一組可以根據環境的內部狀態改變的潛在操作中返回一個文本觀察。
  2. 一個輸出解析器框架,一旦Agent編寫了一個有效的操作,它就停止生成文本,在環境中執行該操作,并返回觀察結果, 一般是將其追加到目前生成的文本中,并用該結果提示 LLM。
  3. 人工產生的示例,混合了思想,行動和觀察,在環境中可以使用few-shot,例子的數量和細節取決于目標和開發者的設計,例如:

圖片

這里,思想、動作和觀察都被清楚地標記如上,而且動作使用了一種特殊的格式,查詢放在括號中,這樣Agent就可以學習以這種方式編寫任務,然后輸出解析器就可以輕松地提取查詢。

Yao 等人(2023)使用了 PalM-540B,用這個 LLM 在兩個知識密集型推理任務和兩個決策任務上測試了 基于ReAct 的提示工程效果。

知識密集型推理任務

在這個任務領域中使用的兩個域是 HotPotQA 和 FEVER,前者是使用 Wikipedia 段落進行多跳問答,后者是事實驗證。Agent可以使用以下操作與Wikipedia API 進行交互:

  • Search: 根據名稱或大多數相似結果列表查找頁面。
  • 查找: 在頁中查找字符串。
  • 以答案結束任務。

在 HotPotQA 和 FEVER 這兩個評估領域中, ReAct 與如下提示工程 技術進行了比較,結果是通過 FEVER 的準確性和 HotPotQA 中 EM 來評估的。

圖片圖片

其中:

  • 標準Prompt: 沒有思想,行動,或觀察。
  • CoT: 沒有及時的行動或觀察。
  • CoT-SC (自我一致性) : 從 LLM 中抽取一定數量的回答,并選擇大多數作為回答。
  • 動作: 沒有思維的prompt。
  • ReAct ->CoT-SC: 開始時是ReAct,然后轉換為 CoT-SC。
  • CoT-SC-> ReAct: 開始時是 CoT-SC,然后切換到 ReAct。

ReAct 在 HotPotQA 中表現不佳,但在 FEVER 中表現優于 CoT。ReAct 比 CoT 更不容易產生幻覺,但是有更高的推理錯誤率。盡管 ReAct 確實有這個缺點,但是 ReAct-> CoT-SC 和 CoT-SC-> ReAct 方法是其中最成功的。

決策任務

測試ReAct 的兩個決策任務是 ALFWorld 和 WebShop。

ALFWorld 是一個基于文本的游戲,具有真實的環境。它具有用于在模擬世界中移動和交互的文本操作,例如“打開抽屜1”給代理人的一個目標可能是在房子里找到一個特定的物體,因此常識推理有助于知道這樣一個物體通常在哪里被發現。衡量成功的標準是達到目標的試驗的百分比。

WebShop 是一個模擬在線購物網站,數據來自亞馬遜。這是一個具有挑戰性的領域,因為它有大量的行動導航網站和搜索產品。目標是找到一個符合用戶規范的項目。衡量成功的標準是所選項目與用戶心目中的隱藏項目有多接近。

從論文中的評估結果來看,ReAct 的表現明顯優于基線。

ReAct 雖然由于其推理錯誤而并不完善,但仍然是一個強有力的提示工程方法,它克服了思維鏈推理的事實幻覺問題,并且允許 LLM 成為一個可以與其環境相互作用的Agent。此外,它具有可解釋性,因為Agent在行動時輸出其思維過程。

小結

作為Agent 應用于提示工程的一種具體實現,ReAct 邁出通往通用人工智能和具象語言模型的一步。如果一個機器人有一種基于熟悉的特征對外部環境進行建模并使用該模型創建提示的方法,那么它至少可以嘗試在各種領域獨立行動,而不需要人工制作的示例。它還需要某種記憶,或者從它的經歷中學習的能力,具有常識性知識的機器人,只要能夠解決諸如推理錯誤和幻覺之類的問題,就可能對我們有很大的幫助。

BTW,擁有了大模型就可以擁有好的產品么? 產品經理的貢獻往往仍然是不可或缺的,以智能語音產品為例, 你可能需要這樣的一本案頭手冊(筆者的最新譯作),幫助自己更好的完成產品設計。

責任編輯:武曉燕 來源: 喔家ArchiSelf
相關推薦

2023-11-06 10:07:22

模型人工智能數字

2024-03-19 15:09:07

2009-06-10 15:57:49

AndroidMIPS架構

2011-05-10 09:20:30

2023-05-05 14:11:12

區塊鏈航空領域

2009-05-06 16:54:05

firefoxseo瀏覽器

2022-01-27 15:33:11

區塊鏈金融技術

2020-12-21 14:40:10

Java技術開發

2022-10-24 10:20:28

物聯網智能計量

2021-07-22 14:26:27

物聯網衛星技術IOT

2016-11-16 16:04:27

2023-06-26 17:37:54

人工智能AI

2023-09-18 18:49:45

2023-10-18 06:49:06

人工智能API安全

2009-12-29 18:17:32

Silverlight

2017-02-16 12:00:30

云平臺智慧城市云計算

2023-05-30 15:09:56

無人機無人駕駛飛行器

2009-12-16 14:45:35

Linux操作系統

2018-03-13 15:31:09

區塊鏈

2020-05-24 20:35:26

物聯網系統蜜蜂物聯網
點贊
收藏

51CTO技術棧公眾號

91青青草视频| 黑森林av导航| 色婷婷av在线| 99视频精品在线| 国产成人一区二区三区小说| 蜜桃av免费在线观看| 99er精品视频| 午夜影视日本亚洲欧洲精品| 日韩精品在在线一区二区中文| 中文字幕乱码人妻二区三区| 欧美成人日本| 亚洲区在线播放| 手机在线免费毛片| 亚洲天堂av影院| 亚洲美女视频在线观看| 欧美精品一区二区三区四区五区| 91精品国产乱码久久久| 99精品99| 久久久久北条麻妃免费看| 亚洲一区二区三区无码久久| 一区二区三区日本视频| 色综合久久88色综合天天6| 性做爰过程免费播放| 日韩三级电影网| 国产成人综合自拍| 国产女精品视频网站免费| 日韩熟女精品一区二区三区| 午夜免费一区| 一区二区在线视频播放| 午夜视频在线观看国产| 精品国产一级| 精品视频色一区| 男女高潮又爽又黄又无遮挡| 色呦呦在线视频| 亚洲天堂a在线| 色综合视频二区偷拍在线| 香蕉视频免费看| 国产成人免费在线观看不卡| 91精品久久久久久久久| 日本中文字幕在线观看视频| 亚洲精品影视| 欧美国产激情18| 欧美日韩色视频| 99久久激情| 精品国内亚洲在观看18黄| 国产毛片久久久久久久| 卡通动漫国产精品| 欧美成人女星排名| 欧美高清精品一区二区| 亚洲综合伊人| 制服丝袜亚洲网站| 亚洲欧美手机在线| 24小时成人在线视频| 欧美午夜一区二区三区| chinese少妇国语对白| 激情亚洲影院在线观看| 日韩欧美视频一区二区三区| 精品国产一二三四区| 久草在线视频网站| 亚洲午夜精品久久久久久久久| 日本美女爱爱视频| 欧美人与性动交α欧美精品图片| 亚洲激情图片小说视频| 真人做人试看60分钟免费| 99久久精品免费观看国产| 亚洲蜜臀av乱码久久精品蜜桃| 亚洲午夜精品久久| 成人欧美在线| 一个色综合网站| 久久99中文字幕| 精品人妻无码一区二区色欲产成人| 国产精品100| 欧美高清视频看片在线观看| 亚洲第一网站男人都懂| 影音先锋人妻啪啪av资源网站| 久久夜色精品国产噜噜av小说| 亚洲国产女人aaa毛片在线| 美女又爽又黄免费| 免费视频亚洲| 中文字幕一区二区精品| 欧美日韩在线视频免费| 亚洲国产日本| 国产精品第3页| 一级黄色大毛片| 国产精品一品视频| 国产麻豆日韩| 北岛玲一区二区三区| 亚洲欧洲美洲综合色网| 免费看欧美黑人毛片| 亚洲天堂资源| 欧美日本一区二区| 国产清纯白嫩初高中在线观看性色| 国产精品色在线网站| 亚洲欧洲国产一区| 亚洲一级生活片| 国产视频欧美| 成人激情在线观看| 天天爱天天干天天操| 国产无一区二区| 天堂av免费看| 唐人社导航福利精品| 91麻豆精品国产91久久久使用方法 | 色哟哟欧美精品| 无需播放器的av| 超碰97久久| 中文字幕亚洲图片| 你懂的国产视频| 久久精品国产久精国产| 久久国产手机看片| 超碰caoporn久久| 色综合 综合色| 国产又黄又嫩又滑又白| 精品国精品国产自在久国产应用| 欧美日本中文字幕| 中文字幕在线播放av| 不卡的电视剧免费网站有什么| 亚洲欧洲国产精品久久| 伊人久久国产| 日韩美女一区二区三区四区| 日本爱爱爱视频| 在线免费观看欧美| 亚洲r级在线观看| 在线视频婷婷| 色视频一区二区| 国产女人18毛片水真多18| 99久久夜色精品国产亚洲狼| 日本久久久a级免费| 女人18毛片水真多18精品| 亚洲欧美在线高清| 九九视频精品在线观看| 日韩aaa久久蜜桃av| 欧美丰满少妇xxxxx做受| 亚洲图片在线播放| 欧美极品aⅴ影院| 日本精品免费在线观看| 久久99精品久久久久久欧洲站| 欧美另类极品videosbest最新版本 | 在线观看免费高清完整| 一本大道久久a久久精二百| 中文字幕第九页| 欧美日韩久久| 亚洲a级在线观看| 欧美人xxx| 欧美日韩亚洲不卡| 国产三级在线观看完整版| 久久香蕉精品| 茄子视频成人在线观看 | eeuss影院在线播放| 色综合天天综合在线视频| 鲁大师私人影院在线观看| 亚洲精品裸体| 九色91国产| 亚洲啊v在线| 亚洲精品视频免费| 日韩视频在线观看一区| 久久久久综合网| 人妻熟女一二三区夜夜爱| 日韩极品少妇| 日韩男女性生活视频| 国模吧精品人体gogo| 日韩欧美在线播放| 美女脱光内衣内裤| 欧美aaa在线| 资源网第一页久久久| 91国产一区| 欧美激情伊人电影| 日本高清视频免费观看| 天天综合网天天综合色| 国产精品815.cc红桃| 日韩精品高清不卡| 亚洲午夜高清视频| 日韩区一区二| 97婷婷涩涩精品一区| 蝌蚪视频在线播放| 欧美日韩国产综合视频在线观看| 国产午夜精品理论片| 成人性生交大片免费看中文| 少妇高潮毛片色欲ava片| 伊人久久大香线蕉综合网蜜芽| 国产精品看片资源| 午夜av在线播放| 亚洲电影在线看| 五月婷婷六月婷婷| 亚洲精品中文字幕乱码三区| 最新版天堂资源在线| 国产欧美一级| 中文字幕一区二区三区四区五区| 亚洲大奶少妇| 国产999精品久久久影片官网| 2021av在线| 精品国产污网站| 九九热最新视频| 一区二区在线观看av| 女尊高h男高潮呻吟| 精品一区二区精品| 国产h视频在线播放| 日韩久久视频| 韩国一区二区三区美女美女秀| 日本成人伦理电影| 欧美激情一区二区三级高清视频| 黄色av网站在线| 日韩欧美国产综合在线一区二区三区| 国产a∨精品一区二区三区仙踪林| 国产日韩亚洲欧美综合| 韩国av中国字幕| 麻豆91小视频| 91九色在线观看视频| 99国内精品久久久久久久| 极品校花啪啪激情久久| 亚洲ww精品| 日韩暖暖在线视频| av免费不卡国产观看| 久久精品最新地址| 国产污视频在线| 亚洲成人教育av| 国产老妇伦国产熟女老妇视频| 精品久久久中文| 91视频综合网| 国产精品私人影院| 黄色正能量网站| 国产精品亚洲一区二区三区在线| 日韩视频免费在线播放| 99精品免费网| 国产传媒久久久| 久久久精品久久久久久96| 日本公妇乱淫免费视频一区三区| 999久久久久久久久6666| 成人精品一区二区三区| 日韩三区免费| 国产91九色视频| 厕沟全景美女厕沟精品| 国外成人在线直播| 18+激情视频在线| 久久天天躁狠狠躁夜夜躁| 波多野结衣在线影院| 亚洲天天在线日亚洲洲精| 天天综合网在线观看| 精品乱人伦小说| www三级免费| 日韩一级黄色片| 99精品国产99久久久久久97| 欧美日韩国产综合一区二区三区| 国产一级精品毛片| 在线观看av一区| 日韩黄色片网站| 欧美中文字幕亚洲一区二区va在线 | 99久久夜色精品国产亚洲96| 亚洲精品一区二区三区av| 欧美精选视频在线观看| 欧美性大战久久久久| 美女网站一区| 蜜桃久久精品乱码一区二区| 色橹橹欧美在线观看视频高清| 国产一区二区三区色淫影院| 国产精品qvod| 另类欧美小说| 精品国产123区| 亚洲激情电影在线| 国产精品99久久精品| 久久免费看毛片| 中文字幕亚洲精品乱码| 偷拍盗摄高潮叫床对白清晰| 国产精品成人一区二区不卡| 2021狠狠干| 国产一区久久| 日韩欧美一区三区| 视频一区二区欧美| 欧美男女交配视频| 国产综合色视频| 国产情侣久久久久aⅴ免费| www.欧美日韩| 国产手机在线观看| 国产精品福利一区二区三区| 亚洲熟女www一区二区三区| 亚洲一区二三区| 性色av免费观看| 欧美日韩一本到| 亚洲精品97久久中文字幕无码| 日韩av在线精品| 岛国最新视频免费在线观看| www.日韩视频| 国产嫩草在线视频| 国产精品都在这里| 成人51免费| 精品伦理一区二区三区| 欧美在线免费看视频| 四虎精品欧美一区二区免费| 99热免费精品在线观看| 亚洲 欧美 日韩系列| 国产成人精品免费| 日韩人妻无码一区二区三区| 国产偷国产偷亚洲高清人白洁 | 成人高清网站| 精品自在线视频| 日韩一区二区三区在线免费观看| 91免费版网站入口| 日韩mv欧美mv国产网站| 亚洲人一区二区| 亚洲免费黄色| 国产视频自拍一区| 久久国产精品亚洲va麻豆| 极品人妻videosss人妻| 国产成人av影院| 男人天堂av电影| 在线观看一区| 亚洲电影第三页| 一区二区三区四区| 在线中文字幕亚洲| aⅴ在线免费观看| 国产剧情在线观看一区二区 | 成人免费看视频| 久久久精品成人| 天天射综合影视| 国产aⅴ爽av久久久久成人| 国产视频久久久久久久| 免费看日本毛片| 国产资源在线观看| 日韩视频在线观看免费| a一区二区三区| 鬼打鬼之黄金道士1992林正英| 成人直播大秀| 欧美日韩亚洲一| 成人美女视频在线观看18| 黄色录像免费观看| 色婷婷亚洲精品| 天天操天天干天天爽| 精品综合久久久久久97| 亚洲女人久久久| 99精品热6080yy久久| 999这里有精品| 国产亚洲欧美日韩日本| 91在线看视频| 欧美精品一区二区三区久久久| 九色porny丨首页在线| 国产精品88a∨| 亚洲系列另类av| 国产免费观看高清视频| 成人av电影免费在线播放| 精品无码久久久久久久| 日韩一区二区三区观看| 欧美成人xxx| 国产综合香蕉五月婷在线| 手机亚洲手机国产手机日韩| 天堂在线资源视频| 欧美国产综合色视频| 日韩黄色一级视频| 伊人久久大香线蕉av一区二区| 中文在线8资源库| 久久99精品久久久久久三级| 亚洲成人中文| 99久久人妻精品免费二区| 天天av天天翘天天综合网色鬼国产| 日本美女一级片| 91精品国产色综合久久不卡98口| 国产精品美女在线观看直播| 成年人午夜视频在线观看| 91丨国产丨九色丨pron| 免费看毛片网站| 亚洲性生活视频在线观看| 草民电影神马电影一区二区| 在线观看欧美亚洲| 国产精品一二三四区| 国产一级做a爰片在线看免费| 亚洲电影免费观看高清完整版在线观看| 国产蜜臀在线| 欧美日韩高清在线一区| 日韩中文字幕1| 青青操在线视频观看| 精品精品国产高清a毛片牛牛 | 欧美婷婷精品激情| 亚洲视频综合在线| 肥臀熟女一区二区三区| 97国产在线视频| 国内精品久久久久久久久电影网| 午夜在线观看av| 一区二区三区日本| 欧美色图另类| 国产精品爽爽爽| 欧美午夜电影在线观看 | 亚洲欧美久久久久| 亚洲免费观看高清完整版在线观看熊| 国产91免费在线观看| 日本中文字幕久久看| 国产精品久久久久久久久久10秀| 国产综合内射日韩久| 日本韩国欧美三级| av在线网址观看| 欧美激情第一页在线观看| 看电视剧不卡顿的网站| 国产极品在线播放| 亚洲视屏在线播放| 亚洲一区二区免费在线观看| 色欲av无码一区二区人妻| 亚洲视频中文字幕| 久草在线网址| 成人女人免费毛片| 免费成人在线影院| 五月婷婷开心网| 毛片精品免费在线观看| 国产精品美女久久久久久不卡|