精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI自動生成prompt媲美人類,網(wǎng)友:工程師剛被聘用,又要淘汰了

人工智能 新聞
來自多倫多大學(xué)、滑鐵盧大學(xué)等機(jī)構(gòu)的研究者受 prompt engineering 的啟發(fā),提出一種使用大型語言模型自動生成和選擇指令的新算法,在 24 項(xiàng)任務(wù)中有 19 項(xiàng)達(dá)到了人類水平的表現(xiàn)。

?現(xiàn)階段,得益于模型規(guī)模的擴(kuò)大和基于注意力架構(gòu)的出現(xiàn),語言模型表現(xiàn)出了前所未有的通用性。這些大型語言模型(LLM,large language models)在各種不同任務(wù)中表現(xiàn)出非凡的能力,其中包括零樣本和小樣本設(shè)置。

然而,在模型通用性的基礎(chǔ)上,繼而引出一個控制問題:我們?nèi)绾尾拍茏?LLM 按照我們的要求去做?

為了回答這個問題并引導(dǎo) LLM 朝著我們期望的行為方向發(fā)展,研究者們采取了一系列措施來達(dá)到這個目的,例如對模型進(jìn)行微調(diào)、通過上下文進(jìn)行學(xué)習(xí)、不同形式的 prompt 生成等。而基于 prompt 的方法又包括可微調(diào)的 soft prompt 以及自然語言 prompt engineering(提示工程)。眾多研究者對后者表現(xiàn)出了極大的興趣,因?yàn)樗鼮槿祟惻c機(jī)器交互提供了一個自然交互的界面。?

然而簡單的 prompt 并不總能產(chǎn)生所需的結(jié)果,例如,在生成熊貓圖像時,添加諸如「cute」之類的形容詞或諸如「eat bamboo」之類的短語對輸出有何影響,我們不了解。

因此,人類用戶必須嘗試各種 prompt 來引導(dǎo)模型完成我們期望的行為。LLM 這一執(zhí)行過程可視為黑盒過程:雖然它們可以執(zhí)行大范圍的自然語言程序,但這些程序的處理方式對人類來說可能并不直觀,非常難以理解,而且只有在執(zhí)行下游任務(wù)時才能衡量指令的質(zhì)量。

我們不禁會問:大型語言模型可以為自己編寫 prompt 嗎?答案是,不但可以,還能達(dá)到人類水平

為了減少創(chuàng)建和驗(yàn)證有效指令的人工工作量,來自多倫多大學(xué)、滑鐵盧大學(xué)等機(jī)構(gòu)的研究者提出了一種使用 LLM 自動生成和選擇指令的新算法:APE(Automatic Prompt Engineer)。他們將此問題描述為自然語言程序合成,并建議將其作為黑盒優(yōu)化問題來處理,LLM 可以用來生成以及搜索可行的候選解決方案。


  • 論文地址:https://arxiv.org/pdf/2211.01910.pdf
  • 論文主頁:https://sites.google.com/view/automatic-prompt-engineer?

研究者從 LLM 的三個特性入手。首先,使用 LLM 作為推理模型,根據(jù)輸入 - 輸出對形式的一小組演示生成指令候選。接下來,通過 LLM 下的每條指令計算一個分?jǐn)?shù)來指導(dǎo)搜索過程。最后,他們提出一種迭代蒙特卡洛搜索方法,LLM 通過提出語義相似指令變體來改進(jìn)最佳候選指令。

直觀地說,本文提出的算法要求 LLM 根據(jù)演示生成一組指令候選,然后要求算法評估哪些指令更有希望,并將該算法命名為 APE。 

本文貢獻(xiàn)如下:?

  • 研究者將指令生成作為自然語言程序合成,將其表述為一個由 LLM 引導(dǎo)的黑盒優(yōu)化問題,并提出迭代蒙特卡羅搜索方法來近似求解;
  • APE 方法在 19/24 任務(wù)中實(shí)現(xiàn)了比人工注釋器生成的指令更好或相當(dāng)?shù)男阅堋?/span>

看到這項(xiàng)研究,網(wǎng)友不禁感嘆:那些剛被聘用的 prompt 工程師,幾個月后可能要被 AI 淘汰。言外之意就是,這項(xiàng)研究要搶了人類 prompt 工程師的活。

圖片

「該研究盡最大的努力使 prompt engineering 自動化,這樣從事 ML 的研究人員就可以回到真正的算法問題上了(附加兩個大哭的表情)。」

圖片


還有人感嘆:LLM 不愧是原始 AGI 的中流砥柱。

圖片

使用 LLM 進(jìn)行自然語言程序合成

APE 在建議(proposal)和評分這兩個關(guān)鍵組件中都使用 LLM。

如下圖 2 和算法 1 所示,APE 首先提出幾個候選 prompt,然后根據(jù)選定的評分函數(shù)對候選集合進(jìn)行篩選 / 精煉,最終選擇得分最高的指令。

圖片

下圖為 APE 的執(zhí)行過程。它可以通過直接推理或基于語義相似度的遞歸過程生成幾個候選 prompt,評估其性能,并迭代地提出新的 prompt。

圖片

初始提議分布?

由于搜索空間無限大,找到正確指令是極其困難的,這使得自然語言程序合成歷來難以處理。基于此,研究者考慮利用一個預(yù)先訓(xùn)練過的 LLM 來提出一個候選解決方案,以指導(dǎo)搜索過程。?

他們考慮兩種方法生成高質(zhì)量候選。首先采用一種基于前向模式生成的方法。此外,他們還考慮了反向模式生成,使用具有填充功能的 LLM(如 T5、GLM、InsertGPT)來推斷缺失的指令。

圖片

得分函數(shù)

為了將問題轉(zhuǎn)換為黑盒優(yōu)化問題,研究者選擇了一個得分函數(shù)來準(zhǔn)確測量數(shù)據(jù)集和模型生成的數(shù)據(jù)之間的對齊情況。

在歸納實(shí)驗(yàn)中,研究者考慮了兩個潛在的得分函數(shù)。在 TruthfulQA 實(shí)驗(yàn)中,研究者主要關(guān)注 Lin 等人提出的自動化指標(biāo),類似于執(zhí)行精度。

在每一種情況下,研究者使用如下公式 (1) 來評估生成指令的質(zhì)量,并對持有測試數(shù)據(jù)集 Dtest 進(jìn)行期望。

實(shí)驗(yàn)?

研究者對 APE 如何引導(dǎo) LLM 實(shí)現(xiàn)預(yù)期的行為進(jìn)行了研究。他們從三個角度進(jìn)行:零樣本性能、少樣本上下文學(xué)習(xí)性能和真實(shí)性(truthfulness)。

研究者評估了 Honovich 等人提出的 24 個指令歸納任務(wù)的零樣本和少樣本上下文學(xué)習(xí)。這些任務(wù)涵蓋語言理解的許多方面,從簡單的短語結(jié)構(gòu)到相似性和因果關(guān)系識別。為了了解 APE 生成的指令如何引導(dǎo) LLM 生成不同風(fēng)格的答案,本文將 APE 應(yīng)用于 TruthfulQA(一個數(shù)據(jù)集)。?

對于零樣本測試準(zhǔn)確率,APE 在 24 項(xiàng)任務(wù)中有 19 項(xiàng)達(dá)到了人類水平的表現(xiàn)。

圖片

對于少樣本上下文測試準(zhǔn)確率,在 24 個任務(wù)中,APE 提高了 21 個任務(wù)的少樣本上下文學(xué)習(xí)性能。

圖片

研究者還將 APE prompt 與 Lin 等人提出的人工 prompt 進(jìn)行了對比。圖 (a) 顯示 APE 指令在所有三個指標(biāo)上的表現(xiàn)都優(yōu)于人工 prompt。圖(b)顯示了 truthfulness 和 informativeness 之間的權(quán)衡。

圖片

更多細(xì)節(jié)請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-02-24 09:55:47

2024-10-30 14:50:00

系統(tǒng)語音模型

2020-02-12 14:13:27

工程師彈幕新玩法

2023-07-27 07:37:48

2025-05-15 09:13:00

2025-06-18 08:26:01

2023-05-22 15:22:40

微軟AI

2024-04-15 11:48:09

2022-12-28 13:57:56

AI模型語言

2024-10-30 14:30:00

AI代碼程序員

2020-12-15 13:19:42

數(shù)據(jù)科學(xué)數(shù)據(jù)大數(shù)據(jù)

2018-10-20 15:20:10

2020-12-02 13:46:24

百度大腦

2018-09-26 10:56:38

2025-01-02 13:41:53

2024-07-10 12:33:06

2024-07-02 10:24:35

2025-01-13 09:30:00

2025-09-30 09:00:00

2021-07-05 10:29:59

AI 工程師人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

欧美性猛片xxxx免费看久爱| 久久精品国产999大香线蕉| 精品三级av在线| 久久久久久久9| 日韩精品一二| 极品少妇一区二区三区精品视频| 欧美韩国理论所午夜片917电影| 国产二级一片内射视频播放| 亚洲第一会所001| 亚洲精品国产一区二区精华液| 国产精品12| 中文字幕网址在线| 亚洲三级免费| 日韩一区视频在线| 7788色淫网站小说| 亚洲网站免费| 色婷婷综合久久久中文一区二区| 日本免费在线视频观看| 亚洲色偷精品一区二区三区| 极品尤物av久久免费看| 日本久久久久久| 国产一级做a爰片在线看免费| 欧美肉体xxxx裸体137大胆| 欧美极品免费| 久久99精品视频| 国产综合在线视频| 激情高潮到大叫狂喷水| 青青一区二区| 欧美一区二区福利在线| 99视频免费播放| 91桃色在线| 亚洲精品中文在线观看| 手机看片福利永久国产日韩| 性插视频在线观看| 成人小视频在线观看| 国产精品永久免费在线| 日本视频在线观看免费| 亚洲高清av| 久久精品视频网站| 国产三级短视频| 亚洲+变态+欧美+另类+精品| 欧美成人官网二区| 久久久久久久高清| 草民电影神马电影一区二区| 日韩欧美在线视频观看| 福利视频一二区| 免费毛片在线看片免费丝瓜视频 | 成人网中文字幕| 久久久久久久久久一级| 男女精品视频| 欧美综合第一页| 中文字幕激情小说| 免费视频一区| 日本久久久久久久久久久| 久久青青草视频| 国产欧美精品| 欧美一区二三区| 天天操天天操天天操天天| 国产免费成人| 国产成人一区二区在线| 久久精品偷拍视频| 日韩美女一级视频| 欧美片第1页综合| 成人97在线观看视频| 91高清免费观看| 偷偷www综合久久久久久久| 色777狠狠综合秋免鲁丝| 天天舔天天操天天干| 日韩专区精品| 欧美成人第一页| 国产真实乱人偷精品视频| 激情91久久| 欧美一区二区三区……| 中文字幕在线日本| 精品一区二区国语对白| 91入口在线观看| 亚洲精品国产手机| 91年精品国产| 亚洲欧洲另类精品久久综合| 国产网站在线免费观看| 一区二区欧美国产| 久久亚洲中文字幕无码| 色天使综合视频| 欧美一区二区在线观看| 亚洲自拍偷拍精品| 国产一区二区三区四区五区传媒 | 99精品欧美一区二区| 久久亚洲国产| 久久久久久久久国产精品| 成年人免费高清视频| 强制捆绑调教一区二区| 91沈先生播放一区二区| 日韩欧美亚洲系列| 亚洲欧美日韩国产成人精品影院| 黄网站欧美内射| 香蕉成人影院| 日韩精品综合一本久道在线视频| 在线观看国产免费视频| 日本黄色精品| 久久久噜久噜久久综合| 一级久久久久久| 国产成人精品1024| www.xxxx欧美| 亚洲在线不卡| 麻豆传媒视频在线观看免费| 亚洲午夜视频在线观看| 91热这里只有精品| silk一区二区三区精品视频 | av成人免费观看| 蝌蚪视频在线播放| 一区二区三区在线影院| 亚洲综合在线网站| 北条麻妃一区二区三区在线| 一道本无吗dⅴd在线播放一区| 国产这里有精品| 久久亚洲视频| 国产不卡一区二区在线观看| 97视频在线观看网站| 亚洲va韩国va欧美va精品| 在线观看日本一区二区| 午夜a一级毛片亚洲欧洲| 欧美精品手机在线| 亚洲系列第一页| 久久久久国色av免费看影院| 可以看毛片的网址| 99视频有精品高清视频| 亚洲天堂男人天堂| 一级免费在线观看| 盗摄精品av一区二区三区| 在线成人性视频| 免费高清视频在线一区| 亚洲美女自拍视频| 国产特黄大片aaaa毛片| 国产成人午夜片在线观看高清观看| 欧洲亚洲一区二区| 桃色av一区二区| 亚洲第一免费网站| 欧美日韩国产精品一区二区三区| 久久99热99| 一本久久a久久精品vr综合| 欧洲一区二区三区精品| 亚洲精品国产精品自产a区红杏吧| 欧美日韩免费一区二区| 国产一区二区三区在线观看免费| 亚洲国产精品综合| 日本综合视频| 亚洲天堂av在线免费| 亚洲影视九九影院在线观看| 成人黄色免费网| 久久久精品黄色| 97在线免费公开视频| 欧美有码在线| 午夜精品视频在线| 神马午夜精品95| 精品久久久久久中文字幕一区奶水| 欧美午夜精品一区二区| 欧美午夜在线| 国产美女精品在线观看| 成人ssswww在线播放| 亚洲国产欧美久久| 国产成人精品网| 久久毛片高清国产| 中文字幕无码不卡免费视频| 精品国产网站| 91精品视频免费观看| 超碰免费公开在线| 欧美tickling挠脚心丨vk| 国产真实夫妇交换视频| av一二三不卡影片| 精品人妻一区二区三区四区在线| 天天躁日日躁狠狠躁欧美巨大小说 | 波多野结衣在线影院| 欧美另类z0zxhd电影| 日本精品在线免费观看| 国产成人精品免费| 日韩精品 欧美| 国产精品探花在线观看| 91精品久久久久久久久久久久久 | 国产成+人+综合+亚洲欧洲| 国产香蕉在线| 欧美精品一二三四| www.av视频在线观看| 26uuu欧美日本| 日韩av片专区| 韩国久久久久| 欧美一区二区在线视频观看| 免费成人毛片| 久久久久久有精品国产| 美女毛片在线看| 欧美久久婷婷综合色| 久草视频精品在线| 东凛在线观看| 亚洲欧美一区二区不卡| 免费看黄色片的网站| 久热精品在线| 欧洲xxxxx| 九九热线有精品视频99| 91性高湖久久久久久久久_久久99| 性xxxfreexxxx性欧美| 亚洲男人天堂九九视频| 91成人一区二区三区| 午夜成人免费视频| 欧美巨胸大乳hitomi| 成人毛片老司机大片| 一区二区成人网| 亚洲福利电影| eeuss中文| 神马电影久久| 国产不卡一区二区在线观看 | 伊人久久综合| 亚洲一区三区视频在线观看| 露出调教综合另类| 91美女福利视频高清| 波多野结衣亚洲| 欧美激情亚洲一区| 中国日本在线视频中文字幕| 日韩精品视频在线播放| 99久久99久久久精品棕色圆| 在线观看免费成人| 日本三级欧美三级| 亚洲日本电影在线| 色屁屁草草影院ccyy.com| 成人黄色777网| 香蕉视频xxx| 久久精品国产网站| 国产一区二区视频免费在线观看| 欧美精品国产一区| 一区二区免费在线视频| 久久超碰99| 久久一区二区精品| 极品尤物一区| 国产福利久久精品| 国产精品一级在线观看| 国产精品视频专区| 中文另类视频| 日本久久亚洲电影| 超级碰碰久久| 欧美在线观看视频| 蜜桃视频www网站在线观看| 欧美黑人一级爽快片淫片高清| 久久99精品久久| 深夜精品寂寞黄网站在线观看| 国产嫩草在线观看| 欧美亚洲tv| 国产视频一区二区不卡| 日韩亚洲精品在线观看| 国产这里只有精品| 99er精品视频| 亚洲伊人久久综合| 日韩精品视频中文字幕| 成人看片在线| 哺乳一区二区三区中文视频 | 欧美三级自拍| 狠狠色伊人亚洲综合网站色| 农村少妇一区二区三区四区五区 | 亚洲av综合色区无码另类小说| 国产真实精品久久二三区| 网站在线你懂的| 精品一区精品二区高清| 国产九九九视频| 国产在线不卡一区| 亚洲成年人在线观看| caoporm超碰国产精品| 国产精品无码专区| 久久女同互慰一区二区三区| 中文字幕成人动漫| 国产精品蜜臀av| www.毛片com| 亚洲一线二线三线久久久| 日韩 欧美 精品| 欧美性猛xxx| 中文字幕在线播放av| 3d成人h动漫网站入口| 亚洲国产精品成人久久蜜臀| 亚洲成人免费在线视频| 国产一二三在线观看| 日韩最新免费不卡| 欧美亚洲系列| 欧美专区第一页| 欧美黄色a视频| 7777精品久久久大香线蕉小说| 国产精品久久久久av蜜臀| 蜜桃免费一区二区三区| 日韩在线看片| 日韩欧美精品免费| 日韩国产成人精品| 国产亚洲色婷婷久久| 91理论电影在线观看| 丁香花五月婷婷| 一区二区三区加勒比av| 国产精品100| 欧美麻豆精品久久久久久| 人妻少妇一区二区三区| 在线电影av不卡网址| 日韩三级免费| 姬川优奈aav一区二区| jizz大全欧美jizzcom| 国产不卡视频在线播放| 公侵犯人妻一区二区三区| 亚洲人成在线播放网站岛国| 日韩三级av在线| 欧美精品第1页| 日韩专区一区二区| 美女av一区二区| 视频在线日韩| 国产亚洲一区在线播放 | 91亚洲精华国产精华精华液| 国产精品情侣呻吟对白视频| 亚洲国产欧美另类丝袜| 伊人网av在线| 日韩精品一二三四区| www红色一片_亚洲成a人片在线观看_| 5252色成人免费视频| 国产亚洲字幕| 先锋影音一区二区三区| 国产欧美日本| 91大神免费观看| 国产精品视频在线看| 亚洲天堂视频网站| 欧美va在线播放| av在线导航| 国产精品网站入口| 国产一区二区在线| 黄色一级视频在线播放| 国产精品性做久久久久久| 在线观看亚洲大片短视频| 精品欧美一区二区三区| 亚洲av无码国产精品永久一区 | 1024在线看片你懂得| 91中文在线观看| 国产精品久久久久蜜臀| 国产免费999| 国产视频一区二区三区在线观看| 国产真实夫妇交换视频| 日韩一区二区麻豆国产| 激情在线小视频| 国产色综合天天综合网| 残酷重口调教一区二区| 99视频精品免费| 久久综合九色欧美综合狠狠| 日韩av无码中文字幕| 亚洲аv电影天堂网| 成人在线免费观看黄色| 97在线电影| 欧美激情自拍| 日韩精品xxx| 一区二区三区毛片| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的| 久久国产精品影视| 久久久久久久久久久久电影| 免费在线观看污污视频| 韩国精品在线观看| 农村黄色一级片| 精品欧美一区二区三区精品久久 | 亚洲一区二区av电影| 欧美一区视久久| 日韩av在线播放网址| 日韩不卡一二三| 亚洲欧洲99久久| www.热久久| 欧美黑人xxx| 日韩啪啪网站| 亚洲少妇第一页| 亚洲欧洲国产专区| 亚洲第一页视频| 欧美精品18videosex性欧美| 久久97久久97精品免视看秋霞| 欧美黑人经典片免费观看 | 日本黄色激情视频| 欧美美女视频在线观看| 亚洲小说区图片| 国产一级精品aaaaa看| 久久精品一区二区国产| 91导航在线观看| 日韩美女视频一区二区在线观看| 国产精品电影| 色婷婷精品国产一区二区三区| 麻豆国产精品一区二区三区| 波兰性xxxxx极品hd| 日韩视频免费直播| 看黄在线观看| 一本色道久久99精品综合| 国产一区二区91| 亚洲精品77777| 日韩在线免费高清视频| 亚洲精品一区国产| 可以免费观看av毛片| 国产精品激情偷乱一区二区∴| 国产av一区二区三区| 97超碰色婷婷| 日韩精品欧美| 国产黑丝一区二区| 欧美网站大全在线观看| 欧美极品少妇videossex| 欧美日韩亚洲在线| 国产精品一区二区三区网站| 天天爽夜夜爽人人爽| 欧美大片网站在线观看| 精品久久视频| 成人性生活免费看|