微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗

發(fā)布于 2024-12-24 14:05

瀏覽

0收藏

PromptWizard (PW) 旨在自動(dòng)化和簡(jiǎn)化提示優(yōu)化。它將 LLM 的迭代反饋與高效的探索和改進(jìn)技術(shù)相結(jié)合，在幾分鐘內(nèi)創(chuàng)建高效的prompts。

PW的核心是其自我進(jìn)化和自適應(yīng)機(jī)制，LLM 會(huì)同時(shí)迭代生成、評(píng)論和改進(jìn)提示和示例。此過(guò)程通過(guò)反饋和綜合確保持續(xù)改進(jìn)，實(shí)現(xiàn)針對(duì)特定任務(wù)的整體優(yōu)化。

PromptWizard 經(jīng)過(guò) 45 多項(xiàng)任務(wù)的嚴(yán)格評(píng)估，涵蓋了一般挑戰(zhàn)和特定領(lǐng)域挑戰(zhàn)。與最先進(jìn)的技術(shù)（包括 Instinct、InstructZero、APE、PromptBreeder、EvoPrompt、DSPy、APO 和 PromptAgent）對(duì)比，PW 在準(zhǔn)確性、效率和適應(yīng)性方面始終優(yōu)于競(jìng)爭(zhēng)對(duì)手。

微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗-AI.x社區(qū)

PromptWizard三個(gè)關(guān)鍵組件

PromptWizard 概述

微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗-AI.x社區(qū)

反饋驅(qū)動(dòng)改進(jìn)： PW 的核心是利用迭代反饋循環(huán)，LLM 在其中生成、批評(píng)和改進(jìn)自己的提示和示例。這種持續(xù)改進(jìn)機(jī)制確保每次迭代都比上一次更好，從而產(chǎn)生高效的提示和示例。
多種示例的聯(lián)合優(yōu)化與合成： PW 生成的合成示例不僅穩(wěn)健多樣，而且具有任務(wù)感知能力。通過(guò)同時(shí)優(yōu)化提示和示例，確保它們協(xié)同工作，有效滿(mǎn)足特定任務(wù)要求。
自生成思維鏈 (CoT) 步驟：結(jié)合 CoT 推理可提高模型的解決問(wèn)題能力。通過(guò)使用選定的少量樣本，PW 為每個(gè)示例生成詳細(xì)的推理鏈，從而促進(jìn)細(xì)致入微、循序漸進(jìn)的問(wèn)題解決方法。

PromptWizard 的工作原理

PromptWizard 從用戶(hù)輸入開(kāi)始：?jiǎn)栴}描述、初始提示指令和一些作為當(dāng)前任務(wù)基礎(chǔ)的訓(xùn)練示例。

它的輸出是一套經(jīng)過(guò)精煉、優(yōu)化的提示指令，并搭配精心挑選的上下文小樣本示例。這些輸出包含詳細(xì)的推理鏈、任務(wù)意圖和專(zhuān)家資料，將類(lèi)人推理與人工智能的響應(yīng)聯(lián)系起來(lái)。

第一階段：完善提示指令

第一階段側(cè)重于完善提示的任務(wù)說(shuō)明。PromptWizard 生成多個(gè)候選說(shuō)明，使用 LLM 的反饋對(duì)其進(jìn)行評(píng)估，并迭代地綜合改進(jìn)版本。此過(guò)程平衡了探索（嘗試各種想法）和利用（完善最有希望的想法）。

例如，如果初始指令產(chǎn)生的結(jié)果不是最優(yōu)的，PW 會(huì)結(jié)合反饋來(lái)識(shí)別其缺點(diǎn)并生成改進(jìn)版本。經(jīng)過(guò)三到五次迭代，此迭代周期可確保指令收斂到最優(yōu)狀態(tài)。

提示指令的細(xì)化

微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗-AI.x社區(qū)

第二階段：指令與示例的聯(lián)合優(yōu)化

將第一階段得到的精煉提示與精心挑選的示例相結(jié)合，共同優(yōu)化。通過(guò)批判與綜合機(jī)制，PromptWizard 確保提示與示例保持一致，同時(shí)綜合新示例以提升任務(wù)表現(xiàn)。

這種結(jié)構(gòu)化方法使 PromptWizard 具有高度的通用性，可以適應(yīng)從解決數(shù)學(xué)問(wèn)題到生成創(chuàng)意內(nèi)容等各種任務(wù)。

指令與示例的聯(lián)合優(yōu)化

微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗-AI.x社區(qū)

https://github.com/microsoft/PromptWizard
https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-opt

本文轉(zhuǎn)載自??PaperAgent??

標(biāo)簽

微軟

開(kāi)源

PromptWizard

贊

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型的提示工程：提示是對(duì)程序的搜索

lintoms ? 4135瀏覽 ? 0回復(fù)
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時(shí)代 ? 9459瀏覽 ? 0回復(fù)
開(kāi)源AI視頻工具，你只需要當(dāng)導(dǎo)演，HuggingFace工程師打造

輕薄滴假象 ? 4121瀏覽 ? 0回復(fù)
能模擬人類(lèi)工程師思考和行動(dòng)

51CTO技術(shù)棧 ? 3480瀏覽 ? 0回復(fù)
從工程師視角看 “Multi-Agent as a Service (MAaaS)”

Baihai_IDP ? 4062瀏覽 ? 0回復(fù)
LLM 工程師入門(mén)：生成式AI的簡(jiǎn)易指南

Baihai_IDP ? 4088瀏覽 ? 0回復(fù)
OpenAI前研究科學(xué)家開(kāi)源面向未來(lái)的提示工程庫(kù) ell，重新定義提示工程

Syrupup ? 4071瀏覽 ? 0回復(fù)
微軟內(nèi)部工程師突爆料：OpenAI下一代模型11月即將上架，今天離職的AGI顧問(wèn)：今天Lastday

51CTO技術(shù)棧 ? 3222瀏覽 ? 0回復(fù)
OpenAI砸碎了程序員的飯碗

AI論文解讀 ? 3215瀏覽 ? 0回復(fù)
小扎：今年，AI開(kāi)始干掉年薪百萬(wàn)工程師

51CTO技術(shù)棧 ? 4021瀏覽 ? 0回復(fù)
DeepSeek R1不編程就能生成GPU內(nèi)核，比熟練工程師好，驚到了英偉達(dá)

輕薄滴假象 ? 3207瀏覽 ? 0回復(fù)
全球首個(gè)AI CUDA工程師來(lái)了！將PyTorch原生實(shí)現(xiàn)提速10-100倍

輕薄滴假象 ? 3119瀏覽 ? 0回復(fù)
測(cè)試工程師會(huì)被淘汰嗎？

mb67d4200f74d5e ? 2753瀏覽 ? 0回復(fù)
被瘋傳的“惡趣味”：看Copilot這款“熊孩子”把微軟工程師逼瘋！Agent 剛上線就翻車(chē)？

51CTO技術(shù)棧 ? 2246瀏覽 ? 0回復(fù)
AI 工程師構(gòu)建 RAG 容易犯的五個(gè)錯(cuò)誤

AI大模型觀察站 ? 1806瀏覽 ? 0回復(fù)
想成為頂尖 1% 的 AI 工程師？趕緊學(xué)這 27 個(gè) Python 庫(kù)！爆肝推薦！

PyTorch研習(xí)社 ? 2458瀏覽 ? 0回復(fù)
網(wǎng)友：我見(jiàn)過(guò)最接近AI工程師的開(kāi)源模型；Kimi新開(kāi)源編程模型斬獲最高成績(jī)！

51CTO技術(shù)棧 ? 1812瀏覽 ? 0回復(fù)
干掉 90% 的 BI 工程師：自動(dòng)生成 SQL、洞察、預(yù)測(cè)，連圖表都幫你畫(huà)好

CourseAI ? 2189瀏覽 ? 0回復(fù)
2025年底前，AI工程師必學(xué)必試的七項(xiàng)MCP項(xiàng)目

51CTO內(nèi)容精選 ? 561瀏覽 ? 0回復(fù)

PaperAgent

這個(gè)用戶(hù)很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

51CTO

51CTO博客

51CTO學(xué)堂

微軟開(kāi)源PromptWizard，摔碎了提示工程師的飯碗

PromptWizard三個(gè)關(guān)鍵組件

PromptWizard 概述

PromptWizard 的工作原理

第一階段：完善提示指令

第二階段：指令與示例的聯(lián)合優(yōu)化

目錄