微軟開(kāi)源PromptWizard,摔碎了提示工程師的飯碗
PromptWizard (PW) 旨在自動(dòng)化和簡(jiǎn)化提示優(yōu)化。它將 LLM 的迭代反饋與高效的探索和改進(jìn)技術(shù)相結(jié)合,在幾分鐘內(nèi)創(chuàng)建高效的prompts。
PW的核心是其自我進(jìn)化和自適應(yīng)機(jī)制,LLM 會(huì)同時(shí)迭代生成、評(píng)論和改進(jìn)提示和示例。此過(guò)程通過(guò)反饋和綜合確保持續(xù)改進(jìn),實(shí)現(xiàn)針對(duì)特定任務(wù)的整體優(yōu)化。
PromptWizard 經(jīng)過(guò) 45 多項(xiàng)任務(wù)的嚴(yán)格評(píng)估,涵蓋了一般挑戰(zhàn)和特定領(lǐng)域挑戰(zhàn)。與最先進(jìn)的技術(shù)(包括 Instinct、InstructZero、APE、PromptBreeder、EvoPrompt、DSPy、APO 和 PromptAgent)對(duì)比,PW 在準(zhǔn)確性、效率和適應(yīng)性方面始終優(yōu)于競(jìng)爭(zhēng)對(duì)手。

PromptWizard三個(gè)關(guān)鍵組件
PromptWizard 概述

- 反饋驅(qū)動(dòng)改進(jìn): PW 的核心是利用迭代反饋循環(huán),LLM 在其中生成、批評(píng)和改進(jìn)自己的提示和示例。這種持續(xù)改進(jìn)機(jī)制確保每次迭代都比上一次更好,從而產(chǎn)生高效的提示和示例。
- 多種示例的聯(lián)合優(yōu)化與合成: PW 生成的合成示例不僅穩(wěn)健多樣,而且具有任務(wù)感知能力。通過(guò)同時(shí)優(yōu)化提示和示例,確保它們協(xié)同工作,有效滿(mǎn)足特定任務(wù)要求。
- 自生成思維鏈 (CoT) 步驟:結(jié)合 CoT 推理可提高模型的解決問(wèn)題能力。通過(guò)使用選定的少量樣本,PW 為每個(gè)示例生成詳細(xì)的推理鏈,從而促進(jìn)細(xì)致入微、循序漸進(jìn)的問(wèn)題解決方法。
PromptWizard 的工作原理
PromptWizard 從用戶(hù)輸入開(kāi)始:?jiǎn)栴}描述、初始提示指令和一些作為當(dāng)前任務(wù)基礎(chǔ)的訓(xùn)練示例。
它的輸出是一套經(jīng)過(guò)精煉、優(yōu)化的提示指令,并搭配精心挑選的上下文小樣本示例。這些輸出包含詳細(xì)的推理鏈、任務(wù)意圖和專(zhuān)家資料,將類(lèi)人推理與人工智能的響應(yīng)聯(lián)系起來(lái)。
第一階段:完善提示指令
第一階段側(cè)重于完善提示的任務(wù)說(shuō)明。PromptWizard 生成多個(gè)候選說(shuō)明,使用 LLM 的反饋對(duì)其進(jìn)行評(píng)估,并迭代地綜合改進(jìn)版本。此過(guò)程平衡了探索(嘗試各種想法)和利用(完善最有希望的想法)。
例如,如果初始指令產(chǎn)生的結(jié)果不是最優(yōu)的,PW 會(huì)結(jié)合反饋來(lái)識(shí)別其缺點(diǎn)并生成改進(jìn)版本。經(jīng)過(guò)三到五次迭代,此迭代周期可確保指令收斂到最優(yōu)狀態(tài)。

第二階段:指令與示例的聯(lián)合優(yōu)化
將第一階段得到的精煉提示與精心挑選的示例相結(jié)合,共同優(yōu)化。通過(guò)批判與綜合機(jī)制,PromptWizard 確保提示與示例保持一致,同時(shí)綜合新示例以提升任務(wù)表現(xiàn)。
這種結(jié)構(gòu)化方法使 PromptWizard 具有高度的通用性,可以適應(yīng)從解決數(shù)學(xué)問(wèn)題到生成創(chuàng)意內(nèi)容等各種任務(wù)。
指令與示例的聯(lián)合優(yōu)化

https://github.com/microsoft/PromptWizard
https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-opt本文轉(zhuǎn)載自??PaperAgent??

















