精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

還在死磕AI咒語?北大-百川搞了個自動提示工程系統PAS

人工智能 新聞
基于 Transformer 架構的大語言模型正在各個領域取得突破性成果。提示詞工程(Prompt Engineering)在其中的角色至關重要。

論文共同第一作者鄭淼,來自于周澤南領導的百川對齊團隊,畢業于北京大學,研究方向包括大語言模型、多模態學習以及計算機視覺等,曾主導MMFlow等開源項目。共同第一作者梁昊,北京大學前沿交叉學科研究院博士生,研究方向為大模型數據側,指導老師為張文濤教授。北大-百川智能AI系統聯合實驗室成立于2024年1月,旨在圍繞人工智能模型系統的全技術流程,研究科學和系統的數據生成和質量評估策略、大模型訓練和推理加速等重要問題。聯合實驗室由北京大學博雅特聘教授崔斌和百川智能聯合創始人陳煒鵬擔任主任。

基于 Transformer 架構的大語言模型正在各個領域取得突破性成果。提示詞工程(Prompt Engineering)在其中的角色至關重要。

用好提示詞,研究人員和開發者能夠引導模型在特定任務上表現得更優秀。這種方法不僅能夠顯著提升模型的性能,還能夠增強模型的適應性,使其在面對各種復雜任務時更加靈活和高效。

此外,提示詞工程還能優化模型的學習過程,提高復雜問題處理效率,減少訓練時間和計算資源需求。

相較于傳統的微調方法,提示詞工程能以極低成本使模型適應多個下游任務,大幅節省計算資源和數據收集成本。然而,設計有效的提示詞對非專業人士而言仍具挑戰性,往往需要大量學習和實踐。

直接利用大語言模型進行自動提示工程通常難以取得理想效果。不恰當的提示可能分散模型注意力,反而降低性能。因此,開發一個能輔助用戶,操作簡便的自動提示工程系統變得尤為重要。

PAS:突破性的自動提示工程系統

為應對這一挑戰,北京大學 - 百川聯合實驗室提出了 PAS 自動提示工程系統。PAS 的創新之處在于:

1. 設計高質量的自動提示數據集

2. 對 GPT 模型進行少樣本學習和數據篩選

3. 自動構建精簡而高效的提示數據集

4. 通過微調實現有效的自動提示工程

PAS 能夠對用戶輸入進行簡潔而有效的補充,實現快速、簡單且支持流式顯示的自動提示工程。

在多個基準測試中,PAS 的表現遠超既有的 SOTA 模型,且所需數據量更少。人工評測結果同樣顯示 PAS 具有優異表現,凸顯了其在實際應用中的巨大潛力。

這一突破性成果不僅推動了提示詞工程的發展,也為大語言模型在更廣泛領域的應用鋪平了道路。

圖片

  • 論文地址:https://arxiv.org/abs/2407.06027
  • PKU-Baichuan-MLSystemLab:

https://github.com/PKU-Baichuan-MLSystemLab

https://huggingface.co/PKU-Baichuan-MLSystemLab

方法

圖片

訓練 PAS 主要分為三步:

第一步:構建高質量問題數據集

訓練 PAS 的首要任務是建立一個高質量的問題數據集。如圖 (a) 所示,研究人員根據 LMSYS-1M 和 WildChat 數據集,通過以下三方面篩選出優質問題:

1. 數據去重:運用 embedding 技術結合聚類算法,有效去除重復數據。

2. 質量篩選:利用百川大模型對數據質量進行評估和篩選。

3. 多樣性保證:最終選出覆蓋 10 多個類別的 9000 條高質量問題數據。

第二步:補充提示工程數據

在這一階段,研究人員綜合利用內部積累的 100 條高質量數據和第一步篩選的問題數據,通過 few-shot learning 方法,借助 GPT 模型構建自動提示工程數據:

1. 初始數據生成:使用 few-shot learning 指導 GPT 生成初步的提示工程數據。

2. 質量控制:設計 Critique 步驟,再次利用 few-shot learning 讓 GPT 評估生成數據的質量。

3. 迭代優化:自動篩除低質量數據,并重新生成,通過多輪迭代確保數據質量。

4. 最終成果:最終得到 9000 條高質量的自動提示工程數據。

圖片

數據分布

生成的 9000 條數據的分布情況如上圖所示,確保了數據的多樣性和代表性。

第三步: 微調自動提示模型

最后一步將利用前兩個階段獲得的數據集來微調大型語言模型:

1. 選擇基礎模型:如 Qwen2-7b 等模型。

2. 定向微調:使用高質量數據集進行微調。

3. 專業化訓練:最終得到一個專門用于自動提示工程的大語言模型。

實驗及結果

圖片

人工評測

根據人類評估員的測評,相比先前的 SOTA(State-of-the-Art)模型,PAS 在各領域均展現出較高的勝率。在多個領域的平均勝率超過 50%,勝率與平局率之和更是高達 80% 以上。

圖片

機器評測 Benchmark 

為全面評估 PAS 的性能,研究人員選擇了Arena-Hard、Alpaca-Eval 2.0、Alpaca-Eval 2.0 (LC) 三個 benchmark。

隨后,研究人員將 PAS 應用于六個頂尖的 AI 模型,包括:

  • GPT-4(三個版本)
  • GPT-3.5
  • Qwen2-72-Instruct
  • LLaMA3-70B-Instruct

評測結果顯示:

  • 相較于無提示情況和先前的 SOTA 自動提示工程模型,PAS 均取得了顯著提升。
  • 與之前的 BPO 模型相比,PAS 展現出更強的適應性,能夠與各種超大模型兼容,并在每個模型上都實現了性能提升。

計算效率分析

PAS 不僅在性能上表現卓越,其計算效率也非常高:在數據效率方面,它僅需 9000 條微調數據便能展現出卓越性能。在輸出效率方面,它能夠限制補充自動提示的長度,通常不超過 30 個詞。

對于用戶體驗而言,PAS 也為大模型帶來了增益,具體來說:

  • 與 BPO 等先前模型不同,PAS 無需修改用戶的原始問題,僅進行補充自動提示。
  • 提供極佳的用戶體驗,響應時間可控。
  • 支持類似 GPT 的流式顯示,進一步提升交互體驗。

實例:PAS 幫助大模型繞開邏輯陷阱

「如果樹上有 10 只鳥,其中一只被射死了,地上有多少只鳥?」

這個看似簡單的問題實際上隱藏著一個巧妙的邏輯陷阱,你看到它可能也需要反應幾秒,才知道樹上還剩 9 只鳥,而地上只有 1 只。

圖片

正如圖上所示,在沒有 PAS 輔助的情況下,GPT 給出了錯誤的回答。而 PAS 系統通過補充提示詞,顯著改善了模型的表現:

在 PAS 的引導下,模型新一輪的回答展現出了顯著的提升,不僅成功規避了問題中的邏輯陷阱,展示了清晰的、多步驟的邏輯推理過程,還能在給出正確答案之外引導用戶理解整個推理過程。

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-12-22 17:46:19

2022-07-28 14:22:50

元宇宙AI

2025-11-04 07:20:00

Vue前端開發

2023-09-06 19:44:26

昇騰

2014-11-17 15:09:03

阿里百川淘寶無線

2009-07-27 10:57:37

運維管理ITIL摩卡

2022-03-23 18:00:34

循環CPU線程

2010-03-29 11:08:17

無線技術藍牙3.0

2025-11-13 10:07:08

2023-04-24 08:12:59

2016-08-29 18:45:14

軌道交通銳捷網絡

2009-04-16 08:59:11

2012-12-18 10:38:52

2012年度IT博客大IT博客大賽博客

2017-12-27 13:14:56

SCRM致趣百川

2021-03-01 08:02:55

算法排序操作

2014-11-17 14:58:42

阿里百川淘寶無線

2012-12-04 10:12:56

2012年度IT博客大IT博客大賽博客

2015-07-16 11:57:19

阿里百川移動開發

2025-09-18 08:33:44

點贊
收藏

51CTO技術棧公眾號

精品999视频| eeuss中文字幕| 99爱在线视频| 久久久亚洲高清| 日韩美女在线观看一区| 亚洲精品国产精品国自| 国产一区二区三区免费观看在线 | jizz18女人高潮| 国产精久久一区二区| 精品国产1区2区| 一区二区三区四区免费视频| 风流老熟女一区二区三区| 鲁大师成人一区二区三区| 欧美久久视频| 在线成人av影院| 国产二区视频在线播放| 欧洲不卡av| 2020国产精品久久精品美国| 91久久夜色精品国产网站| 国产无遮挡呻吟娇喘视频| 亚洲色图网站| 国产亚洲精品久久久久久777| wwwxxx色| 中文字幕成人| 欧美亚洲国产一区在线观看网站| 国产精品入口芒果| 岛国成人毛片| 国产精品三级久久久久三级| 精品久久久久久一区二区里番| 国产精品怡红院| 毛片不卡一区二区| 国产不卡av在线免费观看| 国产精品 欧美 日韩| 在线一区免费| 久久久成人的性感天堂| 国产精品天天干| 欧美一区二区三区红桃小说| 欧美一区二区视频在线观看 | 奇米亚洲午夜久久精品| 久久乐国产精品| 538精品在线观看| 99久久婷婷| 日韩在线视频免费观看| 成人无码av片在线观看| 小说区图片区色综合区| 亚洲成人中文字幕| yjizz视频| 国产精品videossex| 日韩欧美国产电影| 91精产国品一二三| 91九色鹿精品国产综合久久香蕉| 在线不卡欧美精品一区二区三区| 97超碰成人在线| 香蕉久久久久久| 成人美女视频在线观看18| 色菇凉天天综合网| 99er在线视频| 肉肉视频在线观看| 一区二区三区成人| 日b视频免费观看| 第一av在线| 亚洲国产精品一区二区久久| 免费看毛片的网址| 操人在线观看| 色综合久久99| 日本女优爱爱视频| 欧美日韩免费电影| 欧美一区二区三区电影| 成人啪啪18免费游戏链接| 福利在线一区| 亚洲精品一区av在线播放| 国产精品久久久久无码av色戒| 精品中文一区| 日韩中文在线观看| 精品国产欧美日韩不卡在线观看 | 黄色一级在线视频| 中文在线а√天堂| 欧美亚洲日本国产| 国产亚洲色婷婷久久| 狠狠一区二区三区| 亚洲天天在线日亚洲洲精| 亚洲精品自拍视频在线观看| 午夜精彩国产免费不卡不顿大片| 欧美激情欧美狂野欧美精品| 久久久精品福利| 免费的国产精品| 99在线看视频| 欧美色视频免费| 中文字幕欧美一区| av免费看网址| 在线一区视频观看| 日韩美女主播在线视频一区二区三区| 强迫凌虐淫辱の牝奴在线观看| 久久91精品| 欧美超级乱淫片喷水| 欧美一区二区激情视频| 免费在线看成人av| 成人欧美一区二区三区在线观看 | 午夜在线视频| 久久尤物电影视频在线观看| 日韩欧美一区二区三区四区 | 欧美自拍视频在线观看| 国产精品久久婷婷| 91日韩在线专区| 宅男在线精品国产免费观看| 高清视频在线观看三级| 欧美日本乱大交xxxxx| 制服丝袜第二页| 国产精品传媒精东影业在线| 国产91精品不卡视频| 国产又大又黄的视频| 91伊人久久大香线蕉| 亚洲三区视频| av电影一区| 日韩欧美一区二区不卡| 免费黄色片网站| 亚洲高清激情| 96精品久久久久中文字幕| 视频午夜在线| 香蕉加勒比综合久久| 成人亚洲免费视频| 精品国产一区二区三区四区| 久久久久久久久久婷婷| 国产又大又黑又粗| 中文字幕的久久| 日韩中文字幕在线视频观看| 日韩欧美高清一区二区三区| 一道本无吗dⅴd在线播放一区| 日本一区二区三区四区五区| 久久国产精品区| 日韩国产欧美精品| 黑人巨大精品| 日韩av在线电影网| 久久高清免费视频| 国产经典欧美精品| dy888午夜| 精品福利视频一区二区三区| 亚洲电影激情视频网站| 亚洲中文字幕无码av永久| www.久久久久爱免| 中文字幕一区二区三区电影| 国产婷婷色一区二区在线观看| 丁香桃色午夜亚洲一区二区三区| 色偷偷一区二区三区| 日韩中文字幕免费在线| 夜夜春成人影院| 国产69久久精品成人| 日本高清视频免费观看| 亚洲资源中文字幕| 岛国大片在线免费观看| 欧美日韩国产亚洲一区| 91成人在线看| 手机电影在线观看| 精品1区2区在线观看| 国产午夜免费视频| 成人永久aaa| 国产二级片在线观看| 欧美三级午夜理伦三级小说| 91av网站在线播放| 男人天堂资源在线| 欧美在线观看视频一区二区| 中文天堂资源在线| 国内精品在线播放| 日本久久久网站| 成人午夜大片| 57pao成人国产永久免费| 久青青在线观看视频国产| 欧美午夜理伦三级在线观看| 天天操夜夜操av| 国产91富婆露脸刺激对白| 国精产品一区一区三区视频| 一道本一区二区三区| 国产精品久久久av久久久| aaa日本高清在线播放免费观看| 欧美日韩精品一区视频| 欧美一区二区三区爽爽爽| 成人国产视频在线观看| 国产真实乱子伦| 日韩一区亚洲二区| 国产精品xxxx| 秋霞国产精品| 美日韩在线视频| 亚洲人成色777777老人头| 在线亚洲人成电影网站色www| 国产精品视频看看| 不卡高清视频专区| 中文字幕 91| 亚洲黄色高清| 亚洲乱码一区二区三区| 99久久免费精品国产72精品九九| 欧美专区在线视频| 国产黄a三级三级三级av在线看| 亚洲成年网站在线观看| 免费一级a毛片| 伊人婷婷欧美激情| 毛片网站免费观看| 午夜伦理在线| 日本道精品一区二区三区 | 亚洲欧洲日韩av| 精品一区二区视频在线观看| 理论片日本一区| 热99这里只有精品| 色琪琪久久se色| 久久久7777| 试看120秒一区二区三区| 国产成人精品999| 草草在线视频| 久久九九免费视频| 国产在线超碰| 亚洲成人激情视频| 国产裸体无遮挡| 欧洲精品在线观看| 在线观看中文字幕视频| 亚洲精品视频在线观看网站| a天堂中文字幕| www.亚洲色图| 日韩精品国产一区| 久久精品国产精品青草| 热久久精品国产| 亚洲久久成人| 成人黄色片免费| 欧美国产美女| 午夜精品一区二区三区四区| 麻豆国产欧美一区二区三区r| 亚洲一区二区三区在线视频| 久久亚洲精品爱爱| 日本高清久久天堂| 超碰高清在线| 伊人成人在线观看| 竹菊久久久久久久| 97超碰人人干| 99国产精品国产精品毛片| 国产成人在线综合| 天堂av在线一区| 日本少妇高潮喷水视频| 国产精品v亚洲精品v日韩精品| 亚洲三区在线观看| 极品色av影院| av在线不卡网| 99riav国产精品视频| 狠狠色丁香婷综合久久| 亚洲欧美日韩一级| 美女爽到高潮91| 成人午夜激情av| 三级亚洲高清视频| 黄色影院一级片| 国产精品视频久久一区| 人妻av中文系列| 国产日本精品| 九色在线视频观看| 在线视频精品| 欧美性久久久久| 久久99伊人| 大肉大捧一进一出好爽动态图| 午夜一区二区三区不卡视频| 男人操女人逼免费视频| 国产欧美精品| 国产精品免费成人| 日韩精品一二三四| 色噜噜狠狠永久免费| 精品在线一区二区| 男插女视频网站| 波多野结衣视频一区| 久久无码人妻精品一区二区三区| 2021中文字幕一区亚洲| 国产精品无码一区二区三区| 久久久久国产精品麻豆ai换脸| 手机看片福利视频| 中文字幕日韩一区| 欧美成人三级在线观看| 午夜精品久久一牛影视| 日韩精品在线观看免费| 欧洲人成人精品| a级片在线视频| 亚洲高清av在线| 日韩一区av| 搡老女人一区二区三区视频tv| 免费网站免费进入在线| 色综合久久悠悠| 九色porny丨首页入口在线| 国产999精品久久久影片官网| 国产成人免费9x9x人网站视频 | 91成人福利视频| 亚洲成a人片在线不卡一二三区| 久久99国产综合精品免费| 欧美亚洲愉拍一区二区| 99久久精品国产一区色| 亚洲护士老师的毛茸茸最新章节| 国产福利在线看| 欧美成人精品h版在线观看| 超碰在线97国产| 国产精品视频播放| 99re8这里有精品热视频8在线| 国产日韩一区欧美| 欧美人与牛zoz0性行为| 在线观看18视频网站| 国产毛片一区| 国产福利精品一区二区三区| 成人av网站大全| 国产亚洲精品久久久久久豆腐| 亚洲成在人线在线播放| 一二三区在线播放| 日韩精品极品视频| 国产成人l区| 国产99视频精品免视看7| 久久久久久久久成人| 日本视频一区二区在线观看| 欧美特黄一区| 日本在线观看免费视频| 99视频国产精品| 亚洲天堂精品一区| 欧美日韩亚洲一区二区三区| 国产毛片久久久久| 亚洲女同精品视频| 俺来俺也去www色在线观看| 成人免费淫片aa视频免费| 九九久久婷婷| 青青青免费在线| 国产成人免费xxxxxxxx| 日韩无码精品一区二区| 国产精品激情偷乱一区二区∴| 在线观看亚洲天堂| 欧美成人性福生活免费看| 日本激情视频在线观看| 日韩av电影中文字幕| 麻豆成人入口| 五月丁香综合缴情六月小说| 国产精品18久久久| 乱h高h女3p含苞待放| 成年人黄视频在线观看| 亚洲3p在线观看| 久久的色偷偷| 国产免费一区二区三区四在线播放| 久久视频一区| 三上悠亚ssⅰn939无码播放 | 国产成人毛片| 欧美亚洲免费在线| 亚洲免费在线| 国产偷人妻精品一区| 亚洲sss视频在线视频| 国产精品一区二区av| 你懂的一区二区三区| 亚洲自偷自拍熟女另类| 91亚洲大成网污www| 色婷婷av国产精品| 日韩成人在线播放| 欧亚av在线| 久久精品五月婷婷| 久久亚洲图片| 亚洲av毛片基地| 欧美视频你懂的| 亚洲成人三级| 91热福利电影| 欧美激情亚洲| 99久久久无码国产精品性波多| 亚洲高清一区二区三区| 手机在线观看免费av| 97视频人免费观看| 亚州av一区| 国产嫩草在线观看| 国产精品久久久久一区二区三区| 亚洲视频在线免费播放| 日韩中文字幕第一页| 免费精品一区| 国产精品久久久久9999爆乳| 成人av电影在线| 无码人妻丰满熟妇区五十路| 中文字幕不卡av| 精品久久国产一区| 黄色一级片在线看| 成黄免费在线| 国产精品v日韩精品| 国产精品99久久精品| 日本中文字幕有码| 国产99久久久国产精品成人免费| 宅男噜噜99国产精品观看免费| 国产精品一区不卡| 日韩手机在线观看| 亚洲日韩中文字幕| 看亚洲a级一级毛片| 欧美大片在线播放| 中文字幕第一区综合| 亚洲免费成人网| 国产精品久久久久久久久久新婚 | 午夜久久久久久久久久久| 成人免费高清视频在线观看| 黄色av一级片| 欧美老女人性生活| 综合伊思人在钱三区| www激情五月| 色综合天天天天做夜夜夜夜做| 日韩伦理在线观看| 国产在线精品一区二区中文| 毛片一区二区三区| 国产又大又黑又粗免费视频| 中文字幕在线精品| 国产伦乱精品| 涩涩网站在线看| 色偷偷成人一区二区三区91| 成人免费高清|