精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?這次重生,AI要奪回網文界的一切

人工智能
論文作者首次嘗試了用 AI 智能體來微調語言模型,發現了諸多優勢,由此提出了一種新的智能體架構。

重生了,這輩子我重生成了 MidReal。一個可以幫別人寫「網文」的 AI 機器人。

這段時間里,我看到很多選題,偶爾也會吐槽一下。竟然有人讓我寫寫 Harry Potter。拜托,難道我還能寫的比 J?K?Rowling 更好不成?不過,同人什么的,我還是可以發揮一下的。

經典設定誰會不愛?我就勉為其難地幫助這些用戶實現想象吧。

實不相瞞,上輩子我該看的,不該看的,通通看了。就下面這些主題,都是我愛慘了的。

那些你看小說很喜歡卻沒人寫的設定,那些冷門甚至邪門的 cp,都能自產自嗑。

不是我自夸,只要你想要我寫,我還真能給你寫出個一二三來。結局不喜歡?喜歡的角色「中道崩殂」?作者寫到一半吃書了?包在我身上,給你寫到滿意。

甜文,虐文,腦洞文,每一種都狠狠擊中你的爽點。

聽完MidReal的自述,你對它了解了嗎?

MidReal 可以根據用戶提供的情景描述,生成對應的小說內容。情節的邏輯與創造力都很優秀。它還能在生成過程中生成插圖,更形象地描繪你所想象的內容。互動功能也是亮點之一,你可以選擇想要的故事情節進行發展,讓整體更加貼合你的需求。

在對話框中輸入 /start,就可以開始講述你的故事了,還不快來試試?

MidReal 傳送門:https://www.midreal.ai/

MidReal 背后的技術源于這篇論文《FireAct:Toward Language Agent Fine-tuning》。論文作者首次嘗試了用 AI 智能體來微調語言模型,發現了諸多優勢,由此提出了一種新的智能體架構。

MidReal 就是基于這種架構的,網文才能寫得這么好。

論文鏈接:https://arxiv.org/pdf/2310.05915.pdf

雖然智能體和微調大模型都是最熱門的 AI 話題,但它們之間具體有何聯系還不清楚。System2 Research、劍橋大學等的多位研究者對這片鮮有人涉足的「學術藍海」進行了發掘。

AI 智能體的開發通常基于現成的語言模型,但由于語言模型不是作為智能體而開發的,因此,延伸出智能體后,大多數語言模型的性能和穩健性較差。最聰明的智能體只能由 GPT-4 支持,它們也無法避免高成本和延遲,以及可控性低、重復性高等問題。

微調可以用來解決上面的這些問題。也是在這篇文章中,研究者們邁出了更加系統研究語言智能體的第一步。他們提出了 FireAct ,它能夠利用多個任務和提示方法生成的智能體「行動軌跡」來微調語言模型,讓模型更好地適應不同的任務和情況,提高其整體性能和適用性。

方法簡介

該研究主要基于一種流行的 AI 智能體方法:ReAct。一個 ReAct 任務解決軌跡由多個「思考 - 行動 - 觀察」回合組成。具體來說,讓 AI 智能體完成一個任務,語言模型在其中扮演的角色類似于「大腦」。它為 AI 智能體提供解決問題的「思考」和結構化的動作指示,并根據上下文與不同的工具交互,在這個過程中接收觀察到的反饋。

在 ReAct 的基礎上,作者提出了 FireAct,如圖 2 所示,FireAct 運用強大的語言模型的少樣本提示來生成多樣化的 ReAct 軌跡,用以微調較小規模的語言模型。與此前類似研究不同的是,FireAct 能夠混合多個訓練任務和提示方法,大大促進了數據的多樣性。

作者還參考了兩種與 ReAct 兼容的方法:

  • 思維鏈(CoT)是生成連接問題和答案的中間推理的有效方法。每個 CoT 軌跡可以簡化為一個單輪 ReAct 軌跡,其中「思維」代表中間推理,「行動」代表返回答案。在不需要與應用工具交互的情況下,CoT 尤其有用。
  • Reflexion 主要遵循 ReAct 軌跡,但加入了額外的反饋和自我反思。該研究中,僅在 ReAct 的第 6 輪和第 10 輪提示進行反思。這樣一來,長的 ReAct 軌跡就能為解決當前任務提供策略「支點」,能夠幫助模型解決或調整策略。例如搜索「電影名」得不到答案時,應該把搜索的關鍵詞換成「導演」。

在推理過程中,FireAct 框架下的 AI 智能體顯著減少了提示詞的樣本數量需求,推理也更加高效和簡便。它能夠根據任務的復雜度隱式地選擇合適的方法。由于 FireAct 具備更廣泛和多樣化的學習支持,與傳統的提示詞微調方法相比,它展現出更強的泛化能力和穩健性。

實驗及結果

任務數據集:HotpotQA,Bamboogle,StrategyQA,MMLU。

  • HotpotQA 是一個 QA 數據集,對多步驟推理和知識檢索有著更具挑戰性的考驗。研究者使用 2,000 個隨機訓練問題進行微調數據整理,并使用 500 個隨機 dev 問題進行評估。
  • Bamboogle 是一個由 125 個多跳問題組成的測試集,其格式與 HotpotQA 相似,但經過精心設計,以避免直接用谷歌搜索解決問題。
  • StrategyQA 是一個需要隱式推理步驟的是 / 否 QA 數據集。
  • MMLU 涵蓋初等數學、歷史和計算機科學等不同領域的 57 個多選 QA 任務。

工具:研究者使用 SerpAPI1 構建了一個谷歌搜索工具,該工具會從「答案框」、「答案片段」、「高亮單詞」或「第一個結果片段」中返回第一個存在的條目,從而確保回復簡短且相關。他們發現,這樣一個簡單的工具足以滿足不同任務的基本質量保證需求,并提高了微調模型的易用性和通用性。

研究者研究了三個 LM 系列:OpenAI GPT、Llama-2 以及 CodeLlama。

微調方法:研究者在大多數微調實驗中使用了低秩自適應(Low-Rank Adaptation,LoRA),但在某些比較中也使用了全模型微調。考慮到語言代理微調的各種基本因素,他們將實驗分為三個部分,復雜程度依次增加: 

  • 在單一任務中使用單一提示方法進行微調; 
  • 在單一任務中使用多種方法進行微調; 
  • 在多個任務中使用多種方法進行微調。

1.在單一任務中使用單一提示方法進行微調

研究者探討了使用來自單一任務(HotpotQA)和單一提示方法(ReAct)的數據進行微調的問題。通過這種簡單而可控的設置,他們證實了微調相對于提示的各種優勢(性能、效率、穩健性、泛化),并研究了不同 LM、數據大小和微調方法的效果。

如表 2 所示,微調能持續、顯著地改善 HotpotQA EM 的提示效果。雖然較弱的 LM 從微調中獲益更多(例如,Llama-2-7B 提高了 77%),但即使是像 GPT-3.5 這樣強大的 LM 也能通過微調將性能提高 25%,這清楚地表明了從更多樣本中學習的好處。與表 1 中的強提示基線相比,研究者發現經過微調的 Llama-2-13B 優于所有 GPT-3.5 提示方法。這表明對小型開源 LM 進行微調的效果可能優于對更強大的商用 LM 進行提示的效果。

在智能體推理過程中,微調的成本更低,速度更快。由于微調 LM 不需要少量的上下文示例,因此其推理效率更高。例如,表 3 的第一部分比較了微調推理與 shiyongtishideGPT-3.5 推理的成本,發現推理時間減少了 70%,總體推理成本也有所降低。

研究者考慮到一個簡化且無害的設置,即搜索 API 有 0.5 的概率返回「None」或隨機搜索響應,并詢問語言智能體是否仍能穩健地回答問題。如表 3 第二部分所示,「None」的設置更具挑戰性,它使 ReAct EM 降低了 33.8%,而 FireAct EM 僅降低了 14.2%。這些初步結果表明,更多樣化的學習支持對于提高穩健性非常重要。

表 3 的第三部分顯示了經過微調的和使用提示的 GPT-3.5 在 Bamboogle 上的 EM 結果。雖然經過 HotpotQA 微調或使用提示的 GPT-3.5 都能合理地泛化到 Bamboogle,但前者(44.0 EM)仍然優于后者(40.8 EM),這表明微調具有泛化優勢。

2.在單一任務中使用多種方法進行微調

作者將 CoT 和 Reflexion 與 ReAct 集成,測試了對于在單一任務(HotpotQA)中使用多種方法進行微調的性能。對比 FireAct 和既有方法的在各數據集中的得分,他們有以下發現:

首先,使用多種方法微調提高了智能體的靈活性。如圖 5 所示,在定量結果之外,研究者向我們展示了兩個示例問題,以說明多方法 FireAct 微調的好處。第一個問題比較簡單,但僅使用 ReAct 微調的智能體搜索了一個過于復雜的查詢,導致注意力分散,提供了錯誤的答案。相比之下,同時使用 CoT 和 ReAct 微調的智能體自信地選擇依靠自己的內部知識,在一輪內完成了任務。第二個問題難度更高,僅使用 ReAct 微調的智能體未搜索出有用的信息。相比之下,同時使用 Reflexion 和 ReAct 微調的智能體在搜索碰壁時進行了反思,并改變了搜索策略,從而得到了正確答案。靈活地為不同問題選擇解決方案,是 FireAct 相較于提示等微調方法的關鍵優勢。

其次,使用多方法微調不同的語言模型將產生不同的影響。如表 4 所示,綜合使用多種智能體進行微調并不總是能帶來提升,最優的方法組合取決于基礎語言模型。例如,對于 GPT-3.5 和 Llama-2 模型,ReAct+CoT 優于 ReAct,但對于 CodeLlama 模型則不同。對于 CodeLlama7/13B,ReAct+CoT+Reflexion 的效果最差,但 CodeLlama-34B 卻能取得最好的效果。這些結果表明,還需進一步研究基礎語言模型和微調數據之間的相互作用。

為了進一步了解組合了多種方法的智能體是否能夠根據任務選擇恰當的解決方案,研究者計算了在推理過程中隨機選擇方法的得分。該得分(32.4)遠低于所有組合了多種方法的智能體,這表明選擇解決方案并非易事。然而,每個實例的最佳方案的得分也僅為 52.0,這表明在提示方法選擇方面仍有提升空間。

3.在多個任務中使用多種方法進行微調

到這里,微調只使用了 HotpotQA 數據,但有關 LM 微調的實證研究表明,混合使用不同的任務會有益處。研究者使用來自三個數據集的混合訓練數據對 GPT-3.5 進行微調:HotpotQA(500 個 ReAct 樣本,277 個 CoT 樣本)、StrategyQA(388 個 ReAct 樣本,380 個 CoT 樣本)和 MMLU(456 個 ReAct 樣本,469 個 CoT 樣本)。

如表 5 所示,加入 StrategyQA/MMLU 數據后,HotpotQA/Bamboogle 的性能幾乎保持不變。一方面,StrategyQA/MMLU 軌跡包含的問題和工具使用策略大不相同,這使得遷移變得困難。另一方面,盡管分布發生了變化,但加入 StrategyQA/MMLU 并沒有影響 HotpotQA/Bamboogle 的性能,這表明微調一個多任務代理以取代多個單任務代理是未來可以發展的方向。當研究者從多任務、單一方法微調切換到多任務、多方法微調時,他們發現所有任務的性能都有所提高,這再次明確了多方法代理微調的價值。

想要了解更多技術細節,請閱讀原文。

參考鏈接:

  • https://twitter.com/Tisoga/status/1739813471246786823
  • https://www.zhihu.com/people/eyew3g
責任編輯:趙寧寧 來源: 機器之心
相關推薦

2024-05-10 09:16:01

模型數據

2020-09-16 11:46:05

AI

2025-03-10 13:11:00

2020-09-11 10:55:10

useState組件前端

2012-12-31 11:22:58

開源開放

2021-03-23 23:17:18

AI人工智能

2021-02-28 09:47:54

軟件架構軟件開發軟件設計

2021-02-19 23:08:27

軟件測試軟件開發

2018-11-23 11:17:24

負載均衡分布式系統架構

2023-12-28 16:33:57

2025-03-10 13:04:21

2016-08-31 17:24:05

大數據分析

2019-08-20 09:24:54

Python編程語言Java

2025-03-20 07:20:00

2023-12-07 19:01:25

2021-05-28 07:12:59

Python閉包函數

2020-10-14 08:04:28

JavaScrip

2012-11-05 15:22:59

康普光纜DCD

2021-09-01 07:21:39

Exporter指標監控
點贊
收藏

51CTO技術棧公眾號

日韩中文字幕区一区有砖一区| 77成人影视| 国产精品免费丝袜| 3d精品h动漫啪啪一区二区| 激情五月少妇a| 嫩草国产精品入口| 欧美日韩二区三区| www.日本在线播放| 在线观看h片| 成人免费不卡视频| 国产精品久久在线观看| 久久国产露脸精品国产| 国产成人精品999在线观看| 欧美男男青年gay1069videost| 天堂8在线天堂资源bt| 你懂的在线视频| 国产精品一区二区黑丝| 国产mv免费观看入口亚洲| 日韩视频中文字幕在线观看| 一区二区美女| 日韩欧美久久久| 一路向西2在线观看| 国产福利片在线观看| 亚洲欧洲99久久| 奇米精品在线| 色噜噜在线播放| 国产综合色产在线精品| 日本欧美爱爱爱| 日韩三级小视频| 91精品秘密在线观看| 国产一区二区久久精品| 少妇一级淫片免费放播放| 国产亚洲精aa在线看| 欧美中文字幕一区二区三区| 黄色一级片播放| 亚洲淫性视频| 亚洲欧美日韩国产手机在线| 日韩国产欧美一区| 欧美日韩免费做爰大片| 成人av网站大全| 97超碰人人看人人 | 成人精品一区二区三区| 亚洲av中文无码乱人伦在线视色| 红桃视频国产一区| 九九热视频这里只有精品| 你懂得在线观看| 日韩av密桃| 亚洲最新中文字幕| 国产精品密蕾丝袜| 视频国产一区| 亚洲午夜小视频| jizz中文字幕| 欧美综合视频| 亚洲欧美一区二区激情| 97人妻精品一区二区免费| 亚洲第一二三区| 亚洲欧洲日产国码av系列天堂| 国内精品久久99人妻无码| 色综合www| 亚洲小视频在线观看| 永久免费看mv网站入口78| 国产欧美一区| 色阁综合伊人av| 日韩三级在线观看视频| 你懂的成人av| 久久免费视频在线| www.国产一区二区| 免费观看久久久4p| 成人一区二区电影| 亚洲美女福利视频| 99re热视频精品| 青娱乐国产91| 蜜桃视频网站在线| 亚洲国产另类av| 精品人妻一区二区三区四区在线| 亚洲女同av| 欧美日韩一区二区三区在线| 91免费视频污| 天美av一区二区三区久久| 国产一区二区久久精品| 一区二区三区四区五区| 激情视频一区| 国产精品1区2区在线观看 | 精品一区二区三区的国产在线播放| 国产欧美日韩免费看aⅴ视频| 精品国产乱码一区二区三| 99久久婷婷国产| 亚洲高清资源综合久久精品| h网站久久久| 懂色av中文一区二区三区天美| 国产精品99久久免费黑人人妻| 99精品国产九九国产精品| 日韩av网址大全| 亚洲精品国产成人久久av盗摄| 国产91沈先生在线播放| 国产免费不卡| 日韩一区二区精品葵司在线| 国产美女喷水视频| 伊人久久大香线| 日本一区二区在线播放| 国产绳艺sm调教室论坛| 91麻豆国产福利在线观看| 黄色免费高清视频| 波多野结衣久久精品| 日韩一卡二卡三卡国产欧美| 国产黄色网址在线观看| 伊人久久大香线蕉综合四虎小说| 青草成人免费视频| 国产丰满美女做爰| 国产欧美日韩精品在线| heyzo亚洲| 精品视频国内| 色小说视频一区| 亚洲天堂视频网站| 国产盗摄一区二区三区| 日韩欧美视频第二区| 2020av在线| 91精品国产全国免费观看| 中文字幕免费高清| 99精品免费| 91在线直播亚洲| 91露出在线| 一本色道久久综合狠狠躁的推荐 | 欧美系列精品| 亚洲免费视频观看| www..com国产| 国产成人午夜精品5599| 正在播放国产精品| 全球最大av网站久久| 亚洲欧美在线免费| 日本免费观看视| 成人看片黄a免费看在线| 亚洲区成人777777精品| 欧美亚洲人成在线| 中文字幕日韩高清| 中文字幕理论片| 国产视频在线观看一区二区三区 | 亚洲精品在线视频观看| 午夜精品成人av| 亚洲日本成人女熟在线观看| 男女视频免费看| 国产这里有精品| 亚洲区第一页| 国产精品乱码| 国产经典三级在线| 精品精品欲导航| 久久午夜无码鲁丝片午夜精品| 九色综合狠狠综合久久| 亚洲图片在线观看| 日韩av黄色| 久久久国产精品x99av | 一区二区在线观看网站| 91丨精品丨国产| 久久久999精品免费| 国产免费高清视频| 亚洲精品日日夜夜| 波多野吉衣在线视频| 亚洲大片av| 久久婷婷国产综合尤物精品| 成人av三级| 91国模大尺度私拍在线视频| 国产真人真事毛片视频| 老汉av免费一区二区三区| 一区高清视频| 日韩av综合| 91精品国产91久久久| 日本一区二区三区在线观看视频| 色偷偷88欧美精品久久久| 成熟人妻av无码专区| 精品无人码麻豆乱码1区2区| 热久久最新网址| 日本午夜精品久久久| 国产精品都在这里| 成人在线免费看黄| 亚洲大胆人体在线| 亚洲国产精品无码久久久| 中文在线一区二区| 亚洲精品久久久久久| 日韩午夜免费| 亚洲国产精品综合| 第四色在线一区二区| 国产精品嫩草视频| 一区二区三区伦理| 亚洲视频视频在线| 国产女同91疯狂高潮互磨| 五月开心婷婷久久| 青青青手机在线视频| 成人国产一区二区三区精品| 免费在线观看日韩视频| 99视频精品全部免费在线视频| 99精彩视频| 深夜成人福利| 欧美激情欧美激情| 日本高清久久一区二区三区| 成人av三级| 九九视频直播综合网| 黄色av免费在线观看| 日韩亚洲欧美一区二区三区| 国产精品久久久久久人| 一区二区三区国产豹纹内裤在线| 精品无码一区二区三区| 国产精品一区一区| 九一精品在线观看| 精品动漫3d一区二区三区免费| 亚洲国产日韩综合一区| 好吊妞国产欧美日韩免费观看网站 | 青青青爽久久午夜综合久久午夜| 青青草综合视频| 成人激情电影在线| 极品校花啪啪激情久久| 精品国产亚洲一区二区三区| 2024亚洲男人天堂| bl在线肉h视频大尺度| 日韩视频中文字幕| 成年女人的天堂在线| 亚洲电影第1页| 99久久精品国产一区色| 欧美色区777第一页| 日韩特级黄色片| 亚洲精品日产精品乱码不卡| 中文字幕伦理片| 26uuu精品一区二区三区四区在线| 欧美xxxxxbbbbb| 精品一区二区免费看| 91视频免费版污| 麻豆九一精品爱看视频在线观看免费| 国产成人一区二区三区别| 99久久99久久精品国产片桃花| 日韩高清在线播放| 教室别恋欧美无删减版| 欧美激情www| 欧美激情久久久久久久久久久| 国产精品xxxx| 亚洲精品在线播放| 91av免费看| 秋霞午夜一区二区三区视频| 成人黄色免费片| 96sao精品免费视频观看| 国产欧美va欧美va香蕉在| 亚洲电影有码| 国产脚交av在线一区二区| 二区三区不卡| 国产成+人+综合+亚洲欧洲| 偷拍中文亚洲欧美动漫| 国产精品久久久91| 日韩不卡在线| 国产在线观看一区二区三区 | 国产精品久久久久久久久婷婷 | 亚洲国产你懂的| 青青草偷拍视频| 一区二区三区四区不卡在线 | 在线精品观看国产| 波多野结衣视频网址| 欧美视频在线播放| 国产一区二区麻豆| 日韩一区二区在线观看| 亚洲国产剧情在线观看| 亚洲黄色在线观看| 九色在线观看视频| 中文字幕在线精品| yellow91字幕网在线| 欧美国产日韩在线| www成人免费观看| 国产激情久久久久| 国产亚洲字幕| 国产青春久久久国产毛片| 中国av一区| 一区二区三区四区| 欧美欧美天天天天操| 六月丁香激情网| 日本在线观看不卡视频| www.亚洲自拍| www.一区二区| 国产农村妇女精品一区| 亚洲激情中文1区| 国产情侣自拍av| 欧美日韩中文字幕一区| 亚洲爆乳无码一区二区三区| 亚洲女同性videos| 麻豆传媒在线完整视频| 高清欧美性猛交xxxx| 国产经典一区| 成人在线观看网址| 欧美手机视频| 2022中文字幕| 三级精品在线观看| 在线播放av网址| 国产日韩在线不卡| 欧美片一区二区| 欧美综合久久久| 午夜精品小视频| 一区二区亚洲精品国产| 性直播体位视频在线观看| 国产精品xxxxx| 中文字幕亚洲在线观看| 午夜精品电影在线观看| 激情久久久久久| 国产一区二区在线观看免费视频| 成人激情午夜影院| 亚洲一区电影在线观看| 欧美日韩激情网| a在线观看免费| 一夜七次郎国产精品亚洲| 欧美黄色视屏| 国产日韩在线看| 久久91麻豆精品一区| 欧美 日韩 国产精品| 美腿丝袜一区二区三区| 黄色在线观看av| 亚洲午夜精品网| 久久久久亚洲av无码麻豆| 同性恋视频一区| 国产精品亚洲天堂| 日韩av不卡在线观看| a天堂视频在线观看| 亚洲欧美日韩在线不卡| 日韩乱码一区二区三区| 亚洲精品国产品国语在线| 污视频网站免费在线观看| 国产一区二区丝袜| 狠狠综合久久av一区二区蜜桃 | 亚洲在线色站| 久久国产高清| 国产精品300页| 亚洲第一综合色| 国产成人精品白浆久久69| 日日狠狠久久偷偷四色综合免费| av在线日韩| 视频一区二区三区在线观看| 美日韩精品视频| 中文字幕高清视频| 欧美日韩激情小视频| 神马午夜精品95| 国内精品在线一区| 风间由美一区二区av101| 国产精品日韩三级| 国产91在线观看丝袜| 欧美日韩免费做爰视频| 日韩亚洲欧美高清| 免费在线观看的电影网站| 成人区精品一区二区| 韩日在线一区| 国产污在线观看| 五月激情综合色| 亚洲欧美日韩精品永久在线| 欧美一级片久久久久久久| 婷婷综合福利| 日韩免费高清在线| 国产精品久久二区二区| 国产又爽又黄免费软件| 久久最新资源网| 亚洲精品在线国产| 热99这里只有精品| 久久精品综合网| 在线不卡免费视频| 久久综合久中文字幕青草| 亚洲三级av| 欧美视频在线免费播放| 久久看人人爽人人| 欧美另类高清videos的特点| 日韩在线观看精品| 日韩在线网址| 波多野结衣之无限发射| 久久久久久久久岛国免费| 亚洲中文无码av在线| 久久成人国产精品| 国产精品17p| 免费国产成人av| 亚洲欧美精品午睡沙发| 黄频在线免费观看| 日韩美女毛茸茸| 91精品秘密在线观看| 黄色网址在线视频| 欧美视频一区二区| 婷婷在线播放| 日本一区二区三区视频免费看| 久久成人羞羞网站| 豆国产97在线 | 亚洲| 亚洲色图综合网| 精品国产一区二| 国产成人精品视频免费看| 国产精品三级电影| 亚洲乱码在线观看| 国产精品久久久久久久久晋中| 一本之道在线视频| 亚洲超碰精品一区二区| 成a人片在线观看www视频| www.成人三级视频| 久久精品主播| 免费日韩在线视频| 亚洲人成在线免费观看| 麻豆精品国产| 欧美牲交a欧美牲交aⅴ免费真| 亚洲人妖av一区二区| 日韩电影免费| 亚洲综合自拍一区| 日本欧美韩国一区三区| 国产精品第108页| 日韩在线精品一区| 一本色道久久综合狠狠躁的番外|