精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?LangGraph 助力代碼生成新境界

發布于 2025-8-28 06:59
瀏覽
0收藏

研究初衷

在大型語言模型(LLMs)的眾多應用中,代碼生成與分析尤為關鍵,這從產品 GitHub co-pilot 的廣泛應用和 GPT-engineer 等項目的熱度可見一斑。AlphaCodium 的最新進展展示出,與傳統“提示-應答”方法不同,“流程”式編程通過測試與反思答案,進而迭代改進,能更好地推動代碼的生成。

?LangGraph 助力代碼生成新境界-AI.x社區

AlphaCodium 的流程法則

我們最近推出了 LangGraph,這是一種以圖表形式表示與設計流程的工具。受到 AlphaCodium 和 Reflexion 工作的激勵,我們想借助 LangGraph 在代碼生成中實現類似的迭代循環和關鍵決策點。

具體而言,我們試圖構建并比較兩種架構:

  • 基于提示與上下文填充的代碼生成
  • 涉及校驗執行代碼的流程化代碼生成,出現錯誤時能自我糾錯

這個嘗試旨在探究:這種代碼檢驗能在多大程度上提升代碼生成系統的性能?

結果如何呢?

??

?與僅進行單次生成的基本方法相比,涉及校驗與自我修正的系統展現出顯著進步( 81% 對 55%

問題背景

為了在有限的文檔庫上展示代碼生成能力,我們選擇了 LangChain 的文檔子集,著重于 LangChain 表達式語言(LCEL),其范圍小(大約 60k 標記)且備受關注。我們篩選了連續 30 天的 ??chat-langchain??? 中與 LCEL 相關的問題(代碼在此)。從 ??>60k 聊天記錄??? 共篩選出 ??~500?? 條提到 LCEL 的記錄。我們對這約 500 條記錄進行聚類,由 LLM(GPT-4,128k)歸納總結,以得出每個類別中的代表性問題。每個問題我們都進行了手動審核,并制定了標準答案(含 20 個問題的評估集在這里)。我們把此數據集加到了 LangSmith。

?LangGraph 助力代碼生成新境界-AI.x社區

生成 LCEL 教材評估集合流程

利用 LangGraph 進行反射式代碼生成

我們設計并實踐了一個包含如下環節的代碼生成流程:

  • 受到長上下文 LLMs 的新動向啟發,我們利用 GPT-4(128k 令牌上下文窗口)的能力將 60k 令牌的 LCEL 文檔詳盡填充。我們向經處理過的 LCEL 鏈條提交 LCEL 相關問題,以啟動初步答案的生成。
  • 我們使用 OpenAI 工具對成果進行了解析,將輸出轉化為擁有三個部分的 Pydantic 對象:(1)問題描述,(2)導入模塊部分,(3)代碼本體。
  • 我們首先對導入模塊進行執行測試,因為我們曾發現在代碼生成過程中,幻覺可能悄然滲入導入語句之中。
  • 導入模塊測試通過后,我們接著確認代碼本身是否可執行。在代碼生成時,我們特別指導 LLM 防止代碼中出現偽代碼或未定義變量,以確保代碼能夠被執行。
  • 其中,若上述任一測試失敗,我們就會將錯誤堆棧與先前的回答一起傳回生成環節以供反思。默認我們會重試 3 次,當然這個次數根據需求還可以增加。

?LangGraph 助力代碼生成新境界-AI.x社區

集錯誤檢測、反饋及反思于一體的 LangGraph 代碼執行流程

利用 LangSmith 進行的評估

我們設立了不涉及 LangGraph 的 “上下文填充” 基準線,即在我們的流程圖中這一環節并未執行任何檢測或反饋:同樣利用 GPT-4 的 128k 令牌上下文窗口,我們將 60k 令牌的 LCEL 文檔進行充實。我們提交了與 LCEL 相關的問題以生成答案。

我們為兩個部分

(1)導入模塊的評估

(2)代碼執行的評估

實現了 LangSmith 的自定義評價功能。

我們在 “上下文填充” 的 20 個問題評估集上進行了四輪評估。評估結果在此。通過上下文填充進行的評估表明 ??~98%??? 的導入模塊測試是準確的,而代碼執行成功率約 ??~55%???(??N=79?? 次成功嘗試)。

我們通過 LangSmith 分析了失敗的案例:案例分析,一個典型的錯誤是沒能注意到 ??RunnableLambda??? 函數的輸入應當是 ??dict???,反而將其誤認為 ??string???:??AttributeError: 'dict' object has no attribute 'upper'??

接下來,我們對“通過上下文填充 + LangGraph”的情況進行了測試,通過執行測試以篩查導入和代碼執行中的錯誤,并在生成更新的答案時進行反思。在相同的評估集上,我們觀察到 ??100%??? 的導入測試是準確的,以及 ??~81%??? 的代碼執行測試是成功的(??N=78?? 次嘗試)。

以上述失敗案例為例,我們可以看到系統是如何進行處理的:完整的錯誤跟蹤顯示,我們在回答問題的第二次嘗試中遇到了同樣的錯誤詳情。在后續的反思環節中,我們提供了先前的解決方案和隨之出現的錯誤:

您之前嘗試解決過這個問題。
...
--- 最近的運行錯誤 ---
執行錯誤:'dict' 對象沒有 'upper' 屬性
...
請再次嘗試回答這個問題。
...

最終的代碼正確處理了 ??RunnableLambda??? 函數中的輸入字典,避免了 ??上下文填充??? 情況中出現的錯誤。總的來看,通過使用 LangGraph 添加這個簡單的反思步驟進行重試后,代碼執行的準確率得到了 ??~47%?? 的提高:

?LangGraph 助力代碼生成新境界-AI.x社區

使用與不使用 LangGraph 的導入及代碼執行 LangSmith 評測對比

結論總結

LangGraph 以其流程設計的便捷性,助力了復雜循環和決策點的設置。最新研究證明,這種設計對于代碼生成極具價值,能夠迭代并利用測試來檢驗答案,通過反思錯誤,不斷完善最終的解決方案。我們使用 LangGraph 實現了這一流程,并在關于 LCEL 的 20 個問題中進行了代碼導入和執行的測試。結果顯示,“上下文填充 + LangGraph” 結合反思的模式相比于僅有的“上下文填充”,在代碼執行方面取得了 ??~47%?? 的顯著提升。這一流程的應用案例在這里,并且可以輕松擴展至其他代碼庫,供相關人員參考。

已于2025-8-28 17:07:25修改
收藏
回復
舉報
回復
相關推薦
日本在线免费观看| 看av免费毛片手机播放| 国产美女三级无套内谢| 国产精品99在线观看| 日韩欧美一区在线观看| 国产中文字幕二区| 欧美日韩国产中文字幕在线| 日本不卡中文字幕| 不用播放器成人网| 欧美色图亚洲激情| 国产亚洲人成a在线v网站 | 亚洲福利国产精品| 日韩av一级大片| 国产av无码专区亚洲av| 外国成人免费视频| 亚洲第一精品自拍| 91n.com在线观看| 番号在线播放| 成人午夜碰碰视频| 国产精品久久一| 欧洲猛交xxxx乱大交3| 免费成人av| 欧美一区二区三区精品| 18禁免费观看网站| 97视频在线观看网站| 日韩精品久久理论片| 日韩亚洲一区二区| 国产69视频在线观看| 成年人黄色大片在线| 亚洲国产成人久久综合一区| 久久天天狠狠| 亚洲天堂免费av| 亚洲精品影院在线观看| 激情五月激情综合| 亚洲一二av| 国产成人一区二区三区影院| 99成人免费视频| 日本va欧美va欧美va精品| 日韩有码视频在线| 色婷婷精品久久二区二区密| 亚洲综合视频| 欧美日韩一区二区在线观看| 成人免费aaa| 羞羞网站在线免费观看| 国产精品国产三级国产aⅴ无密码| 成人欧美一区二区| 91亚洲欧美激情| 日日摸夜夜添夜夜添亚洲女人| 久久人人97超碰精品888| 秋霞欧美一区二区三区视频免费| 免费视频亚洲| 日韩高清免费观看| 老熟妇精品一区二区三区| 亚洲不卡视频| 欧美猛男gaygay网站| 蜜桃免费在线视频| xxxxx性欧美特大| 亚洲成a人片在线观看中文| 狠狠精品干练久久久无码中文字幕| а√天堂在线官网| 中文字幕一区二区不卡| 亚洲高清精品中出| av在线之家电影网站| 国产色爱av资源综合区| 欧美自拍资源在线| 国产一区二区三区福利| 国产精品久久一级| 欧美91在线| 国产一区二区三区在线观看免费视频 | 日韩精品免费在线| 欲求不满的岳中文字幕| 91麻豆精品激情在线观看最新| 91精品国产手机| 一级黄色在线播放| 亚洲精品影片| 亚洲精品一区二区三区四区高清 | 国产精品探花在线| 午夜精品久久久久久久久久久 | 色三级在线观看| 国产精品乱人伦| 国产成人亚洲综合无码| 在线看三级电影| 亚洲免费观看高清完整版在线观看 | 久久青草福利网站| 国产一级片免费视频| 日韩av不卡在线观看| 国产精品久久久久一区二区 | 91黄色在线| 亚洲成人av福利| 色欲av无码一区二区人妻| 久久久久黄色片| 日本成人一区二区三区| 成人午夜精品一区二区三区| 久久综合九九| 成全电影播放在线观看国语| 亚洲欧洲性图库| 自拍亚洲欧美老师丝袜| 久久大胆人体| 一本久久综合亚洲鲁鲁五月天| 在线免费视频a| 99久久人爽人人添人人澡| 亚洲精品久久久久中文字幕欢迎你| 国产熟妇搡bbbb搡bbbb| 97偷自拍亚洲综合二区| 久久精品青青大伊人av| 亚洲国产综合久久| 日本网站在线观看一区二区三区| 超碰国产精品久久国产精品99| 亚洲av片在线观看| 国产精品美日韩| 日本人体一区二区| 亚洲男男av| 亚洲黄一区二区| 国产亚洲视频在线观看| 日韩aaaaa| 精品一区二区三区在线| 欧美精品精品精品精品免费| 日韩中文字幕高清| 国产精品一区二区免费不卡| 日本高清一区| caoporn-草棚在线视频最| 在线看不卡av| 欧美xxxxx精品| 欧美韩日高清| 992tv在线成人免费观看| 一级日韩一级欧美| 国产亚洲欧美在线| 久久成人福利视频| 视频欧美精品| 亚洲欧美中文字幕| 久久中文字幕免费| 国产精选一区二区三区| 日韩精品久久久| 中文字幕在线三区| 日韩欧美精品免费在线| 人妻精油按摩bd高清中文字幕| 国产成人高清| 欧美一区二区三区免费视| 国产xxxxxx| 亚洲欧洲国产专区| 国产精品天天av精麻传媒| 性欧美xxxx免费岛国不卡电影| 久久国产精品视频| 真实新婚偷拍xxxxx| 久久嫩草精品久久久久| 成人免费观看cn| 91成人精品在线| 久久久久99精品久久久久| 中文字幕在线观看高清| 国产麻豆久久| 欧美日韩国产首页在线观看| 精品无码在线视频| av激情在线观看| 99久久精品网站| 国产999精品| 三级在线观看| 欧美日韩激情视频| 嫩草影院国产精品| 韩日一区二区三区| 日本成人免费在线| 日韩毛片在线一区二区毛片| 欧美日韩精品二区| 中文成人无字幕乱码精品区| 狠狠色狠狠色综合日日tαg| 99久久久久国产精品免费| 里番在线播放| 精品国产免费久久| 免看一级a毛片一片成人不卡| 欧美aaaaaa午夜精品| 亚洲欧洲免费无码| 日日夜夜精品| 久久偷看各类女兵18女厕嘘嘘| 国产天堂第一区| 中文字幕综合网| 韩国三级丰满少妇高潮| 欧美另类女人| 蜜桃av噜噜一区二区三| 欧美精品日日操| 丝袜亚洲欧美日韩综合| 国产内射老熟女aaaa∵| 亚洲一区二区三区四区中文字幕| 亚洲色偷偷色噜噜狠狠99网| 亚洲欧洲另类| 欧美影视一区二区| 国产精品视频首页| 久久久亚洲国产| 清纯唯美亚洲色图| 欧美网站一区二区| 久久这里只有精品国产| 91在线国产福利| 成年人网站大全| 婷婷综合久久| 免费亚洲精品视频| 久久久免费人体| 欧美肥臀大乳一区二区免费视频| 精品亚洲综合| 欧美一区二区成人6969| 国产无套内射又大又猛又粗又爽 | 尤物网站在线观看| 午夜在线视频一区二区区别| 色噜噜一区二区| 午夜久久av| 国产不卡av在线免费观看| 蜜桃视频网站在线| 精品视频在线播放免| 国产精品女人久久久| 亚洲二区视频在线| 国产激情av在线| 91在线精品一区二区三区| 亚洲最大天堂网| 亚洲麻豆视频| 中文字幕一区二区三区四区五区六区 | 亚洲综合色自拍一区| 丰满岳乱妇一区二区 | 亚洲欧美自拍偷拍色图| 中文字幕一区二区三区乱码不卡| 日本aⅴ免费视频一区二区三区| 毛片在线视频观看| 日韩电影二区| 精品午夜一区二区三区| 成人精品视频在线观看| 欧美一级片免费在线| 超碰在线97国产| 播播国产欧美激情| 五月天丁香视频| 在线成人免费视频| 亚洲天堂中文字幕在线| 精品久久久久久中文字幕一区奶水| 国产精品夜夜夜爽阿娇| 97se亚洲国产综合自在线| 国产av一区二区三区传媒| 美女网站视频久久| 亚洲国产精品久久久久爰色欲| 亚洲视频福利| 91精品国产毛片武则天| 欧美3p视频| 日日夜夜精品网站| 国产一区国产二区国产三区| 精品毛片久久久久久| 视频一区视频二区欧美| 国产精品美女免费看| 欧美影视资讯| 日本一区二区三区在线播放| 欧美1234区| 日韩中文第一页| www.黄在线观看| 亚洲午夜女主播在线直播| 午夜视频1000| 日韩久久精品成人| 99热精品在线播放| 欧美二区在线观看| 国产三级理论片| 欧美中文一区二区三区| 波多野结衣日韩| 欧美视频一区二区三区在线观看| 久久久久久不卡| 青青青伊人色综合久久| 欧美成aaa人片免费看| av在线中文| 最近2019中文字幕一页二页| 国产黄在线观看| 色先锋资源久久综合5566| 免费在线观看av| 久热在线中文字幕色999舞| 久久五月精品| 欧美精品在线免费观看| av人人综合网| 午夜免费在线观看精品视频| av岛国在线| 日本精品一区二区三区在线播放视频 | 91丨porny丨中文| 少妇大叫太粗太大爽一区二区| 91亚洲精品一区二区乱码| 中文字幕乱妇无码av在线| 成人免费高清视频| v天堂中文在线| 久久综合色之久久综合| 右手影院亚洲欧美| 国产精品第四页| 久久机热这里只有精品| 亚洲电影一区二区| 国产农村妇女aaaaa视频| 欧洲日韩一区二区三区| 国产精品久久久久毛片| 欧美大片顶级少妇| 美女做暖暖视频免费在线观看全部网址91| 亚洲区在线播放| 午夜激情视频在线观看| 欧美成人午夜激情在线| 成人性生活视频| 成人国产精品免费视频| 永久免费精品视频| 国产亚洲精品自在久久| 日韩中文在线电影| 大陆av在线播放| 久久亚洲一区| 日韩高清在线一区二区| 99久久免费视频.com| 人妻一区二区视频| 亚洲另类在线一区| 日韩黄色片网站| 91精品国产乱码| 台湾av在线二三区观看| 中文字幕日韩欧美精品在线观看| 日韩影视在线| 国产精品精品国产| 在线视频亚洲欧美中文| 日韩精品一区二区三区四区五区| 伊人精品视频| 午夜精品中文字幕| 97久久超碰精品国产| 一级黄色录像毛片| 亚洲成av人片在线观看无码| 中文字幕 国产精品| 欧美精品一区二区三区很污很色的 | 美美哒免费高清在线观看视频一区二区 | 亚洲影院高清在线| 在线亚洲a色| 91免费网站视频| 久久九九精品| 成人做爰www看视频软件| 国产精品高潮呻吟| 秋霞av一区二区三区| 亚洲风情亚aⅴ在线发布| 国产写真视频在线观看| 亚洲第一男人av| 日本中文字幕在线2020| 国产精品成人一区二区三区吃奶| 美国一区二区| 国产二区视频在线| 国产成人精品1024| 麻豆精品一区二区三区视频| 欧美精品vⅰdeose4hd| 超碰免费97在线观看| 国产精品成人观看视频国产奇米| 亚洲精品无吗| 青青视频在线播放| 久久综合九色综合97_久久久| 亚洲黄色一区二区| 亚洲国产精品热久久| 成人影音在线| 国产精品一区二区三区在线观| 欧美日韩精品一本二本三本 | 久久久一区二区| 日本中文字幕久久| 国产亚洲视频中文字幕视频| 欧美成人h版| 人偷久久久久久久偷女厕| 老妇喷水一区二区三区| 人人人妻人人澡人人爽欧美一区| 色婷婷综合在线| 国产免费永久在线观看| 国产大片精品免费永久看nba| 成人影视亚洲图片在线| 狠狠操狠狠干视频| 亚洲人成网站在线| 亚洲精品喷潮一区二区三区| 久久久久久久久久久久久久久久久久av| www国产精品| 3d动漫一区二区三区| 久久久久久电影| 中文字幕在线视频第一页| 久久久成人精品视频| 51亚洲精品| 国产视频九色蝌蚪| 国产欧美一区二区精品忘忧草| 一区二区小视频| 欧美精品一区在线播放| 豆花视频一区二区| 情侣黄网站免费看| 欧美国产1区2区| 99久久精品免费看国产交换| 欧美精品videofree1080p| 先锋影音国产精品| 一区二区成人网| 亚洲资源中文字幕| 欧美日韩在线中文字幕| 91亚洲精品久久久久久久久久久久| 欧美亚洲不卡| 一区二区精品免费| 日韩一区二区三区免费看| а√天堂8资源中文在线| 日韩成人在线资源| 国产精品自产自拍| 国产污污视频在线观看| 日韩在线欧美在线| 国产伦理久久久久久妇女| 午夜dv内射一区二区| 一区二区三区中文在线观看| 国产黄在线观看免费观看不卡| 91麻豆国产精品| 久久国产高清| 欧美日韩在线国产| 亚洲小视频在线| 哺乳挤奶一区二区三区免费看 | 91美女免费看| 蜜月aⅴ免费一区二区三区| 亚州国产精品| 免费在线观看日韩av| 欧美日韩一级大片网址|