精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 原創(chuàng)

發(fā)布于 2024-6-12 11:30
瀏覽
0收藏

盡管近年來大型語言模型(LLM)在代碼生成方面取得了驚人的成功,但這種由人工智能生成的代碼的可信性仍然是一個問題。為了解決這個問題,研究人員提出了Clover模式,即閉環(huán)可驗證代碼生成,通過檢查代碼、文檔字符串和注釋之間的一致性,強制執(zhí)行AI生成的代碼的正確性。

在軟件開發(fā)中,利用大型語言模型(LLM)進行代碼生成是一個快速發(fā)展的趨勢。然而,如果沒有有效的方法來確保AI生成的代碼的正確性,這一趨勢可能導致不可取的結果。在這項工作中,研究人員引入了一種名為Clover的模式,即閉環(huán)可驗證代碼生成,以解決這一挑戰(zhàn)。Clover將正確性檢查降低到更容易解決的一致性檢查問題,并保護LLM驅(qū)動的代碼生成免受可能造成昂貴錯誤的影響。

Clover的核心是一個檢查器,它在代碼、文檔字符串和形式注釋之間執(zhí)行一致性檢查。該檢查器使用形式驗證工具和大型語言模型的新穎集成實現(xiàn)。研究人員通過實證研究在一個手工設計的數(shù)據(jù)集(CloverBench)上驗證了其可行性,該數(shù)據(jù)集包含在教科書水平的帶注釋語言中的注釋程序。實驗結果表明,對于該數(shù)據(jù)集,(i)LLM在自動生成形式規(guī)范方面取得了合理的成功;(ii)一致性檢查器在正確實例上實現(xiàn)了一個有希望的接受率(高達87%),同時對于錯誤實例保持零容忍(沒有誤報)。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

正式驗證和人工智能是一對良好的搭檔

大語言模型(LLM)最近展示了令人矚目的能力。它們可以進行對話、檢索和總結大量信息、生成和解釋文本和代碼等等。在眾多可能的應用中,它們基于自然語言描述合成代碼的能力令人驚嘆,有可能極大地提高程序員的生產(chǎn)效率。

然而,在實現(xiàn)這一未來之前,必須克服一個根本性的挑戰(zhàn)。目前還沒有一種可靠的方法來確保AI生成的代碼的正確性。目前對于AI生成的產(chǎn)物的最佳實踐是讓人參與其中,例如Copilot。雖然這比沒有人工參與要好,但人工監(jiān)督是昂貴且效率低下的,長期來看難以擴展。

可以預見,在未來幾年中,策劃AI生成內(nèi)容的質(zhì)量將成為最關鍵的研究問題之一。首先,生成的代碼必須在功能上是正確和可靠的。代碼中的錯誤或漏洞可能導致軟件故障,尤其是在醫(yī)療軟件、金融系統(tǒng)或自動駕駛車輛等關鍵系統(tǒng)中,這可能具有成本高昂、危險或兩者兼而有之的后果。此外,如果生成的代碼不可信,可能會在軟件中無意中引入安全漏洞。這可能被惡意實體利用,導致數(shù)據(jù)泄露、侵犯隱私和其他安全事件。幸運的是,在代碼生成的特定情況下,正式驗證可以對任意代碼的質(zhì)量和正確性提供數(shù)學上嚴格的保證。如果有一種方法可以自動將正式驗證應用于生成的代碼,這不僅提供了可擴展的解決方案,還有可能為AI生成的代碼比人工編寫的代碼更可靠的未來鋪平道路。

目前,正式驗證只能依靠人類專業(yè)知識實現(xiàn)。本研究的主要假設是,LLM能夠生成所需的附屬信息,以幫助正式驗證成功,同時不損害正式方法提供的形式保證。

目前,正式驗證只能在耗時的人類專業(yè)知識的幫助下實現(xiàn)。在典型的正式驗證過程中,構建系統(tǒng)的數(shù)學模型后,人類專家提供了系統(tǒng)的正式規(guī)范(見清單1),該模型滿足規(guī)范。對于代碼,已經(jīng)存在一些工具(例如Dafny),可以證明某個輸入規(guī)范滿足某個輸入代碼。傳統(tǒng)上,需要大量的人類專業(yè)知識來創(chuàng)建正式規(guī)范,并確保規(guī)范在內(nèi)部一致且準確捕捉到預期的功能。

基于基于AI的代碼生成技術的輸出應該包括代碼、正式規(guī)范和自然語言文檔字符串。然后,可以使用形式工具與生成的AI技術相結合,確保它們是一致的。這種方法被稱為Clover,即閉環(huán)可驗證代碼生成。

Clover模式包括兩個階段。在第一階段(生成階段),創(chuàng)建帶有正式規(guī)范(注釋)和自然語言文檔字符串(文檔字符串)的代碼。在第二階段(驗證階段),對代碼、注釋和文檔字符串進行了六個一致性檢查。如果一致性檢查通過,則表示(i)代碼在功能上與其注釋一致;(ii)注釋完整地捕捉了代碼的功能;(iii)文檔字符串也準確地反映了代碼的功能(見圖1)。

這個想法是可以利用越來越強大的生成式AI技術在生成階段,然后使用驗證階段作為一個強大的過濾器,只批準經(jīng)過形式驗證、文檔準確、內(nèi)部一致的代碼。

Dafny

Dafny是評估中使用的編程語言。Dafny的后端包括一個編譯器,能夠生成可運行的二進制文件,以及一個驗證器,可以形式化地檢查代碼是否符合其規(guī)范。清單1列出了一個用于找到自然數(shù)平方根的Dafny函數(shù),包括三個組成部分(文檔字符串、注釋和代碼)。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover 第一階段:生成

研究人員首先展示了 Clover 中生成階段可以生成帶有注釋和文檔字符串的代碼。具體而言,研究人員使用 OpenAI 的 GPT-4 進行實驗。圖2a展示了在不同條件下,當 GPT-4 被要求為 CloverBench 中的每個例子生成代碼時的結果。第一個柱狀圖("one try")顯示了單次嘗試的結果。下一個柱狀圖允許 GPT-4 嘗試三次,每次提供 Dafny 編譯器和驗證器的輸出作為反饋。第三個柱狀圖類似,但只使用了 Dafny 編譯器的輸出。在最后一個柱狀圖中,允許三次嘗試,并且還提供了文檔字符串。圖2b展示了當提供代碼時,要求 GPT-4 生成注釋的結果。雖然不是完美的,但 GPT-4 在大多數(shù)程序中可以生成正確的注釋。這表明使用 LLM 進行規(guī)范生成是可行的。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover 第二階段:驗證

Clover 期望生成階段的輸出包含三個組成部分:代碼、注釋和文檔字符串。它還期望每個組成部分提供足夠的細節(jié),以明確確定在任何給定輸入上運行代碼的唯一結果。驗證階段檢查每對組成部分的一致性,如圖1所示,只有當所有檢查都通過時才會成功。

具體而言,總共有六個檢查:

  • (1)anno-sound:一種演繹驗證工具(評估使用 Dafny)檢查代碼是否滿足注釋。
  • (2)anno-complete:根據(jù)注釋,使用 LLM 生成新的代碼,然后檢查生成的代碼與原始代碼的等價性。
  • (3)anno2doc:要求 LLM 根據(jù)注釋生成新的文檔字符串,然后使用 LLM 檢查新的文檔字符串與原始文檔字符串的語義等價性。
  • (4)doc2anno:要求 LLM 根據(jù)文檔字符串生成新的注釋,然后使用形式工具檢查新的注釋與原始注釋的邏輯等價性。
  • (5)code2doc:要求 LLM 根據(jù)代碼生成新的文檔字符串,然后檢查新的文檔字符串與原始文檔字符串的語義等價性。
  • (6)doc2code:要求 LLM 根據(jù)文檔字符串生成代碼,然后檢查新的代碼與原始代碼的功能等價性。

重構測試

在每個檢查中,重構原始構件是關鍵。給定三個組成部分(代碼、文檔字符串、注釋)作為輸入,研究人員嘗試從一個構件中重構出另一個構件,然后檢查重構結果是否等價于原始構件。

在下圖中,將屏蔽的函數(shù)簽名和注釋提供給 GPT4,并解析生成的代碼。

等價性檢查

用于代碼的標準等價性檢查包括輸入輸出比較、符號執(zhí)行測試,甚至是完整的形式等價性檢查。評估使用作為 CloverBench 數(shù)據(jù)集的一部分包含的單元測試。檢查文檔字符串的等價性是具有挑戰(zhàn)性的,因為自然語言不是數(shù)學上精確的。在評估中,要求 GPT-4 檢查兩個文檔字符串是否語義上等價。為了檢查兩個注釋的等價性,將兩個注釋的等價性寫成一個形式引理,并要求 Dafny 證明該引理。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

在下圖中,測試文檔字符串的等價性。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

在不同領域中有幾個受歡迎的代碼生成數(shù)據(jù)集,但沒有一個包含注釋或使用 Dafny 語言。研究人員引入了一個新的手工制作的數(shù)據(jù)集,稱為 CloverBench。在撰寫本文時,它基于60個小型手寫示例程序,類似于標準計算機科學教科書中的示例,例如選擇排序。對于每個程序,有四個變體:一個地面真實的變體,其代碼、注釋和文檔字符串都是正確和一致的(經(jīng)手工驗證);以及三個不正確的變體。

評估一致性檢查算法

主要實驗評估了 Clover 一致性檢查算法的能力。對于 CloverBench 中的每個示例,研究人員運行上述描述的所有6個檢查。評估多次獨立運行的效果,這意味著將每個6個檢查重復 k 次。端到端的結果總結在表1中。當 k=1 時, Clover 實現(xiàn)接受了60個正確(地面真實)示例中的45個,并拒絕了所有不正確的示例。當 k=10 時,Clover 接受了60個正確示例中的52個,并拒絕了所有不正確的示例。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

結論

本文介紹了 Clover,一個用于閉環(huán)可驗證代碼生成的框架。研究人員將檢查正確性的問題簡化為檢查一致性的更容易解決的問題。

使用 GPT-4、Dafny 和一組簡單的教科書示例的初步實驗結果是令人鼓舞的。本文展示了87%的地面真實示例接受率和100%的不正確示例拒絕率。未來的工作可能集中在設計更好的驗證工具、改進代碼/注釋/文檔字符串生成質(zhì)量、改進 LLM 對 Dafny 語法的理解,或者擴展到更具挑戰(zhàn)性的示例上。

?譯自(有刪改):????https://ai.stanford.edu/blog/clover???


本文轉載自公眾號AIGC最前線   

原文鏈接:?https://mp.weixin.qq.com/s/FnBCCe-7tpkKAFtcmWLzqw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-6-12 11:35:39修改
收藏
回復
舉報
回復
相關推薦
欧美第一区第二区| 成人资源www网在线最新版| 国产调教在线| 美女www一区二区| 欧美日韩日本国产| 91免费精品视频| 30一40一50老女人毛片| 亚洲免费成人在线| 99精品电影| 欧美性色视频在线| 翡翠波斯猫1977年美国| 天天色影综合网| 成人在线免费av| 国产亚洲一区字幕| 欧美性一区二区三区| 91精品又粗又猛又爽| 超碰在线caoporn| 蜜桃视频在线一区| 国产一区二区三区直播精品电影| 日韩欧美视频网站| 黄色av免费观看| 可以看av的网站久久看| 亚洲精品一区中文| av动漫在线观看| 青青草观看免费视频在线 | 国产一区一区三区| 一区二区久久精品66国产精品| 日本不卡免费一区| 欧美日韩在线亚洲一区蜜芽| 亚洲成人蜜桃| 国产精品国产三级国产普通话对白| 久久国产成人精品| 欧美久久久一区| 国产一区一区三区| 福利视频在线看| 蜜桃久久av一区| 91精品国产91久久久久久| 香港三级日本三级| 桃花岛成人影院| 亚洲国产高清在线| 成人做爽爽免费视频| 久久久黄色大片| 亚洲精品黑牛一区二区三区| 亚洲成国产人片在线观看| 国产视频一区二区三区四区| 国产又大又黄又粗| 欧美肉体xxxx裸体137大胆| 欧美视频在线不卡| 亚洲综合激情五月| 成年人在线视频免费观看| 91麻豆国产精品久久| 国产精品白嫩初高中害羞小美女 | 国产精品欧美久久久久无广告| 国产精品旅馆在线| 欧美成人777| 成人在线超碰| 精品久久香蕉国产线看观看亚洲| 欧美三日本三级少妇三99| 国产精品国产精品国产| 亚州av乱码久久精品蜜桃| 亚洲成人av中文字幕| 可以免费观看av毛片| 一级日本在线| 成人午夜私人影院| 国产精品久久久久久五月尺 | 欧美影视一区二区三区| 欧美日韩在线成人| 日本动漫同人动漫在线观看| 久久精品人人做人人爽97| 农村寡妇一区二区三区| 国产女人18毛片18精品| 亚洲欧洲一级| 久久精品一本久久99精品| 久久久久久久无码| 欧美久久香蕉| 日韩一区二区免费高清| 免费观看成人在线视频| www.国产精品| 91精品国产综合久久小美女| 国产成人无码一二三区视频| 男人皇宫亚洲男人2020| 在线观看三级视频欧美| 男人用嘴添女人下身免费视频| 日本最黄一级片免费在线| 亚洲欧洲成人av每日更新| 精品一卡二卡三卡四卡日本乱码| 一本一道精品欧美中文字幕| 久久精品亚洲一区二区| 久久久久成人精品| 欧美一级片在线视频| 综合国产在线| 久久精品99无色码中文字幕| 免费人成年激情视频在线观看| 日韩免费特黄一二三区| 欧美成年人网站| 1024手机在线观看你懂的| 久久狠狠久久| 精品毛片乱码1区2区3区| 在线观看av免费观看| 成人涩涩视频| 欧洲一区二区三区在线| 精品国产鲁一鲁一区二区三区| 久久久免费毛片| 日韩中文字幕网站| 亚洲一级片在线播放| 欧美影视一区| 欧美男插女视频| 黄色片在线观看网站| 天天超碰亚洲| 欧美在线国产精品| 国产精品成人久久| 亚洲精品国产偷自在线观看| 91高清免费在线观看| 国产免费黄色录像| 91亚洲永久精品| 久久精品人成| 撸视在线观看免费视频| 久久―日本道色综合久久| 久久久精品国产一区二区三区| 在线国产情侣| 亚洲男人天堂av| 久久天天东北熟女毛茸茸| av在线app| 欧美色大人视频| 久久人人爽人人人人片| 欧美fxxxxxx另类| 国产精品免费在线免费 | 成人中文字幕合集| av动漫免费观看| 国产成人a视频高清在线观看| 亚洲精品国产精品国自产在线| 国产又粗又猛又色| 亚洲人成免费网站| 国产精品一区久久久| 一级全黄裸体免费视频| 久久日一线二线三线suv| av免费观看国产| 欧美xoxoxo| 日韩av在线免费观看一区| 蜜桃精品一区二区| 影音先锋中文字幕一区二区| 欧美在线欧美在线| 日批视频免费播放| 久久综合色之久久综合| aa视频在线播放| 北条麻妃一区二区三区在线观看| 久久国产精品亚洲| 超碰在线观看av| 久久一留热品黄| 女人天堂av手机在线| 精品三级在线观看视频| 97在线视频免费| 在线不卡免费视频| 亚洲国产激情av| 五月婷婷丁香综合网| 日本一区精品视频| 亚洲精品资源在线| √资源天堂中文在线| 2021国产精品久久精品| 国产精品免费成人| 青青草综合网| 成人乱人伦精品视频在线观看| 蜜桃视频在线观看www| 国产欧美日韩综合| 久久av综合网| 欧美91在线|欧美| 亚洲国产第一页| 日韩欧美一级视频| 国产一区二区三区免费在线观看 | 91黄色在线视频| 亚洲欧美欧美一区二区三区| 中国男女全黄大片| 久久社区一区| 欧美在线激情网| 都市激情在线视频| 日韩一区二区三区视频在线 | 国模一区二区三区| 国产精品亚洲激情| 久久久久久国产精品免费无遮挡| 狠狠躁夜夜躁人人爽天天天天97| 色欲av无码一区二区三区| 欧美a级在线| 久久福利电影| 国产原创一区| 欧美精品videossex88| 久久久久久久影视| 欧美一区二区成人| 国产在线免费av| 噜噜噜久久亚洲精品国产品小说| 日韩欧美精品在线不卡| 国产在线天堂www网在线观看| 日韩电影中文字幕在线| 97精品人妻一区二区三区在线| 亚洲一区二区三区自拍| 老女人性生活视频| 99九九热只有国产精品| 国产精品.com| 岛国精品在线| 久久免费国产视频| 亚洲女人18毛片水真多| 色噜噜狠狠成人网p站| 亚洲第一页av| 国模一区二区三区白浆| 超碰免费在线公开| 久久综合另类图片小说| 国产欧美日韩丝袜精品一区| www黄在线观看| 亚洲电影天堂av| 国产精品一区二区黑人巨大| 欧美性猛交xxxx| 校园春色 亚洲| 国产成人精品1024| 成人午夜免费在线视频| 国内不卡的一区二区三区中文字幕 | 在线免费看av的网站| 性感美女极品91精品| 美女网站视频在线观看| 午夜日韩视频| 亚洲巨乳在线观看| 亚洲区小说区| 国产精品嫩草影院一区二区 | 日本久久久久久| 蜜桃视频在线观看视频| 精品三级在线观看| 国产又粗又猛又黄又爽| 欧洲亚洲精品在线| 黄色片免费观看视频| 亚洲一二三区不卡| www日韩在线| 国产精品视频观看| 最近中文字幕在线mv视频在线| 奇米色一区二区| 福利网在线观看| 日韩在线综合| 日韩精品国内| 国产成人短视频在线观看| 国产精品嫩草影院一区二区| av色在线观看| 亚洲天堂网在线观看| 一级黄色小视频| 欧洲av一区二区嗯嗯嗯啊| aaaaaa毛片| 色999日韩国产欧美一区二区| 久久青青草视频| 黑人巨大精品欧美一区免费视频 | 视频一区二区不卡| 欧美亚洲日本在线观看| 日精品一区二区| 天堂av在线中文| 亚洲经典一区| 300部国产真实乱| 欧美日韩国产在线一区| 久久99欧美| 蜜桃tv一区二区三区| 91色琪琪电影亚洲精品久久| 亚洲精品伦理| 欧美大胆a视频| av网站网址在线观看| 日韩精品亚洲精品| 日本韩国精品一区二区| 亚洲乱码国产乱码精品精天堂| 国产精品丝袜黑色高跟鞋| 欧美日韩电影在线| 日本韩国欧美中文字幕| 日韩欧美高清视频| 精品一区二区无码| 亚洲美女视频一区| 成人自拍小视频| 亚洲高清视频中文字幕| 9i看片成人免费看片| 欧美三级资源在线| 国产女人18毛片水真多| 精品免费国产二区三区| 午夜在线观看视频18| 日韩一区二区在线观看| 国产成人毛毛毛片| 欧美日韩视频在线观看一区二区三区| 亚洲无码久久久久| 欧美成人三级电影在线| 亚洲 欧美 激情 小说 另类| 国产一区二区三区视频 | 一本色道久久综合亚洲精品酒店| 欧美久久久久久久| 国产精品99视频| 加勒比成人在线| 蜜桃视频免费观看一区| 国产精品19p| 91老师国产黑色丝袜在线| 欧美色图17p| 午夜激情一区二区三区| 亚洲天堂国产精品| 亚洲国产日韩精品在线| 91网在线播放| 午夜精品一区二区三区在线视频| 亚洲精品.com| 奇米四色中文综合久久| 欧美大片网站| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 欧美在线视频a| 91精品一区| 免费成人看片网址| 一精品久久久| 日韩在线第三页| 成人午夜免费视频| 后入内射无码人妻一区| 久久久久久久久一| 国产精品无码永久免费不卡| 成人一区二区视频| www亚洲色图| 欧美国产欧美亚州国产日韩mv天天看完整 | 国产精品国产三级国产| 性欧美精品男男| 亚洲国产精品视频| 91在线视频国产| 亚洲日韩欧美视频一区| 国产在线免费观看| 国产一区二区三区欧美| av福利导福航大全在线| 成人黄色av网站| 欧美精选一区二区三区| 午夜精品久久久久久久无码| 国产激情视频一区二区在线观看| 亚洲精品成人无码毛片| 国产精品福利电影一区二区三区四区 | 欧美性猛交xx| 国产精品美女一区二区三区 | 精品一区二区日韩| 天堂在线一区二区三区| 国产精品资源网站| 一区二区三区四区影院| 国产精品久久久久影院| 国产性生活视频| 日韩精品中文字幕有码专区| 波多一区二区| 国产福利精品在线| 国产亚洲亚洲国产一二区| 亚洲一区二区三区色| 欧美日韩福利| 欧美一级特黄aaa| 国产69精品久久久久按摩| 国产精品女人网站| 精品精品99| 欧美精品无码一区二区三区| 2021中文字幕一区亚洲| 中文字字幕在线中文| 亚洲精品av在线播放| 麻豆mv在线看| 国产欧美一区二区三区久久人妖 | 国产精品一区免费视频| 91视频综合网| 日韩视频一区二区在线观看| 手机av在线播放| 国产va免费精品高清在线| 亚洲人成精品久久久| 久久久久久香蕉| 国产欧美精品一区aⅴ影院| 中文资源在线播放| 精品国产免费久久| 黄上黄在线观看| 国产精品高潮呻吟视频| 日产午夜精品一线二线三线| 亚洲欧美日韩一级| 国产精品国产三级国产普通话三级 | 亚洲xxxx做受欧美| 国产欧美日韩视频在线| 50路60路老熟妇啪啪| 国产精品网站在线| 99久久精品日本一区二区免费| 欧美国产乱视频| 日韩美女在线| 可以在线看黄的网站| 不卡av电影在线播放| 黄色录像一级片| 日韩一区二区三区av| 91资源在线观看| 欧洲精品在线一区| 亚洲美女色禁图| 免费不卡av网站| 中文字幕不卡在线播放| 91精品国产乱码久久| 九九精品视频在线| 日韩激情啪啪| a级黄色片免费| 久久超碰97中文字幕| 欧美激情精品久久| 亚洲欧美日本精品| 国产一区二区三区四区五区3d| 特级西西人体www高清大胆| 91在线观看下载| 亚洲怡红院av| 777午夜精品福利在线观看| 波多野结衣的一区二区三区| 波多野结衣中文字幕在线播放| 精品久久久视频| 日本不卡三区| 国产色婷婷国产综合在线理论片a| 欧美日韩免费| 中文字幕伦理片| 亚洲第一免费网站| 日日夜夜一区|