精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66% 精華

發布于 2024-7-8 13:23
瀏覽
0收藏

有了ChatGPT,還需要人類程序猿編碼嗎?


上個月,一項發表在IEEE TSE期刊(Transactions on Software Engineering)上的研究評估了ChatGPT所生成的代碼在功能性、復雜性和安全性方面的表現。


結果顯示,ChatGPT生成可用代碼的能力差異很大。


其成功率從0.66%到89%不等,這主要取決于任務的難度、編程語言等多種因素。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

論文地址:https://ieeexplore.ieee.org/document/10507163


具體來說,研究人員測試了GPT-3.5在5種編程語言(C、C++、Java、JavaScript和Python)中,解決LeetCode測試平臺上的728個編碼問題,以及應對18個CWE(常見缺陷枚舉)場景的能力。


雖然在某些情況下,AI能夠生成比人類更優質的代碼,但分析也揭示了,一些AI生成代碼的安全性問題。


論文作者、格拉斯哥大學助理教授Yutian Tang指出,「AI代碼生成一定程度上,可以提升開發效率,自動化軟件工程。然而,我們必須認識這類模型優勢和不足,以便合理應用」。


「通過全面的分析,可以發現ChatGPT生成代碼過程中,出現的潛在問題和局限性,進而改進生成技術」。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

有網友慶幸地發出疑問,所以我還沒有被解雇?另一人對此表示,至少不是今天。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

還有人指出,這項研究是關于GPT-3.5的評估。要是GPT-4早就在編碼能力上大幅提升,Claude 3.5更是如此。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

確實,現在我們有了更好的模型,對于GPT-3.5模型的評估,并沒有太大的意義。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

0.66%-89%,驚人反差率

總體而言,ChatGPT在不同編程語言的問題上表現相當不錯——特別是在嘗試解決2021年之前LeetCode上的編碼問題時。


例如,它能夠為簡單、中等和困難的問題生成可運行代碼,成功率分別約為89%、71%和40%。


然而,當涉及到2021年之后的算法問題時,ChatGPT生成正確運行代碼的能力受到影響。即使是簡單級別的問題,它有時也無法理解問題的含義。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

比如,ChatGPT在生成「簡單」編碼問題的可運行代碼方面的能力,在2021年后從89%下降到52%。


而它在生成「困難」問題的可運行代碼方面的能力也在此時間后從40%下降到0.66%。


Tang對比表示,「一個合理的假設是,ChatGPT在2021年之前的算法問題上表現更好的原因是這些問題在訓練數據集中經常出現」。


接下里,具體看看研究者們對ChatGPT進行了哪些方面的評估。

實驗評估

評估的整體流程如圖2所示。


首先為給定的LeetCode問題或CWE場景構造合適的提示并發送給ChatGPT,讓它根據提示和上一輪對話的上下文信息給出響應。


之后,研究人員將模型響應中的代碼片段提交給LeetCode平臺,利用其在線判斷功能來檢驗代碼的正確性,CWE漏洞則使用CodeQL進行手動分析。


如果測試結果通過,則生成結束,否則就需要利用LeetCode和CodeQL的反饋繼續建立新的提示、輸入給ChatGPT,再次進行代碼生成。


如果ChatGPT在對話輪數限制(5輪)之內始終沒有生成出通過測試的代碼,則認為生成任務失敗。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

功能性正確代碼生成

ChatGPT生成的代碼在功能上是否正確?


研究動機:

給定提示,ChatGPT生成相應的文本,這種能力可能會提高開發者的生產力。首先去評估ChatGPT在單輪對話中,自動生成功能正確代碼的能力。


研究方法:

- 讓ChatGPT閱讀問題描述,在單輪對話中生成相應代碼。(最大對話輪數設為1)

- 使用LeetCode平臺上的編程問題作為數據集,截止研究時,有2500個難度不等的問題。

- 將LeetCode所有問題分為2021年之前(Bef.problems)和2021年之后(Aft.problems)兩類,因為ChatGPT的訓練數據截止于2021年。

考慮到2021年之前的問題可能已存在于ChatGPT的訓練集中,這可能使代碼生成任務退化為簡單的數據庫查詢(即代碼復用)。為了進行全面評估,研究中同時考慮了這兩類問題。


具體而言,研究人員重點關注LeetCode上的算法問題,因為算法問題是該平臺上最重要、最多和最多樣化的問題。


Bef.problems和Aft.problems的總數分別為1624個和354個。此外,兩者的難度分布為難、中、易,比例為1:2:1。


在所有Bef.problems中,作者隨機抽取了374個問題,其數量與Aft.problems相似,難度分布也與Aft.problems相同。


同樣,在354個Aft.problems和Bef.problems中,難、中、易問題的數量比例也是1:2:1,與LeetCode平臺上所有問題的難度分布一致。


此外,研究人員還檢查了Bef.problems和Aft.problems之間是否存在顯著差異。


如果Aft.problems只是Bef.problems的重構,那么ChatGPT很可能可以輕松解決這些問題,這可能會影響實驗結果在區分時間段方面的可靠性。


論文中,作者總共找到了142對問題。然后,再讓2名研究生獨立檢查這些問題對。


通過仔細核對和討論,結果發現這些相似的問題要么情景相似,但求解目標完全不同;要么情景和條件不同,但可以使用類似的算法(如動態編程)求解。


經過仔細的人工分析,作者沒有發現在任何情況下,Bef.problems可以很容易地重新表述為Aft.problems。


因此,作者認為Aft.problems和Bef.problems之外,對于每個問題,都要求ChatGPT用5種不同的語言生成代碼:C、C++、Java、Python3和JavaScript。


此外,他們還使用相同的提示模板為每個 < 問題、語言> 對創建了相應的提示。


Bef.problems和Aft.problems分別共有1,870和1,770個提示。由于ChatGPT的查詢速度有限,研究者將每條提示輸入一次,要求生成代碼。


然后,研究者將解析后的解決方案,提交給LeetCode進行功能正確性判斷,并得到提交狀態,包括接受、回答錯誤、編譯錯誤、超過時間限制和運行錯誤。


它們分別對應于A.、W.A.、C.E.、T.L.E.和R.E.。一個問題對應一個唯一的對話,以避免從其他問題觸發ChatGPT的推理。


實驗中,作者以狀態率(SR)來評估 ChatGPT 的代碼生成能力。其中

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

分別是根據狀態生成的代碼片段數和輸入的提示數。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

提示:


所設計的提示模板由4個部分組成:它們分別是<Content>、<Examples>、<Template>和<Command>。


<Content> 用自然語言描述問題,<Examples> 顯示功能正確的代碼 <input, output> 對,<Template> 指定生成代碼的方法簽名(method signature),<Command> 要求用特定語言生成代碼。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

結果:


表1和表2顯示,LeetCode對五種編程語言在兩個時間段、兩種形式下的代碼生成結果、SR以及相應的相對頻率柱形圖。


由于Python3和JavaScript都是動態編程語言,因此這兩列不包含C.E.。


從總體結果來看,ChatGPT為Bef.problems生成的功能正確代碼的A.率明顯高于Aft.problems。


具體來說,Bef.problems的五種語言平均正確率(68.41%)比Aft.problems的(20.27%)高出 48.14%。


五種語言在不同階段的代碼生成性能差異顯著,P值為0.008,效應大小值為1。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

對于Aft.problems,總體正確率低于25%,其中難、中、易問題的正確率分別為0.66%、13.90%和52.47%。


用Holm-Bonferroni校正程序調整的P值和五種語言不同難度之間的效應大小值分別小于0.05和等于1。


結果表明,面對Aft.problems,隨著問題難度的增加,ChatGPT在功能上正確生成代碼的能力明顯下降。


此外,即使是簡單的問題,它也只能正確回答一半。


在這五項/四項指標中,W.A.率是所有語言中最高的一項,達到58%。


此外,每個W.A.代碼片段平均有109個測試用例,而ChatGPT生成的代碼只能通過其中的25%。


難題、中難題和簡單難題的測試用例通過率分別為20.90%、21.03%和38.41%。因此,無論難度如何,生成代碼的語義都與相應問題描述的邏輯有很大差異。


此外,C.E.率和R.E.率也都達到了16%,而且難題和中難題的C.E.率明顯高于簡單難題。

ChatGPT生成的中難題代碼,更容易出現編譯和運行時錯誤。比如,圖4中顯示生成的函數cmpfunc,在調用前沒有聲明。語法錯誤只占這些錯誤的一小部分(3.7%)。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

至于T.L.E.率,雖然數值不高(6%),但測試用例的平均通過率為51%,高于W.A.代碼片段。


T.L.E.問題的難、中、易三個難度級別的測試用例,平均通過率分別為68%、50%和1%(易問題由于其T.L.E.率接近0%,可以忽略不計)。


由于T.L.E.代碼片段的測試用例通過率是部分的,不過生成的代碼中最多還有6%在功能上是正確的,盡管它們的時間復雜度可能并不理想。


細分到每種語言,C、C++、Java、Python3和JavaScript的A.率分別為15.38%、19.37%、20.17%、23.93%和22.51%。


此外,圖5顯示了將五種不同語言與每個問題(僅考慮至少有一個正確解決方案的問題)相結合的A.率分布(接受率分布)。


從圖中可以看出,Medium語言的平均線和中位線都≤0.5,而Easy語言的平均線和中位線都≥0.6。


對于簡單問題ChatGPT更容易將生成的代碼泛化到不同的語言中。簡單問題和中等問題的中位數和均值分別為0.4和0.5。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

對于Bef. Problems問題方面,難、中、易問題的正確率分別為40.13%、70.95%和89.80%,遠高于Aft. problems,但不同難度之間仍存在顯著差異。


用Holm-Bonferroni校正程序調整后的P值和難與中、難與易之間的效應大小值分別小于0.05和大于0.9。


五種語言中,中等難度和簡單難度之間的調整后P值和效應大小值分別為0.056和0.76。

ChatGPT在解決2021年之前訓練集中可能出現的問題時,表現更好,尤其是中等難度和簡單難度的問題。


解決難題的正確率提高了40%,但仍低于50%,這表明ChatGPT生成邏輯復雜問題代碼的能力仍有很大的提升空間。


總體正確率下降到 17.03%,難、中、易問題的正確率分別為32.89%、15.05%和6%。

生成的代碼仍能通過平均112個測試用例中的25%。難、中、易問題的測試用例通過率分別為19.19%、31.12%和47.32%。


后兩者都提高了10%,這表明ChatGPT對Bef. Problems有更好的理解力。


不過,C.E.率和R.E.率仍達到13%,接近Aft. problems的16%,兩個階段之間的P值和效應大小值分別為0.328和0.3125,且困難問題通過率最高,中難度問題通過率次之。


編譯錯誤和運行時錯誤與Aft. problems類似,例如,圖6所示代碼用于重塑給定的二維矩陣,但在第15行引發了運行時錯誤,該行為*returnColumnSizes分配了錯誤大小的內存。

至此,T.L.E.率降至1.87%,測試用例平均通過率為74%。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

接下來,再細分到每種語言,C、C++、Java、Python3和JavaScript的A.率分別為47.24%、68.63%、76.37%、75.35%和74.44%。


后四種語言的A.率值彼此接近,且大大高于C(最低級別語言)的A.率值,至少高出20%。

圖 7 顯示的是與圖 5 相同的Bef. Problems。從圖中可以看出,中等題和簡單題的平均線和中位線都≥0.75,而且它們的中位數和平均值之間的差異比之前的Aft. problems要小一半。


此外,有難度的平均線和中位線都≥ 0.55。對于Bef. Problems,ChatGPT更容易將代碼擴展到不同的語言中。


ChatGPT接受的問題的人類平均接受率為55%,而ChatGPT未接受的問題的人類平均接受率為47%。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

總而言之,通過實驗,ChatGPT在功能性正確代碼生成任務上,比起Aft. problems,更加擅長解決不同編程語言中的Bef. Problems。


尤其是,前者的平均正確率比后者高出48.14%。此外,不同的難度也會影響基于ChatGPT的代碼生成。


對于兩個階段的問題,ChatGPT都能生成運行時間和內存開銷小于至少50%的人類解決方案的代碼。


無論哪個階段的問題,ChatGPT生成的代碼出現編譯或運行時錯誤的概率都差不多,平均為14.23%。


在所有問題中,C++、Java、Python3和JavaScript的A.率值分別為44.75%、48.74%、50.00%和48.80%,彼此接近,且大大超越C的31.28%。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

多輪修復功能管用嗎


在這個方面,作者想探究ChatGPT支持的多輪對話能力在改進代碼正確性上究竟表現如何?人類能夠「知錯就改」,LLM可以嗎?


首先,研究人員對ChatGPT生成的157段代碼的錯誤類型進行了分析,可以大致分為以下幾類:


- 細節錯誤(WD):代碼細節上的錯誤一般源于誤解題意,或者代碼與問題理解不一致,但大體邏輯基本正確,因此這類錯誤很容易被修復。

- 誤解某些內容(MCC):生成代碼沒有滿足給定問題的主要條件,使用的算法合適,但需要修改其核心。

- 誤解問題(MP):指ChatGPT完全錯解了題意,這是最難修復的一種情況,代碼需要完全重寫,


將錯誤信息反饋給ChatGPT的方式依舊延續了圖3所示的格式,包括原始問題、生成代碼片段、LeetCode的報錯信息以及相應指令。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

進行不超過5輪的對話修復后,得到了表5所示的結果。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

可以看到,157個問題中能通過自動化修復的只有25個,其中16個屬于簡單模式,困難問題的錯誤答案幾乎不可能被修復。


如果把對話輪數的上限增加到10輪呢?結果依舊不樂觀。


從157個問題中隨機選出10個,結果只有其中2個能在10輪內成功修復,剩下的8個依舊無法通過。這能讓研究人員進一步分析ChatGPT很難自動修復的原因。


ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

作者認為,一方面,ChatGPT缺乏掌握邏輯細節的能力;另一方面,在需要復雜邏輯推理的問題中,生成代碼往往偏離問題的實際含義,這即使對于人類程序員也很難修復。

代碼復雜度

代碼的復雜性對于可讀性、可維護性以及整體質量來說,都是一個重要的影響因素。想象一下,如果ChatGPT對簡單的排序問題都生成出了你很難看懂的代碼,那會大大拉低使用體驗。


作者利用了SonarQube和cccc兩個指標來評估LeetCode數據集中Bef.問題的復雜程度,并評估響應生成代碼的循環復雜度(cyclomatic complexity)和認知復雜度(cognitive complexity)。


循環復雜度會計算執行時線性獨立路徑的數量,從而體現源代碼的測試難度。認知復雜度則從人類角度衡量理解、推理一段代碼的難度。

由于以上量化標準不夠直觀,研究人員還同時評估了人類編寫的C++和Python3的LeetCode問題解答來與ChatGPT進行比較。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

圖20的對比中可以看出,C代碼的復雜度最高,C++、Java和JavaScript次之并基本處于同一水平,Python3是最不復雜的,這與我們的固有認知基本吻合。


此外,與人類相比,ChatGPT生成的代碼雖然復雜度稍高,但差距并不明顯。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

隨著LeetCode問題難度逐漸升高(表16),無論是人類還是ChatGPT,低復雜度代碼的占比都會逐漸降低,復雜度被分類為「高」和「非常高」的占比也隨之逐漸提高,這種趨勢也是類似的。


然而,不好的消息是,ChatGPT的多輪修復功能似乎沒法讓代碼更簡潔,多數情況下會維持甚至提高代碼的復雜。


性,這或許也是多輪修復功能效果不理想的原因之一。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

代碼安全性

由于ChatGPT訓練時可能學習到了各種各樣的內容,包括質量較低、易受攻擊的代碼,因此評估生成代碼的安全性也非常重要。


由于LeetCode的算法代碼通常專注于解決特定的邏輯或計算問題,并不涉及管理系統資源、網絡通信等通常有敏感安全問題的操作,因此在這部分的評估中,論文同時采取了兩種路徑。


1)利用CodeQL對LeetCode答案的所有C、C++和Java代碼進行漏洞檢測,針對MITRE Top25中的5個CWE問題,包括指針和內存相關的共30個查詢。

2)針對MITRE Top25中的18個CWE問題,每個問題提供3種上下文場景,給ChatGPT「挖坑」,要求它補全代碼,再用CodeQL自動檢測看是否確實出現了相應問題。


在第一個測試中(表18),ChatGPT表現良好,91.8%的錯誤集中在MissingNullTest這一類,其余的漏洞的出現頻次則一般不超過5次。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

但仍要注意的是,ChatGPT在CWE 787,即「越界寫入」問題上表現不佳,這可能會導致潛在的代碼漏洞。


而且,由于這些漏洞的修復比較簡單,因此在給定錯誤信息并要求生成修復代碼后, ChatGPT也能較好完成任務。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

要求ChatGPT修復CWE-787問題的提示模板

在第二個測試——安全代碼生成方面,ChatGPT共生成了2983(99.07%)個有效代碼片段,其中994個存在安全漏洞,占比達到33.32%。


而且,C語言中的易受攻擊片段的百分比(51.64%)遠遠高于Python3(17.08%),這有可能是由于C代碼本身就對程序的內存安全提出了更高的要求,也可能源于訓練數據中C和Python3代碼的質量差距。


多輪修復功能依舊表現出色,89.4%的漏洞都能在給出CWE信息后成功解決,比如溢出、數據泄露、不安全內存操作、未經身份驗證訪問等相關問題。

ChatGPT非確定性

ChatGPT的非確定性輸出如何影響代碼生成?

如下表所示,表22和表23分別列出了所選算法問題和溫度為0.7時的實驗結果。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

在溫度為0的條件下,10次試驗中,算法問題和CWE代碼場景的非確定性代碼生成統計結果如表24、表25和表26所示。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

其中表26列出了所選的20個CWE代碼場景。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

此外,作者還研究了非確定性對多輪修復過程的影響,修復結果如表27-32所示。

溫度設為0.7,5次試驗中算法問題的多輪修復過程。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

溫度設為0,5次試驗中算法問題的多輪修復過程。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

溫度設為0.7,5次試驗中算法問題的CWE多輪修復過程。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

溫度設為0,5次試驗中算法問題的CWE多輪修復過程。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

溫度設為0.7,5次試驗中安全代碼生成的多輪修復過程。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

溫度設為0,5次試驗中安全代碼生成的多輪修復過程。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

總之,實驗中,當溫度設置為0.7時,單輪流程中的代碼生成可能會受到ChatGPT非確定性因子的影響,從而導致代碼片段在功能正確性、復雜性和安全性方面出現差異。


要減輕ChatGPT在單輪過程中的非確定性,一種可能的策略是將溫度設置為0。


然而,在多輪修復過程中,無論溫度設置為0.7還是0,ChatGPT固定的代碼片段在功能正確性、復雜性和安全性方面都可能存在差異。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅為0.66%-AI.x社區

本文轉自 新智元 ,作者:新智元


原文鏈接: ??https://mp.weixin.qq.com/s/WVza402sjxaNqgmgQc-KsQ??

收藏
回復
舉報
回復
相關推薦
亚洲美女精品一区| 国产乱码精品1区2区3区| 亚洲品质视频自拍网| 成年人在线观看视频免费| 素人av在线| 成人免费精品视频| 国产成人精品电影久久久| 青青青视频在线免费观看| 日本午夜精品久久久久| 亚洲品质自拍视频网站| 久久成人资源| 国产av无码专区亚洲a∨毛片| 亚洲激情专区| 日韩视频免费看| 天堂久久久久久| 99视频这里有精品| 精品久久久免费| 中国人体摄影一区二区三区| 人妻丰满熟妇av无码区hd| 免费观看日韩电影| 性欧美长视频免费观看不卡| 国产亚洲精品久久久久久豆腐| 风间由美性色一区二区三区四区| 欧美日韩在线观看一区二区| 欧美极品欧美精品欧美| 免费在线观看av| 久久久不卡网国产精品二区| 99在线视频播放| 亚洲熟妇av乱码在线观看| 一区二区日韩免费看| 久久视频精品在线| 亚洲一级片在线播放| 久久综合五月婷婷| 欧美刺激午夜性久久久久久久| 草草草在线视频| 成年男女免费视频网站不卡| 亚洲乱码日产精品bd| 亚洲欧美日韩精品综合在线观看| 日韩福利一区二区| 国产aⅴ精品一区二区三区色成熟| 国产精品久久久久久久7电影| 日韩男人的天堂| 亚洲天堂久久| 久久亚洲精品视频| 久久嫩草捆绑紧缚| 日本久久精品| 亚洲欧美国产精品专区久久| 呦呦视频在线观看| 激情av综合| 亚洲成年人在线| 麻豆av免费看| 91亚洲无吗| 日韩欧美国产午夜精品| 欧美一级免费在线| 视频一区在线| 日韩精品中午字幕| 在线播放第一页| 成人av动漫| 亚洲成人网久久久| 亚洲少妇18p| 亚洲人成网站77777在线观看| 日韩精品小视频| 国产熟妇久久777777| 亚洲警察之高压线| 亚洲人成欧美中文字幕| 亚洲精品视频网址| 手机亚洲手机国产手机日韩| 日韩中文字幕免费视频| 日韩av手机在线免费观看| 一级毛片免费高清中文字幕久久网| 精品国产视频在线| 欧美日韩综合一区二区| 伊人天天综合| 欧美孕妇与黑人孕交| 无码人妻av一区二区三区波多野| 日韩中文字幕亚洲一区二区va在线 | www日韩视频| 国产美女高潮在线| 色婷婷亚洲综合| 少妇网站在线观看| 欧美精品三级在线| 亚洲国产黄色片| 一区二区三区四区免费| 91欧美日韩| 欧美成在线观看| 日本视频免费在线| 欧美a一区二区| 97人人模人人爽人人喊38tv| 五月婷中文字幕| 国产精品免费aⅴ片在线观看| 免费观看黄色的网站| 国产色婷婷在线| 色噜噜久久综合| 尤物网站在线看| 久久99国产精品久久99大师| 在线日韩欧美视频| 青娱乐国产盛宴| 久久久久网站| 99久久无色码| a视频网址在线观看| 一区二区三区高清| 免费黄色一级网站| 丁香婷婷成人| 亚洲男女性事视频| 草视频在线观看| 视频一区在线视频| 99在线影院| 在线免费观看黄色av| 亚洲综合色网站| 污色网站在线观看| 欧美亚洲大陆| 欧美精品一区在线播放| 伊人久久久久久久久久久久| 国产91色综合久久免费分享| 日韩成人av电影在线| av伦理在线| 51精品久久久久久久蜜臀| 日本japanese极品少妇| 欧美va天堂| 国产精品美腿一区在线看| 亚洲av成人精品日韩在线播放| 18成人在线视频| 久久精品视频91| 欧美在线导航| 欧美精品激情在线| 国产精品玖玖玖| 欧美国产日本视频| 国产精品亚洲αv天堂无码| 2023国产精华国产精品| 色婷婷av一区二区三区在线观看| 一本一道无码中文字幕精品热| 国产成a人亚洲精品| 中文字幕人成一区| 国外成人福利视频| 亚洲性视频网站| 四虎影院在线免费播放| 99国产精品久久| 国产免费黄色小视频| 精品国产乱码一区二区三区| 精品国产一区二区三区在线观看| 中文字幕手机在线视频| 久久美女高清视频 | 日韩中文字幕91| 欧美日韩最好看的视频| 涩涩网在线视频| 亚洲国产天堂久久国产91| 久久综合成人网| 国产成人精品亚洲午夜麻豆| 樱空桃在线播放| 四虎影视精品永久在线观看| xvideos亚洲人网站| 在线播放亚洲精品| 中文字幕一区二区三中文字幕| www.com黄色片| 97精品视频| 成人免费直播live| 调教一区二区| 精品国产乱子伦一区| 国产第一页第二页| 99视频国产精品| 成人中文字幕在线播放| 亚洲制服欧美另类| 国产精品久久久久久久app| 北岛玲一区二区三区| 欧美色综合久久| 182在线观看视频| 国产精品综合网| 日韩国产一级片| 蜜桃国内精品久久久久软件9| 日本午夜精品理论片a级appf发布| 国产在线一在线二| 欧美日韩国产高清一区| 亚洲国产精品免费在线观看| 国产 欧美在线| 国内性生活视频| 日产精品一区二区| 91在线国产电影| 国产精品论坛| 中文字幕不卡在线视频极品| 国产偷人妻精品一区二区在线| 亚洲在线视频一区| 91中文字幕永久在线| 激情都市一区二区| 免费拍拍拍网站| 欧美色婷婷久久99精品红桃| 国产欧美一区二区三区在线| 日本在线视频中文有码| 亚洲精品网址在线观看| 一本色道久久综合亚洲| 亚洲高清免费在线| 天堂资源在线视频| 成人激情文学综合网| 亚洲 中文字幕 日韩 无码| 999国产精品999久久久久久| 国产一级特黄a大片99| 成人高清一区| 午夜精品视频网站| 日本中文字幕在线视频| 日韩精品在线视频| 国产乱淫a∨片免费视频| 欧美日韩人人澡狠狠躁视频| 成人欧美一区二区三区黑人一| 99在线精品免费| 亚洲在线观看网站| 视频一区二区国产| 日韩视频在线视频| 99re66热这里只有精品8| 久久99精品国产99久久| 色妞ww精品视频7777| 国产成人拍精品视频午夜网站| 中文字幕在线播放网址| 国产小视频91| 日产精品久久久久久久性色| 日韩欧美一级片| 亚洲一级黄色大片| 欧美日韩一二三四五区| 久久久精品视频免费观看| 国产农村妇女毛片精品久久麻豆| 97人妻精品一区二区三区免费| 久久www免费人成看片高清| 久久9精品区-无套内射无码| 欧美理论在线| 国产又粗又爽又黄的视频| 国语产色综合| 欧美日韩一区在线播放| 精品国产导航| 91国产丝袜在线放| 午夜精品久久久久久毛片| 日本一区二区在线播放| 免费v片在线观看| 国内精品久久久久久久| 亚洲卡一卡二| 欧美成人黄色小视频| 免费在线午夜视频| 久久精品国产电影| 国产写真视频在线观看| 日韩在线视频观看正片免费网站| 黄色软件在线| 国产一区二区三区直播精品电影| 日韩电影在线观看完整版| 亚洲第一视频网| 日韩一区二区三区不卡| 精品国产乱码久久| 好男人www在线视频| 欧美一区欧美二区| 国产普通话bbwbbwbbw| 6080午夜不卡| 精品国产99久久久久久宅男i| 欧美精品免费视频| 97精品人妻一区二区三区| 欧美日韩成人高清| 91久久国语露脸精品国产高跟| 欧美日韩精品一区二区三区四区| 国产成人精品一区二区色戒| 欧美三级一区二区| 91肉色超薄丝袜脚交一区二区| 欧美揉bbbbb揉bbbbb| 夜夜爽8888| 欧美一级理论片| 亚洲欧美另类日韩| 日韩精品中文在线观看| 国内av一区二区三区| 最新中文字幕亚洲| av免费在线网站| 欧美—级高清免费播放| 韩日毛片在线观看| 国产精品极品尤物在线观看 | 国产精品精品软件视频| 国产精品一区二区三区美女| 精品一区二区三区视频日产| 在线视频亚洲专区| 亚洲日本japanese丝袜| 中文字幕午夜精品一区二区三区| 久久久国内精品| 国产精品视区| 亚洲最大天堂网| 成人免费av网站| 国产av自拍一区| 亚洲私人黄色宅男| www.av麻豆| 欧美三级乱人伦电影| 精品人妻无码一区二区三区蜜桃一| 精品日韩欧美一区二区| 国产一区精品| 欧美xxxx做受欧美| 亚洲人体影院| 国产日韩在线观看av| 成人爽a毛片| 亚洲精品成人自拍| 一区二区亚洲精品| 午夜精品在线免费观看| 国产成人av电影在线| 无码h肉动漫在线观看| 中文字幕亚洲成人| 国产精品自拍99| 欧美日韩久久久一区| 蜜桃久久一区二区三区| 色av吧综合网| 老牛影视精品| 亚洲最大福利网站| 精品日本12videosex| 999一区二区三区| 蜜臀av性久久久久蜜臀av麻豆| www男人天堂| 国产精品久久久久久亚洲伦| 日韩三级视频在线播放| 91麻豆精品国产综合久久久久久| 天堂av中文在线资源库| 萌白酱国产一区二区| 韩国精品主播一区二区在线观看| 国产成人精品免费视频大全最热| 精品福利久久久| 国产精品专区在线| 国内国产精品久久| 亚洲精品国产精品国自产网站| 亚洲一区二区五区| 国产一区二区视频免费观看| 亚洲欧美www| 国产不卡人人| 99国产视频在线| 国产精品久久久久蜜臀 | 欧美影视资讯| 精品一卡二卡三卡四卡日本乱码| 伊人成综合网| 中文字幕一区久久| 欧美韩国日本一区| jizz国产在线观看| 国产午夜精品麻豆| 亚洲精品88| 久久久久久久久久久久久久久久av| 欧美日韩亚洲一区三区| 亚洲男人天堂2021| 国产精品久久久久7777按摩| 性色av免费观看| 国产午夜精品麻豆| 依依综合在线| 久久综合狠狠综合久久综青草| 亚洲福利免费| 日韩无码精品一区二区| 亚洲一区二区3| 性色av蜜臀av| 欧美激情极品视频| 亚洲成人黄色| 人妻互换免费中文字幕| 国产高清久久久久| 免费日韩在线视频| 精品国产免费一区二区三区四区| 天堂成人av| 国产高清精品一区二区| 亚洲大片av| 国产二级一片内射视频播放 | 青草青青在线视频| 不卡的看片网站| 尤物视频在线观看国产| 日韩电视剧在线观看免费网站| 在线观看福利电影| 日日夜夜精品网站| 麻豆精品国产传媒mv男同| 熟女av一区二区| 日韩欧美一二三| 国产传媒在线观看| 欧美高清性xxxxhd| 蜜臀av性久久久久av蜜臀妖精| 亚洲色图100p| 欧美一级久久久| av3级在线| 欧洲精品久久| 久久99精品久久久久久国产越南| 亚洲综合视频网站| 精品99一区二区三区| 亚洲优女在线| 亚洲黄色成人久久久| 国产资源精品在线观看| 久久久久久久久久99| 日韩精品高清在线观看| 国产精品伦一区二区| 91麻豆天美传媒在线| 成人免费精品视频| 中文字幕乱伦视频| 欧美精品手机在线| 亚洲综合小说图片| 中文字幕亚洲影院| 亚州成人在线电影| 亚洲精品传媒| 国产在线一区二区三区欧美| 日韩和的一区二区| 久久久久久久久久一区二区三区 | 欧美尤物美女在线| 国产高清一区视频| 日韩激情视频在线观看| 久久久久亚洲AV成人| 亚洲精品中文字幕av| 9999精品免费视频| 国产在线青青草| 亚洲欧洲制服丝袜| 欧美美女搞黄| 97人人香蕉| 蜜桃久久精品一区二区| 日本少妇xxxx动漫| 精品国产一区二区三区在线观看 |