精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

EMNLP 2023|利用LLM合成數據訓練模型有哪些坑?

人工智能
這篇論文研究了大型語言模型(LLMs)生成合成數據集用于文本分類模型訓練的潛力和限制。 分析發(fā)現(xiàn),任務的主觀性(標注一致性越差)越高,利用合成數據來訓練模型效果也越差。另外合成數據效果好不好的關鍵影響因素在于生成數據的多樣性如何,few-shot方式可以提高生成樣本的多樣性,通過few-shot方式生成的樣本效果也一般優(yōu)于zero-shot的樣本。

大家好,我是HxShine

今天我們將介紹EMNLP2023的一篇大模型(LLMs)生成文本分類任務合成數據的文章,標題是《Synthetic Data Generation with Large Language Models for Text Classification: Potential and Limitations》。

實際落地中,高質量訓練數據的收集和篩選既耗費時間又成本昂貴,研究人員探索使用LLMs生成合成數據作為替代方法。然而,LLMs生成的合成數據在支持不同文本分類任務的模型訓練上效果有好有差。本文試圖分析不同因素如何影響LLMs生成合成數據的有效性。

這篇論文研究了大型語言模型(LLMs)生成合成數據集用于文本分類模型訓練的潛力和限制。 分析發(fā)現(xiàn),任務的主觀性(標注一致性越差)越高,利用合成數據來訓練模型效果也越差。另外合成數據效果好不好的關鍵影響因素在于生成數據的多樣性如何,few-shot方式可以提高生成樣本的多樣性,通過few-shot方式生成的樣本效果也一般優(yōu)于zero-shot的樣本。

? Title: Synthetic Data Generation with Large Language Models for Text Classification: Potential and Limitations

? Url:  https://arxiv.org/abs/2310.07849

? Authors: Zhuoyan Li, Hangxiao Zhu, Zhuoran Lu, Ming Yin

1 Motivation

? 利用LLM生成訓練數據(例如文本分類數據)是否有效?效果的影響因素有哪些?

? 這項研究旨在探討大型語言模型生成合成數據對文本分類模型訓練的有效性及其在不同任務中的表現(xiàn)差異性。

? 作者們尤其關注分類任務的主觀性如何影響基于合成數據訓練的模型的性能。

背景:研究者最近探索了使用大型語言模型(LLMs)生成合成數據集作為一種替代方法。然而在不同的分類任務中,LLM生成的合成數據在支持模型訓練方面的有效性并不一致。

2 Methods

方法:論文通過采用兩種數據生成策略,10個文本分類任務數據集,利用BERT和RoBERTa作為基座模型,在多個角度對生成的數據進行了分析,從而推導出關于LLMs在合成數據生成中的潛力和局限性,最后通過對比分析得到了合成數據在模型訓練中的表現(xiàn)與任務和實例的主觀性負相關(標注一致性越低、主觀性越高)的結論。

實驗和評估方法總結:

實驗方法:

1. 數據生成:

? 零樣本(Zero-shot):在沒有真實世界數據的情況下,使用LLM直接生成文本實例。這涉及到構建上下文提示來設定生成環(huán)境,然后提供數據生成提示來指導LLM生成具有特定標簽的文本。

? 少樣本(Few-shot):在有少量真實世界數據的情況下,這些數據作為例子指導LLM生成新的文本實例。這種方法旨在讓LLM學習真實數據的模式,并在此基礎上生成合成數據。

2. 數據集選擇:選擇了10個不同的文本分類任務數據集,這些數據集涵蓋了從低到高不同程度的主觀性,以便研究主觀性對模型性能的影響。

3. 模型訓練:使用BERT和RoBERTa預訓練模型作為編碼器,訓練分類模型。訓練過程中,分別使用真實世界數據、零樣本合成數據和少樣本合成數據。

評估方法:

1. 性能指標:評估模型性能的主要指標是Macro-F1分數和準確率(Accuracy Score)。這些指標用于衡量模型在測試集上的表現(xiàn),并與金標準標簽進行比較。

2. 主觀性評估:通過眾包研究收集任務和實例級的主觀性判斷。任務主觀性通過比較任務對的客觀性來確定,而實例級主觀性則通過標注人員對文本實例標簽的一致性來衡量(標注一致性)。

3. 數據多樣性分析:使用Remote Clique Score和Chamfer Distance Score來量化數據集的多樣性,以探索模型性能差異的潛在原因。

4. 實例級性能分析:研究了模型在不同主觀性水平的任務實例上的性能差異,即通過改變實例級標注人員一致性閾值來觀察模型準確率的變化。

5. 實驗重復性:為了確保結果的穩(wěn)健性,所有實驗都進行了多次重復,并報告了平均性能。

3 Conclusion

? 研究結果表明,分類任務的主觀性越大(標注一致性也越差),使用LLM生成合成數據訓練的模型的效果越差,這在任務級別和實例級別都得到了印證。

圖片圖片

Table 1: Comparing the performance of classification models trained on the LLM-generated synthetic data

二、詳細內容

1 詳細實驗方案設置

本文的實驗設置主要圍繞使用大型語言模型(LLMs)生成合成數據以支持文本分類模型的訓練。探討了LLM生成的合成數據在不同分類任務中的有效性,并特別關注了任務的主觀性如何影響模型性能。以下是實驗的主要設置:

1. 數據生成設置:

? 零樣本(Zero-shot):在這種設置下,假設沒有真實世界的數據(即“文本-標簽對”)存在。研究者們構建了兩個連續(xù)的提示(prompts),直接提供給預訓練的大型語言模型(如GPT-3.5-Turbo),以生成特定風格的文本和標簽。

? 少樣本(Few-shot):在這種設置下,假設有少量真實世界數據可用于文本分類任務。這些數據點作為例子,指導LLM生成合成數據。在生成文本之前,每次都會提供幾個隨機抽樣的真實世界數據實例(包括文本和標簽)作為例子。

2. 任務和數據集:

? 實驗涵蓋了10種代表性的數據集,覆蓋了各種文本分類任務,如新聞分類、電影評論情感分析、短信垃圾郵件過濾等。這些數據集被選中是為了涵蓋廣泛的任務主觀性。

? 對于每個任務,研究者們使用預訓練的BERT和RoBERTa模型作為編碼器,并使用這些模型最后一層的表示嵌入作為分類模型的輸入。

3. 模型訓練和評估:

? 在零樣本和少樣本設置下,分別生成了3000個合成數據,用于訓練分類模型。

? 三類數據訓練的模型進行對比:使用真實世界數據訓練的模型、零樣本設置下生成的合成數據訓練的模型以及少樣本設置下生成的合成數據訓練的模型進行比較。

? 模型性能通過Macro-F1和準確率(Accuracy)分數來評估,并與測試集中的金標準標簽進行比較。

4. 主觀性評估:

? 為了確定不同文本分類任務的主觀性水平,利用眾包收集了人群對任務主觀性的判斷。

? 通過比較任務之間的主觀性,構建了一個有向圖,并應用拓撲排序算法來獲得任務主觀性的線性排序。

5. 數據多樣性分析:

? 為了探索模型性能差異的潛在原因,研究者們對訓練數據的多樣性進行了探索性分析,使用了遠程小團體得分(Remote Clique Score)和Chamfer距離得分(Chamfer Distance Score)來量化數據集的多樣性。

6. 實例級主觀性評估:

? 對于每個任務,研究者們還探討了任務實例的主觀性如何影響模型性能。通過眾包研究收集了實例級注釋,并計算了每個任務實例的主觀性水平。

2 實驗結論

圖片圖片

Table 1: Comparing the performance of classification models trained on the LLM-generated synthetic data

1. 數據集和任務:表中列出了10個不同的文本分類任務,包括AG新聞、IMDB評論、短信垃圾郵件、金融短語庫、Reddit情緒、推特諷刺、推特情緒、諷刺新聞、幽默演講等。

2. 任務主觀性:表中通過星號(?)的數量來表示任務的主觀性水平,星號越多表示任務越主觀。

3. 模型性能:對于每個任務,表中展示了使用BERT和RoBERTa模型在真實世界數據、零樣本設置下的合成數據和少樣本設置下的合成數據上訓練的模型的性能。

4. 性能比較:表中的數據展示了在不同數據集上,使用合成數據訓練的模型與使用真實世界數據訓練的模型之間的性能差異。性能差異以百分比形式表示,負值表示合成數據訓練的模型性能低于真實數據訓練的模型。

5. 主要結論:

? 使用真實世界數據訓練的模型在幾乎所有任務上都優(yōu)于使用合成數據訓練的模型,無論是零樣本還是少樣本設置。

? 在少樣本設置下,模型的性能通常優(yōu)于零樣本設置,這表明使用真實世界數據作為例子可以提高合成數據的有效性。

? 對于主觀性較低的任務(如新聞分類、關系分類、IMDB評論和短信垃圾郵件),合成數據訓練的模型與真實數據訓練的模型之間的性能差異相對較小。

? 對于主觀性較高的任務(如幽默或諷刺檢測),使用合成數據訓練的模型性能下降更為顯著。

這些結論表明,任務的主觀性是影響LLM生成合成數據有效性的一個重要因素。對于高度主觀的任務,LLM生成的合成數據可能不足以支持有效的模型訓練。

3 真實數據與合成數據的多樣性分析

圖片圖片

Figure 1 在文檔中提供了關于真實世界數據與LLM生成的合成數據多樣性的比較。這個比較是通過兩個指標來量化的:Remote Clique Score(遠程小團體得分)和Chamfer Distance Score(Chamfer距離得分)。這兩個指標用于衡量數據集中實例之間的多樣性,其中較高的值表示更大的數據多樣性。

Remote Clique Score 是數據實例到其他實例的平均平均距離,而 Chamfer Distance Score 是數據實例到其他實例的平均最小距離。在這兩個指標中,較高的值意味著數據實例之間的差異更大,即數據集的多樣性更高。

Figure 1 結論:

1. 數據多樣性:真實世界數據通常比少樣本設置下生成的合成數據更具多樣性,而少樣本合成數據又比零樣本設置下生成的合成數據更具多樣性。

2. 任務主觀性與數據多樣性:在高主觀性任務(如幽默檢測、諷刺檢測等)中,真實世界數據與合成數據之間的多樣性差異更為顯著,特別是在Chamfer Distance Score上。這表明對于需要理解復雜人類情感和語境的任務,LLM可能無法生成能夠覆蓋真實生活場景全貌的數據實例。

3. 模型性能與數據多樣性:數據多樣性的差異可能部分解釋了為什么在真實世界數據和少樣本合成數據上訓練的模型通常優(yōu)于在零樣本合成數據上訓練的模型。多樣性更高的數據集可能有助于模型學習到更廣泛的特征和模式,從而提高模型的泛化能力。

4 不同文本分類任務實例級主觀性的量化評估

圖片圖片

Table 2: The average instance-level annotation agreement for different types of tasks

Table 2 在文檔中提供了不同文本分類任務實例級主觀性的量化評估,以及這些任務的平均標注人員的一致性。這些數據有助于理解任務實例的主觀性如何影響模型在這些實例上的性能。表中包含以下內容和結論:

1. 任務實例級主觀性:表中列出了不同文本分類任務,如AG新聞、關系分類、IMDB評論等,并提供了每個任務實例的平均標注人員的一致性(平均同意度 a)和Krippendorff’s α(一種衡量標注人員間一致性的統(tǒng)計量)。

2. 標注人員的一致性:平均同意度 a 和 Krippendorff’s α 的值越高,表示標注人員在給定任務實例的標簽上達成一致的可能性越大,即任務實例的主觀性較低。

3. 任務主觀性水平:表中還提供了任務的主觀性水平,用星號(?)的數量表示。星號越多,表示任務的主觀性越高。

4. 主要結論:

? 任務實例的平均標注人員的一致性與Krippendorff’s α值緊密相關,這表明平均同意度 a(標注一致性) 可以作為任務實例主觀性的合理代理。

? 對于主觀性較高的任務,如幽默檢測和諷刺檢測,標注人員在標簽上的一致性較低,這可能意味著這些任務的實例更具主觀性,從而對模型訓練構成挑戰(zhàn)。

? 在同一類型的任務中,模型在主觀性較低的任務實例上(即標注人員在這些實例上達成較高一致性的實例)通常表現(xiàn)更好。

這些結論強調了任務實例的主觀性對模型性能的影響,特別是在使用LLM生成的合成數據進行訓練時。對于高度主觀的任務實例,即使是在少樣本設置下,模型的性能也可能受到限制,因為這些實例可能難以通過合成數據得到充分的表示。

5 準確率隨標注一致性的變化情況

圖片圖片

Figure 2: Changes in the accuracy of the BERT model trained on zero-shot synthetic data as the instance-level annotation agreement threshold varies

Figure 2 在文檔中展示了BERT模型在零樣本合成數據上訓練時,模型準確率隨著實例級標注人員一致性閾值(γ)變化的情況。

1. 模型準確率與實例級標注人員一致性:對于大多數任務(除了Sarcasm News和Financial Phrasebank數據集),模型準確率與實例級標注人員一致性閾值之間存在強烈的單調遞增關系。這意味著隨著閾值的增加(即過濾掉更多主觀性較高的任務實例),模型的準確率通常會提高。

2. 相關性和擬合度:每個子圖中的實線表示數據的線性回歸擬合,R-squared分數量化了擬合的好壞。Spearman’s ρ評估了實例級標注人員一致性閾值與模型準確率之間的排名相關性的強度。理想情況下,R-squared和Spearman’s ρ的值接近1,表明實例級主觀性與模型準確率之間存在強烈的單調關系。

3. 主要結論:

? 對于大多數任務,模型在主觀性較低的任務實例上表現(xiàn)更好。

? 這種趨勢在真實世界數據訓練的模型中也存在,但通常比合成數據訓練的模型表現(xiàn)得要弱。這可能意味著合成數據可能無法完全捕捉到真實世界數據的復雜性和多樣性。

三、總結

這篇論文討論了利用LLM生成合成數據帶來的潛力以及其在文本分類任務應用中的局限性。研究表明,當涉及到主觀性較高的任務時,合成數據可能不足以支持高性能模型的訓練。這項工作對于那些正在利用或計劃使用LLM生成數據的研究人員來說非常重要,它提供了對合成數據有效性的深入理解,并指導了未來可能需要采取的方向和改進。

結論:

? 對于低主觀性任務(標注一致性好),LLM生成的合成數據可以有效地支持模型訓練。

? 對于高主觀性任務(標注一致性差),合成數據可能不足以支持有效的模型訓練。

? 合成數據效果不好的關鍵影響因素在于多樣性比真實數據差,few-shot方式可以提高生成樣本的多樣性。

? 任務主觀性與眾包標注人員的一致性強相關,標注一致性 可以作為任務實例主觀性的合理表示。

本文轉載自微信公眾號「NLP PaperWeekly」,可以通過以下二維碼關注。轉載本文請聯(lián)系NLP PaperWeekly公眾號。

責任編輯:武曉燕 來源: NLP PaperWeekly
相關推薦

2023-02-23 07:46:48

學習模型數據倉庫

2024-10-14 09:25:00

2022-06-13 11:18:08

合成數據AIML

2023-08-01 15:46:18

數據

2024-06-19 13:02:01

2025-06-04 09:15:16

2021-03-23 23:17:18

AI人工智能

2023-12-29 13:52:00

AI技術

2024-10-29 15:00:00

大模型數據

2025-06-04 03:00:00

人工智能AI智能訓練

2022-08-11 08:00:00

機器學習合成數據深度學習

2023-02-22 09:37:14

AI模型

2024-12-12 14:10:00

AI模型數據

2024-08-09 14:48:00

2025-01-23 09:15:00

數據技術模型

2025-08-24 09:24:07

2024-03-27 10:03:29

2025-04-08 00:40:00

谷歌合成數據大模型

2024-01-16 14:23:32

大數據人工智能AI

2025-06-09 09:41:25

點贊
收藏

51CTO技術棧公眾號

久久香蕉综合色| 美女视频久久黄| 一区二区三区视频在线观看免费| av在线中文| 激情久久五月天| 欧美激情亚洲国产| 亚洲色图14p| 日韩一级特黄| 欧美丝袜一区二区| 日本一级淫片演员| 蜜桃免费在线| 国产精品中文欧美| 日韩av免费在线观看| 草视频在线观看| 精品国产一区二区三区| 精品欧美久久久| 一区二区成人网| 搞黄网站在线看| 国产精品网友自拍| 久久精品人成| 性做久久久久久久久久| 日日噜噜夜夜狠狠视频欧美人| 美女999久久久精品视频| 蜜乳av中文字幕| 国产精品xxx在线观看| 精品视频999| aⅴ在线免费观看| 成人av福利| 欧美激情在线一区二区| 九九九九九九精品| 亚洲国产中文字幕在线| 精品一区二区免费看| 日本久久久久久| 日本在线视频中文字幕| 欧美久久影院| 久久在线免费观看视频| 精品伦精品一区二区三区视频密桃| 日韩在线你懂的| 亚洲国产欧美日韩精品| 99国产精品免费视频| 日本在线一区二区| 欧美日韩免费视频| 手机视频在线观看| 巨胸喷奶水www久久久| 日韩人在线观看| 免费黄色福利视频| 樱花草涩涩www在线播放| 午夜欧美一区二区三区在线播放| 免费cad大片在线观看| 大地资源网3页在线观看| 国产精品国产三级国产有无不卡 | 国产成人精品一区二区色戒| 亚洲黄色高清| 国内精品久久久久影院优| 国产黄色的视频| 亚洲精品成人影院| 欧美成人免费视频| 免费毛片在线播放免费| 狠狠久久婷婷| 国外色69视频在线观看| 色播视频在线播放| 麻豆九一精品爱看视频在线观看免费| 欧美一级大片视频| 国产一区二区视频网站| 日韩高清不卡一区二区| 国产精品吴梦梦| 91午夜交换视频| 精品中文字幕一区二区小辣椒 | 国产在线播放观看| 涩涩在线视频| 欧美综合一区二区| 日韩av在线中文| 视频精品一区| 亚洲激情小视频| a天堂中文字幕| 色婷婷一区二区三区| 欧美成人免费全部观看天天性色| 国产真人真事毛片| 老司机午夜精品视频| 国产狼人综合免费视频| 精品人妻伦一区二区三区久久| 成人免费视频国产在线观看| 久久综合九九| 日本高清中文字幕在线| 一区二区欧美在线观看| 人妻熟妇乱又伦精品视频| 亚洲www免费| 69堂亚洲精品首页| 欧美肉大捧一进一出免费视频 | 成人动漫视频在线| 欧美日韩一区二区视频在线观看 | 亚洲色图清纯唯美| 久久久久免费看黄a片app| 一二区成人影院电影网| 日韩一区二区电影网| 亚洲精品女人久久久| 成人在线免费观看网站| 久久久久在线观看| 乱子伦一区二区三区| 国产黄色精品网站| 日本精品一区二区三区高清 久久| 欧美激情免费| 精品国产1区2区| 黄色一级片免费的| 亚洲精品动态| 欧美国产视频日韩| 中文字幕av久久爽| www.99精品| 亚洲一区三区电影在线观看| 丰满的护士2在线观看高清| 色婷婷激情综合| youjizz.com日本| 人人狠狠综合久久亚洲婷| 国模叶桐国产精品一区| 一区二区国产欧美| 久久久久久久久久看片| 激情五月六月婷婷| 黄色成人在线观看网站| 日韩精品在线观| 久久久国产精品黄毛片| 蜜桃av一区二区在线观看| 久久久久久国产精品免费免费| 黄色网址在线免费| 在线观看日韩国产| 少妇户外露出[11p]| 欧美日韩国产高清| 成人免费网视频| 91精彩在线视频| 一本大道久久a久久精品综合| 国产香蕉精品视频| 伊人情人综合网| 国产精品视频久| 国产系列在线观看| 色8久久精品久久久久久蜜| 超碰男人的天堂| 亚洲小说欧美另类社区| 亚洲va久久久噜噜噜久久天堂| 91美女视频在线| 欧美午夜精品久久久久久孕妇| 免费观看av网站| 亚洲毛片在线| 久久国产精品高清| 国产福利片在线观看| 精品国产人成亚洲区| 久久av高潮av无码av喷吹| 国产老女人精品毛片久久| 椎名由奈jux491在线播放| 九九久久国产| 亚洲欧美综合区自拍另类| 欧美超碰在线观看| 国产日韩欧美a| 亚洲五月天综合| 精品产国自在拍| 国产精品美女免费视频| av在线日韩国产精品| 欧美日韩久久久一区| 精品国产国产综合精品| 久久99精品一区二区三区三区| 亚洲精品日韩成人| 日韩三级成人| 欧美激情一二三| 国产精品国产高清国产| 欧美性猛交xxxx富婆| 国产三级av在线播放| 蜜桃视频在线一区| 日韩不卡一二区| 1313精品午夜理伦电影| 91国产中文字幕| 精彩国产在线| 欧美日韩国产高清一区二区三区 | 91探花福利精品国产自产在线| 成人看av片| 亚洲第一精品福利| 区一区二在线观看| 国产精品二三区| 国产吃瓜黑料一区二区| 国模 一区 二区 三区| 97人人模人人爽人人少妇| 免费h视频在线观看| 亚洲天堂免费观看| 99在线小视频| 亚洲成av人片在线观看无码| 无码人妻精品一区二区三应用大全| 日韩高清一区二区| 亚洲天堂第一区| 亚洲影院天堂中文av色| 亚洲精品免费一区二区三区| 黄色在线网站噜噜噜| 中日韩美女免费视频网站在线观看 | 欧洲不卡视频| 亚洲成人av片| 亚洲视频在线观看免费视频| 洋洋成人永久网站入口| 偷拍夫妻性生活| 国产精品亚洲人在线观看| 国产极品粉嫩福利姬萌白酱| 四季av一区二区三区免费观看 | 四虎影院在线播放| 欧美另类久久久品| 天堂网av手机版| 亚洲欧洲av在线| 四虎永久免费影院| 国产精品12区| 亚洲精品久久久中文字幕| 亚洲二区精品| 亚洲一区不卡在线| 欧美久久香蕉| 444亚洲人体| 黄色成人在线观看网站| 日本欧美爱爱爱| 久久香蕉av| 久久精品亚洲一区| 成人在线免费观看| 亚洲精品久久久久久下一站| 国产视频aaa| 欧美在线free| 亚洲午夜18毛片在线看| 亚洲午夜成aⅴ人片| 香蕉成人在线视频| 国产午夜一区二区三区| 男男做爰猛烈叫床爽爽小说| 国产精品1024久久| 婷婷免费在线观看| 日韩avvvv在线播放| 天天夜碰日日摸日日澡性色av| 亚洲精品一区二区妖精| 视频在线一区二区三区| 亚洲专区视频| 狠狠爱一区二区三区| 97se亚洲| av蓝导航精品导航| 麻豆精品在线| 亚洲自拍偷拍色图| 国产精品麻豆| 91沈先生在线观看| 先锋影音网一区二区| 国产精品中文字幕在线观看| 日本欧美韩国| 国产精品久久中文| 国产亚洲欧美日韩精品一区二区三区 | 91视频你懂的| 欧美精品欧美极品欧美激情| 成人a免费在线看| 91人妻一区二区| 9l国产精品久久久久麻豆| 插我舔内射18免费视频| av中文一区二区三区| 中国免费黄色片| 成人动漫av在线| 国产网站无遮挡| 97久久超碰国产精品电影| 免费成人蒂法网站| 97久久超碰国产精品| 国产又粗又长又爽| 国产亚洲一区二区三区在线观看| 日韩一区二区a片免费观看| 亚洲国产高清不卡| 婷婷丁香综合网| 亚洲人成在线播放网站岛国| 99鲁鲁精品一区二区三区| 亚洲精品国产第一综合99久久| 一区视频免费观看| 亚洲制服丝袜av| 免费观看一区二区三区毛片 | 国产最新免费视频| 欧美亚洲一区| 天天插天天操天天射| 激情欧美一区二区| 精品国产免费久久久久久婷婷| aaa欧美色吧激情视频| 国产精品成人一区二区三区电影毛片| 久久精品人人做人人爽人人| 国产精品视频在| 一区二区三区四区av| 偷偷操不一样的久久| 欧美影院午夜播放| av中文字幕观看| 亚洲精品视频免费| 日韩免费啪啪| 国内精品免费午夜毛片| 88xx成人永久免费观看| 91精品视频免费观看| 精品欧美午夜寂寞影院| 日本亚洲欧洲精品| 欧美精品日韩| 蜜臀久久99精品久久久酒店新书 | 国产在线高清理伦片a| 欧美激情一级精品国产| 神马久久资源| 亚洲综合一区二区不卡| 亚洲图区在线| 成人av在线不卡| 日本午夜精品一区二区三区电影 | 久久久久久毛片| 懂色av懂色av粉嫩av| 色综合久久88色综合天天6| 一级全黄少妇性色生活片| 亚洲风情亚aⅴ在线发布| 日本中文在线观看| 欧美中文在线观看| 一区二区三区欧洲区| 日韩亚洲不卡在线| 精品1区2区3区4区| 一级黄色片在线免费观看| 久久九九影视网| 国产亚洲欧美精品久久久久久| 欧美性大战xxxxx久久久| 人人妻人人澡人人爽精品日本| 色婷婷成人综合| 最近在线中文字幕| 国产成人亚洲欧美| 亚洲高清影视| 91香蕉视频污版| 99国产精品久久久久| 波多野结衣不卡视频| 精品视频在线免费| 久久精品蜜桃| 国产91精品久久久| 亚洲精品视频一二三区| 一区二区三区久久网| 日韩精品一二三区| 国产肉体xxxx裸体784大胆| 一二三四社区欧美黄| 一级黄色片网站| 伊人伊人伊人久久| 欧美成人精品一区二区男人小说| 国产高清精品一区二区三区| 亚洲天天影视网| 中文字幕永久有效| 国产精品丝袜黑色高跟| 人妻中文字幕一区二区三区| 亚洲精品少妇网址| 伊人色综合一区二区三区影院视频 | 青青草原av在线播放| 成人黄色在线网站| 18精品爽视频在线观看| 日韩欧美三级在线| 影音先锋在线视频| 99国内精品久久久久久久软件| 亚洲国产精品久久久天堂| 日本中文字幕观看| 中文字幕中文乱码欧美一区二区| 亚洲精品91天天久久人人| 国产一区av在线| 欧洲成人一区| 亚洲日本一区二区三区在线不卡| 蜜臀av性久久久久蜜臀aⅴ流畅| 正在播放国产对白害羞| 欧美三级视频在线观看| 视频一区二区三区不卡| 国产主播欧美精品| 欧美激情麻豆| av免费观看不卡| 欧美日韩亚洲系列| 免费在线超碰| 国产精品久久久精品| 97精品一区| 免费欧美一级片| 亚洲a一区二区| 青青草免费在线视频| 国产精品你懂得| 久久精品欧美一区| 久久久久亚洲av成人网人人软件| 五月激情综合色| 国产永久免费高清在线观看视频| 国产精品黄色av| 亚洲一区二区三区无吗| 亚洲麻豆一区二区三区| 欧美性xxxx极品hd满灌| av在线播放网站| 亚洲一区二区三区视频| 亚洲手机在线| 国产精品无码久久久久一区二区| 粉嫩老牛aⅴ一区二区三区| 成人在线免费观看| 91精品久久香蕉国产线看观看| 亚洲精选国产| 老司机福利在线观看| 日韩欧美综合一区| 中文字幕高清在线播放| 亚洲综合首页| 成人性生交大片免费看中文 | 五月天av在线| 亚洲高清不卡一区| 风流少妇一区二区| 国产美女www| 欧美高清视频在线播放| 欧美欧美黄在线二区| 99999精品| 色婷婷精品大在线视频| 欧美xxxxhdvideosex| 欧洲成人一区二区| 国产成人日日夜夜| 中文字幕免费高清网站| 久精品免费视频| 精品国产123区| 国产婷婷在线观看| 欧美日本高清视频在线观看| segui88久久综合9999| 中国成人在线视频|