精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM能力評測與基準構建:金融LLM認知診斷框架;LLM未來事件預測評估基準;LLM MCP的評估基準

發布于 2025-8-25 01:40
瀏覽
0收藏

From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models

2025-08-19|WHU, WHU, NAU, SWJTU, BUFT, AU, UoM|??53??http://arxiv.org/abs/2508.13491v1https://huggingface.co/papers/2508.13491https://github.com/WHUNextGen/FinCDM??

研究背景與意義

  1. 問題定義與現狀概述金融領域中大型語言模型(LLMs)展現出廣泛應用潛力,但現有評測方法多依賴單一分數,難以揭示模型對金融知識的具體掌握情況。傳統金融LLM評測基準覆蓋面狹窄,忽視了稅務、監管等關鍵領域,且無法反映模型在不同金融技能上的差異。
  2. 挑戰與目標闡明當前評測面臨“分數扁平化”問題,導致模型能力被過度簡化。為解決這一瓶頸,論文旨在構建一個認知診斷框架FinCDM,能夠從知識與技能層面細致評估金融LLMs,揭示其優勢與不足,推動更可信和針對性的模型開發。

研究方法與創新

LLM能力評測與基準構建:金融LLM認知診斷框架;LLM未來事件預測評估基準;LLM MCP的評估基準-AI.x社區

  1. 技術框架設計FinCDM借鑒教育心理學中的認知診斷模型(CDM),通過非負矩陣協同分解方法,將模型對題目的回答矩陣分解為題目潛在技能需求、模型潛在技能掌握度和技能與金融知識點的映射矩陣,形成多維度、可解釋的能力畫像。
  2. 數據集創新構建CPA-QKA數據集,基于權威的注冊會計師考試大綱,涵蓋70個核心金融概念,由三位領域專家嚴格編寫和標注問題,保證高質量與廣泛覆蓋。另對現有FinEval數據集進行細粒度知識點標注,驗證數據集的結構合理性。
  3. 優勢與理論基礎
  • 細粒度診斷能力:不同于傳統單一準確率,FinCDM能精確定位模型在具體金融知識點上的掌握情況。
  • 覆蓋全面、注重實用:涵蓋財務、審計、稅務、經濟法等多個子領域,反映真實金融業務需求。
  • 理論支撐:采用概率生成模型結合矩陣分解技術,提升了模型推斷的魯棒性和解性,相較傳統DINA、神經網絡或圖模型,表現出更優的預測準確度和泛化能力。
  1. 對比現有方法通過與神經網絡CDM和圖神經網絡CDM對比,FinCDM在準確率、AUC及RMSE指標上均顯著優越,證明了其在金融領域認知診斷任務中的有效性。

實驗設計與結果分析

LLM能力評測與基準構建:金融LLM認知診斷框架;LLM未來事件預測評估基準;LLM MCP的評估基準-AI.x社區

  1. 實驗設計評測覆蓋30余款中文能力強的LLMs,包括閉源通用模型(如GPT-4、Claude系列)、開源通用模型(如Baichuan、Falcon)及金融領域專用模型(如Finma、CFGPT)。使用統一的提示模板和生成配置,保證評測公平性和結果穩定性。
  2. 結果分析
  • 知識掌握差異顯著:FinCDM揭示了模型在不同金融知識點的掌握差異。如Gemini-2.5-Pro擅長國際會計準則相關內容,而Doubao-1.5-Pro則在財務成本管理領域表現突出。
  • 語言資源影響明顯:缺乏中文預訓練的模型(如Falcon-7B)表現較差,顯示語言資源對金融知識習得至關重要。
  • 數據集結構影響:FinEval-KQA數據集因知識點分布不均,導致模型表現偏向高頻概念,CPA-KQA則提供更均衡的評估視角。
  • 診斷準確性驗證:通過對Claude 3.5模型在特定金融概念(如F3、F5)上的錯誤回答進行專家復核,確認FinCDM診斷結果的可靠性。
  1. 模型行為模式揭示通過潛在技能掌握矩陣分析,發現模型群體存在明顯的行為聚類,反映不同模型在金融知識領域的專長和弱點,為后續模型定向優化提供依據。

結論與展望

  1. 研究貢獻總結
  • 首次提出面向金融LLMs的認知診斷評估框架FinCDM,突破傳統單一分數限制,實現知識技能層面的細粒度評測。
  • 構建高質量、覆蓋全面的CPA-QKA數據集,結合嚴謹的專家標注流程,提升了評測的權威性和實用價值。
  • 通過大規模多模型實驗,揭示了金融LLMs在知識掌握上的多樣化表現,促進了模型理解和可信度提升。
  1. 局限性分析
  • 當前數據集主要基于中文金融知識,跨語言和跨文化的泛化能力尚需驗證。
  • 矩陣分解模型假設線性關系,可能限制對復雜非線性知識結構的捕捉。
  • 部分金融知識點因數據稀缺仍難以充分評估,未來需擴展數據覆蓋。
  1. 未來展望
  • 拓展多語言、多文化金融數據集,增強模型跨域適應能力。
  • 融合更先進的非線性診斷模型,如圖神經網絡與深度學習方法,提升診斷精度和解釋力。
  • 將認知診斷結果反饋至模型訓練環節,實現動態知識補全和定向能力提升,推動金融LLMs向更高可信度和專業度發展。

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

2025-08-16|ByteDance Seed, Fudan U, Stanford U, Princeton|??46

??http://arxiv.org/abs/2508.11987v2https://huggingface.co/papers/2508.11987??

研究背景與意義

  1. 研究背景未來預測是大型語言模型(LLM)代理面臨的復雜任務,要求具備高度的分析思維、信息收集、上下文理解和不確定性下的決策能力。當前雖然存在多種LLM評測基準,但多集中于靜態知識或模擬環境,缺乏對動態、實時未來事件預測的系統性評估。未來預測任務不僅涉及實時數據整合,還要求模型在信息不斷變化的環境中進行推理和預測,類似于政治、經濟和金融領域的專業人類分析師。
  2. 研究意義該領域缺乏大規模、動態、無數據污染的評測基準,限制了LLM代理未來預測能力的準確評估和提升。FutureX填補了這一空白,提供了一個涵蓋廣泛領域、支持實時更新的未來預測動態評測平臺,推動LLM代理向專業人類分析師水平邁進,促進智能體在復雜真實環境中的應用和發展。

研究方法與創新

  1. 技術描述FutureX構建了一個自動化、動態的未來事件評測流水線,涵蓋事件庫構建、每日事件篩選、代理預測執行和答案獲取四大環節。通過從2000余個網站篩選出195個高質量、多領域數據源,結合模板化事件生成和隨機變量替換,保證了事件的多樣性和實時性。系統每日自動運行,收集代理預測并在事件結果公布后自動抓取真實答案,實現全流程閉環自動評測。
  2. 創新點
  • 數據污染根除設計:通過預測未來尚未發生事件,杜絕歷史數據導致的邏輯泄漏和檢索污染,確保評測公正性和可信度。
  • 真實世界動態環境:非模擬環境,直接面對真實、復雜、多變的信息流,考驗代理的綜合分析、推理和決策能力。
  • 規模與多樣性領先:涵蓋11大領域、近500個每周事件,涵蓋單選、多選、開放排名及數值預測等多種題型,遠超現有未來預測基準的規模和豐富度。
  • 多層次代理評測:評估基礎LLM、具備搜索推理能力的LLM、開源和閉源深度研究代理,全面反映不同技術路線的性能表現。
  • 高度自動化評測流程:實現每日自動事件更新、模型預測執行和結果采集,支持25個模型的連續在線評測,技術復雜度和實施難度均領先同行。
  1. 優勢解析該方法突破了傳統靜態基準的限制,真實模擬了未來預測的核心挑戰,推動了代理從知識記憶向動態推理和信息整合的轉型。通過多領域、多事件類型的覆蓋,FutureX有效避免了模型過擬合和評測偏頗,確保了評測結果的廣泛適用性和前瞻性。

實驗設計與結果分析

  1. 實驗設計
  • 事件構建:每日從195個精選網站自動爬取未來事件,經過模板化處理和隨機化,生成約500個多樣化事件。
  • 事件篩選:剔除主觀、易預測(如二選一)及有害事件,確保事件質量和挑戰性。
  • 模型評測:涵蓋8個基礎LLM、7個具備搜索推理的LLM、8個開源深度研究代理和2個閉源深度研究代理,共25個模型。所有模型每日自動執行預測,限時30分鐘。
  • 答案采集:事件結果公布后,系統多時段爬取并通過LLM輔助抽取準確答案,自動完成評分。
  1. 結果分析
  • 整體表現:FutureX提供了動態、無污染且跨領域的評測環境,模型表現顯著區分了基礎LLM與具備搜索推理能力的代理,深度研究代理表現尤為優異。
  • 難度與領域影響:模型在不同難度等級和領域上的表現存在顯著差異,復雜開放式高波動事件對模型推理和搜索能力提出更高要求。
  • 時間敏感性:模型在事件發生前預測準確性明顯優于事件發生后嘗試預測,驗證了未來預測任務的真實性和挑戰性。
  • 功能模塊貢獻:規劃與搜索能力顯著提升模型性能,體現了復合智能體設計的重要性。
  • 安全與效率:深度研究代理對虛假信息存在一定脆弱性,部分模型在信息檢索效率上仍有提升空間。

結論與展望

  1. 總結貢獻FutureX作為首個大規模、動態、無污染的未來預測評測基準,系統性地推動了LLM代理在復雜動態環境下的推理、搜索和決策能力的評估與提升。通過多領域、多模型、多事件類型的綜合測試,FutureX為智能體研究提供了堅實的實驗平臺和豐富的數據資源。
  2. 局限分析當前FutureX依賴于高質量網站的數據可訪問性和時效性,部分事件答案抽取仍需人工輔助優化,且深度研究代理對虛假信息的防御能力尚需加強。模型預測時間限制和事件多樣性仍存在進一步拓展空間。
  3. 未來展望
  • 增強抗干擾能力:提升模型對虛假信息和惡意事件的識別與防御能力。
  • 豐富事件類型與領域:引入更多實時數據源和復雜事件類型,提升評測的全面性和挑戰性。
  • 優化自動化流程:進一步提升答案抽取準確率和系統穩定性,實現完全無人值守的長期運行。
  • 促進模型協同:探索多智能體協作機制,提升復雜未來預測的整體性能。
  • 推動行業應用:基于FutureX評測結果,推動LLM代理在金融、政策分析等高風險領域的實際部署和應用。

FutureX的設計理念和實施成效為未來智能體的研究和應用奠定了堅實基礎,代表了AI發展“第二階段”中智能體能力評估和提升的重要里程碑。

MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers

2025-08-20|Salesforce AI Research|??17??http://arxiv.org/abs/2508.14704v1https://huggingface.co/papers/2508.14704https://mcp-universe.github.io??

研究背景與意義

本文聚焦于Model Context Protocol(MCP)這一新興的開放標準,它實現了大型語言模型(LLMs)與外部數據源及工具的無縫連接,填補了傳統語言模型在實際應用中因信息孤島導致的整合瓶頸。然而,現有的評測體系多為簡化版本,難以反映現實環境中如長時序推理、大規模未知工具使用等復雜挑戰。針對這一缺口,作者提出了MCP-Universe——首個涵蓋真實MCP服務器、多領域、多任務的綜合性評測基準,旨在系統評估LLM在現實復雜場景中的工具調用能力和推理水平。該工作不僅豐富了MCP生態的評測手段,也為推動LLM實用化提供了關鍵支撐。

研究方法與創新

MCP-Universe的核心創新在于其全方位、多維度的設計理念。首先,基于真實世界的11個MCP服務器,覆蓋地理導航、代碼庫管理、金融分析、3D設計、瀏覽器自動化和網絡搜索六大核心領域,任務設計貼合真實應用場景,具備豐富的操作復雜度和動態變化特征。其次,評測框架采用執行驅動的自動化評估機制,集成格式校驗、靜態內容匹配和動態實時數據驗證三種評估手段,克服了以往LLM自評估帶來的主觀偏差和時效性不足??蚣苓€支持多模型、多代理架構的靈活配置,確保評測的公正性和可擴展性。此外,作者提出了針對長上下文處理和未知工具適應的挑戰分析,并嘗試引入上下文摘要機制以緩解信息爆炸問題,展現了方法的前瞻性和實踐價值。

實驗設計與結果分析

實驗涵蓋包括OpenAI GPT-5、Anthropic Claude-4.0-Sonnet、xAI Grok-4等多款頂尖專有及開源模型,均采用ReAct代理框架進行任務執行。結果顯示,最高成功率為GPT-5的43.72%,其余模型表現普遍低于35%,尤其在地理導航和代碼庫管理領域表現尤為薄弱,反映出現實MCP環境對現有LLM能力的嚴峻考驗。評估細分為格式合規性、靜態內容準確性及動態實時響應三類,發現模型在格式遵循上表現較好(多數超過80%),而內容正確性尤其是動態任務中明顯不足,暴露出內容生成的核心瓶頸。長上下文的快速增長導致模型性能下降,摘要機制雖有一定效果,但仍未根本解決問題。整體實驗揭示了LLM在實際MCP應用中的多重限制,強調了跨領域適應性和工具熟悉度的迫切需求。

結論與展望

本文通過MCP-Universe基準系統地揭示了當前大型語言模型在真實MCP環境下的性能瓶頸和挑戰,包括長上下文處理能力不足、對新工具的適應性差異以及跨領域表現不均等關鍵問題。該基準不僅提供了一個真實、多樣且動態的評測平臺,也為未來LLM代理設計指明了方向。展望未來,研究可聚焦于提升模型的長期記憶與摘要能力、增強對未知工具接口的自適應學習、以及開發更高效的多模態交互策略。此外,開放的評測框架和UI支持將促進社區協作,加速MCP生態系統的創新與成熟,推動LLM從實驗室走向廣泛的實際應用。

本文轉載自???AI研究前瞻???,作者:胡耀淇

收藏
回復
舉報
回復
相關推薦
天堂8在线天堂资源bt| 国产富婆一区二区三区| 日本一级片免费| 国产视频一区二区在线播放| 亚洲午夜免费电影| 欧美日韩亚洲在线| 国产免费视频一区二区三区| 日韩午夜精品| 精品国产美女在线| 成人无码www在线看免费| 九七电影院97理论片久久tvb| 亚洲精品成a人| 欧美另类一区| www.桃色av嫩草.com| 久久午夜电影| 久久久久久久久久婷婷| www..com.cn蕾丝视频在线观看免费版| **日韩最新| 欧美性猛交xxxx免费看久久久| 自拍偷拍亚洲色图欧美| 欧美日本网站| 精品午夜一区二区三区在线观看| 日本欧美精品在线| 国产午夜激情视频| 中国成人一区| 色狠狠久久aa北条麻妃| 中文在线一区二区三区| 一区二区三区国产好| 欧美日韩一区精品| 50路60路老熟妇啪啪| 超碰在线99| 一区二区三区在线免费| 一区中文字幕在线观看| 九九在线视频| ww亚洲ww在线观看国产| 国产伦精品一区二区三区视频免费| 一区二区三区免费观看视频| 日韩精品福利网| 欧美诱惑福利视频| 日韩三级一区二区三区| 欧美特黄视频| 色综合久久88色综合天天看泰| 精品人体无码一区二区三区| 国产一区二区三区四区| 亚洲免费视频在线观看| av网页在线观看| 女同另类激情重口| 日韩电视剧免费观看网站| 久久久久国产免费| 永久免费精品视频| 精品成人免费观看| 中文字幕99页| 成人在线超碰| 亚洲国产高清福利视频| 国产一级免费片| 牛牛精品成人免费视频| 日韩精品视频三区| 中文字幕免费高清| 国产欧美日韩在线观看视频| 一夜七次郎国产精品亚洲| 日本二区在线观看| 日韩成人免费| 欧美成年人视频网站| 波多野结衣亚洲一区二区| 欧美激情91| 91精品国产九九九久久久亚洲| 中文字幕一区二区三区精品| 亚洲男女自偷自拍| 国产精品wwwwww| 91极品身材尤物theporn| 国产综合一区二区| 国产精品久久久久久久久久久久午夜片| 亚洲黄色小说网址| 91视视频在线观看入口直接观看www| 你懂的网址一区二区三区| 黑人与亚洲人色ⅹvideos| 国产精品久久久久天堂| 一级性生活视频| 国产伦子伦对白在线播放观看| 欧美日韩亚洲91| 黄色免费网址大全| 国产精品高清一区二区| 亚洲第一中文字幕| 免费网站在线高清观看| 欧美日韩第一区| 青草热久免费精品视频| 一区二区精品视频在线观看| www.日韩精品| 亚洲不卡1区| 日本美女高清在线观看免费| 亚洲国产另类av| 玩弄japan白嫩少妇hd| 国产成人免费视频网站视频社区 | 99视频在线免费| 4438五月综合| 日韩激情av在线播放| 成年人网站在线观看视频| 国内激情久久| 国产美女久久精品香蕉69| 特级丰满少妇一级aaaa爱毛片| 国产精品视频你懂的| 国产一区二区三区乱码| 国产麻豆一区| 亚洲精品视频二区| 久久老司机精品视频| 免费观看日韩av| 国内精品国语自产拍在线观看| 在线免费观看的av网站| 五月婷婷另类国产| 天堂中文av在线| 亚洲系列另类av| 欧美黑人国产人伦爽爽爽| 亚洲一卡二卡在线观看| 99精品偷自拍| 又大又硬又爽免费视频| 欧美三级电影网址| 亚洲精品一区在线观看香蕉| av成人免费网站| 久久人人97超碰国产公开结果| 国产精品美女黄网| 国内精品久久久久久野外| 色美美综合视频| 荫蒂被男人添免费视频| 欧美精品麻豆| 国产欧美久久久久久| 内衣办公室在线| 婷婷亚洲久悠悠色悠在线播放| 亚洲国产日韩在线一区| 日韩精品欧美| 国产精品男女猛烈高潮激情| 香蕉视频911| 午夜激情综合网| 一个人看的视频www| 91久久电影| 国产精品专区一| 成年人视频免费在线观看| 欧美丝袜美女中出在线| 88av在线播放| 亚洲精品美女91| 国产原创精品| а√天堂资源官网在线资源| 精品国产亚洲在线| www.色小姐com| 国产精品一区三区| 91精品国产毛片武则天| 国产色99精品9i| 欧美另类极品videosbest最新版本 | 国产精品一区二区三区久久| 国产一区二区三区福利| 91福利视频网站| 国产亚洲精品熟女国产成人| 久久精品国语| 日本不卡久久| avav成人| 久久精品福利视频| 精品国产18久久久久久| 亚洲免费在线观看| 99热超碰在线| 9色国产精品| 欧洲一区二区在线观看| 国产成人精品一区二三区在线观看 | 欧美日韩一区二区三区不卡| 国产一二三av| 国产一区二区在线看| 亚洲爆乳无码精品aaa片蜜桃| 一本色道69色精品综合久久| 91国内免费在线视频| 青青视频在线观| 欧美三级中文字幕在线观看| 日韩在线不卡av| 国产高清成人在线| 久久手机在线视频| 在线看成人短视频| 国产精品一二区| 宅男网站在线免费观看| 亚洲国产欧美精品| 日韩欧美国产另类| 亚洲欧美一区二区视频| 亚洲精品乱码久久久久久蜜桃欧美| 99精品国产在热久久婷婷| 日本成人看片网址| 白嫩亚洲一区二区三区| 91高清视频在线免费观看| 高清中文字幕一区二区三区| 91精品欧美久久久久久动漫| 日本网站在线免费观看| 国产亚洲欧美激情| 99精品视频免费版的特色功能| 国产精品vip| 美女黄毛**国产精品啪啪| 四虎精品永久免费| 韩剧1988在线观看免费完整版| 成人性生交大片免费看午夜| 日韩西西人体444www| 欧美国产成人精品一区二区三区| 中文无字幕一区二区三区| 国产免费a级片| 麻豆视频一区二区| 日韩国产欧美亚洲| 婷婷综合视频| 欧美主播一区二区三区美女 久久精品人 | 久久久久亚洲av无码a片| 国产精品亚洲第一区在线暖暖韩国| 色欲av无码一区二区人妻| 91成人免费| 欧美一二三区| 精品国产导航| 91亚洲午夜在线| 亚洲四虎影院| 国内偷自视频区视频综合 | 色狠狠久久av综合| 91老司机在线| julia一区二区三区中文字幕| 国产做受高潮69| 成人午夜在线影视| 中文字幕精品久久久久| 亚洲av成人精品毛片| 欧美变态tickle挠乳网站| 伊人精品在线视频| 色播五月激情综合网| 精品久久免费视频| 亚洲女厕所小便bbb| 中文字幕丰满乱子伦无码专区| 国产高清久久久| 免费成人黄色大片| 三级欧美在线一区| 欧美 日韩精品| 亚洲狼人精品一区二区三区| 日本中文字幕一级片| 国产韩日影视精品| 日韩一区不卡| 欧美精品尤物在线观看| 欧美激情国产日韩| 欧美日韩导航| 韩国成人av| 久久男人av| 国产精品视频一区二区三区经| 久久国际精品| 91热精品视频| 秋霞一区二区| 国产成人女人毛片视频在线| 伊人久久大香线蕉av超碰| 91免费在线观看网站| 激情久久免费视频| 亚洲一区二区三区视频播放| 国产视频网站一区二区三区| 亚洲精品免费av| 欧州一区二区三区| wwwxx欧美| 99re8这里有精品热视频免费 | 亚洲精品中文字幕乱码三区| 亚洲欧美小视频| 亚洲理论在线观看| 国产在线观看99| 午夜电影网亚洲视频| www亚洲视频| 色婷婷久久久综合中文字幕| 日本黄色一级视频| 在线观看视频91| 国产伦精品一区二区三区四区| 91精品欧美福利在线观看| 国产三级视频在线播放| 精品福利在线导航| 五月婷婷开心中文字幕| 亚洲欧美一区二区三区在线| 成av人电影在线观看| 操91在线视频| 搞黄网站在线看| 欧美专区第一页| 久久xxx视频| 91网站在线看| 日韩av系列| 亚洲午夜精品久久久久久浪潮| 亚州av乱码久久精品蜜桃| 免费人成自慰网站| 日韩极品在线观看| 黄色片免费网址| 91热门视频在线观看| 亚洲精品国产精品国自| 亚洲精品福利视频网站| 天天综合网入口| 欧美精选在线播放| 无码精品一区二区三区在线| 一本色道久久综合狠狠躁篇怎么玩| 国精产品一区| 91爱爱小视频k| 曰本一区二区| 久久综合给合久久狠狠色| 日韩精品一区二区久久| 日韩久久久久久久久久久久| 水蜜桃久久夜色精品一区的特点| 中文字幕永久有效| 99精品视频一区| 婷婷久久综合网| 福利一区福利二区微拍刺激| 91亚洲国产成人久久精品麻豆| 亚洲成**性毛茸茸| av黄色在线观看| 午夜精品久久久99热福利| 久久天堂影院| 蜜桃91精品入口| 欧美在线资源| 少妇激情一区二区三区| 成人免费毛片嘿嘿连载视频| 极品久久久久久久| 午夜不卡av免费| www.日韩在线观看| 色诱女教师一区二区三区| 两个人看的在线视频www| 成人黄色免费片| 欧美深夜视频| 无码人妻精品一区二区蜜桃网站| 免费高清在线一区| 国产精品300页| 一区二区三区免费在线观看| 在线观看一二三区| 亚洲欧洲激情在线| av日韩中文| 国产高清自拍一区| 综合久久十次| 午夜精品久久久久久久99热影院| 久久久久久久久伊人| 久草手机在线观看| 精品伦理精品一区| av大全在线| 91精品国产自产在线老师啪| 国产精品手机在线播放 | 午夜精品短视频| 久久激情婷婷| 国产毛片毛片毛片毛片毛片毛片| 亚洲伦理在线精品| 国内毛片毛片毛片毛片| 久热在线中文字幕色999舞| 日本精品久久| 伊人色综合影院| 激情综合亚洲精品| 女教师淫辱の教室蜜臀av软件| 91福利国产成人精品照片| 日韩美女一级视频| 91禁国产网站| 亚洲视频分类| 激情五月亚洲色图| 国产免费久久精品| 欧美日韩 一区二区三区| 伊人激情综合网| 成人在线高清| 在线视频亚洲自拍| 久久精品72免费观看| 中文字幕无码日韩专区免费| 91精品国产欧美日韩| а√天堂官网中文在线| 1卡2卡3卡精品视频| 午夜视频一区| 在线看黄色的网站| 精品美女国产在线| 欧美色18zzzzxxxxx| 国产精品人成电影| 久久精品影视| 国产亚洲精品成人a| 激情亚洲一区二区三区四区| 香蕉视频成人在线| 日本高清+成人网在线观看| 奇米色欧美一区二区三区| wwww.国产| 综合自拍亚洲综合图不卡区| 性中国古装videossex| 8x拔播拔播x8国产精品| 成人亚洲一区| 久久精品国产99久久99久久久| 亚洲第一搞黄网站| 日本一本草久在线中文| 国产乱肥老妇国产一区二| 在线国产一区二区| 亚洲av成人精品一区二区三区| 一本一道综合狠狠老| 欧美私人网站| 国产精品久久久久久久久久久久冷 | 亚洲欧美另类久久久精品| 亚洲成人777777| 日韩av免费在线观看| 99久久婷婷这里只有精品 | 久久免费视频这里只有精品| 国产精品美女久久久久久不卡 | 国产精品国产av| 国内外成人免费激情在线视频网站 | 国产高清视频一区| 日本高清不卡码| 久久精品国产成人| 色老板在线视频一区二区| 日本高清久久久| 欧美视频中文字幕在线| free性欧美hd另类精品| 欧美日韩一区二区三区在线视频 | 四季av中文字幕| 亚洲白虎美女被爆操| 日韩av黄色| 欧美国产激情视频| 亚洲欧美色图小说| 黄色片视频在线观看| www 成人av com|