精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

蘋果新研究:不微調、不重訓,如何讓AI提問效率暴增6.5倍?

人工智能 新聞
近日,蘋果與牛津大學和香港城市大學合作的一項新研究吸引了不少關注。其中提出了一種名為?BED-LLM?的新方法,能讓 AI 解決問題的能力直接提升 6.5 倍(成功率從 14% 暴增至 91%),而整個過程無需微調或重新訓練,直接在當前模型上運行即可。

在這場以大型語言模型(LLM)為核心的 AI 浪潮中,蘋果似乎一直保持著低調,很少出現在技術報道的前沿。盡管如此,時不時地,該公司也能拿出一些非常亮眼的研究成果,比如能在 iPhone 上直接運行的高效視覺語言模型 FastVLM

近日,蘋果與牛津大學和香港城市大學合作的一項新研究吸引了不少關注。其中提出了一種名為 BED-LLM 的新方法,能讓 AI 解決問題的能力直接提升 6.5 倍(成功率從 14% 暴增至 91%),而整個過程無需微調或重新訓練,直接在當前模型上運行即可。

而實現這一突破的關鍵,便是讓 AI 學會問出完美的問題。

那么,究竟該如何做到這一點呢?

  • 論文標題:BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design
  • 論文地址:https://arxiv.org/abs/2508.21184

這要從 LLM 的一個不足之處說起,即難以智能且自適應的方式主動從用戶或外部環境中獲取信息。這就像是 LLM 的「多輪遺忘癥」。

具體而言,雖然現代 LLM 通常能夠一次性生成連貫且富有洞察力的問題(或其他外部查詢),但它們通常難以根據先前在交互式任務中收集到的答案進行適當的調整。比如,已有研究證明,LLM 在多步猜謎游戲、任務澄清、IT 任務自動化以及迭代式外部工具使用等問題上表現不佳。

因此,提高 LLM 自適應地提出問題和有針對性地收集信息的能力是很有必要的。

簡單來說,LLM 僅僅基于其龐大的知識庫一次性生成好問題是不夠的。真正的智能體需要能根據用戶的實時反饋,動態調整策略,精準地提出下一個最有價值的問題 。

BED-LLM:讓提問成為一門科學

牛津、蘋果和香港城市大學的這個聯合團隊提出,可以使用序貫貝葉斯實驗設計(Bayesian experimental desig/BED)框架來解決這一問題。

該框架提供了一種基于模型的信息論機制,可用于在給定實驗的生成模型的情況下做出自適應設計決策。

具體而言,該團隊展示了如何將使用 LLM 進行交互式信息收集的問題表述為一個序貫實驗設計問題,其中有一個迭代過程:

  • 每次選擇要問的問題(query),都要盡量最大化預期信息增益(Expected Information Gain, EIG)。
  • 根據用戶的回答更新信念(belief)。
  • 再基于新的信念選擇下一步要問的問題。

這就像科學實驗:一步步設計實驗、收集數據、更新假設,而不是一次性問到底。

這里,構成序貫 BED 程序的底層生成模型源自 LLM,該團隊特別展示了該模型的構建方式,并為關鍵設計決策提供了廣泛的見解。

該團隊將這種方法命名為 BED-LLM,即 Bayesian Experimental Design with Large Language Models。

這種名為 BED-LLM 的方法之所以高效,源于其背后三重智慧的巧妙設計:

智慧一:追求真正的信息增益,而非表面上的不確定性

過去的方法常常讓 AI 選擇自己「感覺最不確定」的問題,但這并非最優解。BED-LLM 的核心是精確計算 EIG,確保問題能帶來最大價值。

論文中一個生動的例子可以說明這一點 :假設 AI 想了解你的電影偏好,它有兩個問題可選:

  • 問題 A:「你最喜歡什么口味的冰淇淋?」
  • 問題 B:「你最喜歡哪種電影類型?」

對于問題 A,AI 可能完全猜不到答案(即預測熵很高),但這個答案對于了解你的電影品味毫無幫助(EIG 為 0) 。而問題 B 的答案雖然也不確定,但無論你回答「科幻」還是「喜劇」,都能極大地幫助 AI 縮小猜測范圍,因此它的 EIG 非常高 。BED-LLM 正是基于這種原則來選擇問題的。

智慧二:強制邏輯自洽,糾正 LLM 的遺忘癥

研究發現,即便是 GPT-4o 這樣頂尖的模型,在多輪對話中也常常會忘記之前的約束,提出與歷史回答相矛盾的假設 。

BED-LLM 引入了先采樣后過濾 (sample-then-filter) 策略來解決這個問題。

它首先讓 LLM 生成一批可能的答案(例如,在猜名人游戲中生成多個候選人),然后用一個「邏輯過濾器」逐一檢查這些答案是否與用戶之前的所有回答都兼容,將不符合邏輯的選項直接剔除。這確保了 AI 的每一步推理都建立在已知的事實之上。

智慧三:生成問題有的放矢,而非天馬行空

在生成候選問題時,BED-LLM 采用了一種更具針對性的條件生成 (Conditional generation) 策略 。它會先參考當前已經過篩選、邏輯自洽的假設池,然后讓 LLM 提出能夠最高效「切分」這些假設的問題 。這使得提問從一開始就目標明確,直指核心。

結果如何?

為了驗證 BED-LLM 的效果,研究團隊將其與兩種主流基準進行了對比:

  • Naive QA:完全依賴 LLM 的「直覺」來提問。
  • Entropy:采用簡化的 EIG 版本,即只考慮預測不確定性的方法 。

結果顯示,無論是在「20 個問題」猜謎游戲還是電影偏好推薦任務中,BED-LLM 的表現都全面超越了基準方法 。

具體而言,該團隊首先發現,BED-LLM 在各種 LLM 和目標數量下,顯著提升了 20 個問題問題的成功率。例如,在使用 Mistral-Large 預測名人時,該團隊觀察到成功率從 14% 提升至 91%。

其次,該團隊展示了 LLM 在電影推薦方面取得的顯著改進,表明即使 LLM 的預測模型與回答者的預測模型不同,這些優勢依然有效。

更具現實意義的是,研究團隊還進行了一項「模型跨服聊天」的壓力測試:讓提問的 AI 和回答的 AI 使用完全不同的模型(例如,提問方是 Qwen,回答方是 GPT-4o-mini)。

這種設置更貼近真實世界,因為用戶的思維模型與 AI 本就不同。即便在這種「模型失配」的情況下,BED-LLM 的性能優勢依然穩固,展現了其強大的穩健性。

總而言之,這項研究為我們展示了如何通過嚴謹的數學框架,將 LLM 從一個被動的知識問答庫,轉變為一個主動、高效、且具備邏輯推理能力的信息收集者。這或許預示著,未來的 AI 交互將不再是簡單的一問一答,而是真正意義上的「智慧對話」。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2020-04-26 11:07:41

新冠疫情網絡攻擊惡意軟件

2021-03-04 09:25:08

Go語言惡意軟件黑客

2022-11-25 09:42:53

AI技術

2012-02-08 14:49:09

AMD Fusion AMD

2025-02-24 08:24:39

2024-10-21 10:20:00

訓練模型

2024-03-01 15:18:24

2021-07-07 05:03:35

Debugger技巧Nodejs

2025-11-10 04:15:00

2022-07-15 09:25:01

AI制藥

2025-06-16 08:00:00

2025-03-03 10:04:49

2022-06-07 22:16:49

iPadOS蘋果iPad

2025-04-18 00:10:00

AI人工智能安全漏洞

2023-05-26 00:06:05

2024-01-08 12:47:02

代碼模型Mistral

2025-03-20 14:18:57

AI算法模型

2025-10-17 08:00:00

2025-09-26 09:34:35

AI模型機器學習

2025-06-20 09:06:00

AI模型訓練
點贊
收藏

51CTO技術棧公眾號

免费在线亚洲| 亚洲天堂一区二区| 国产成人8x视频一区二区| 欧美成人激情视频| 黄页网站在线看| 日本在线视频网址| 懂色av一区二区三区免费观看 | 黄色aaa视频| 狠狠久久伊人中文字幕| 亚洲一区二区av电影| 精品无码久久久久久久动漫| 蜜臀精品一区二区三区| 欧美激情另类| 亚洲精品一区二区精华| 中文字幕永久视频| 久草在线新免费首页资源站| 国产女人18毛片水真多成人如厕 | xxx欧美精品| 艳妇乳肉亭妇荡乳av| 国产黄色一区| 图片区小说区国产精品视频| 亚洲成人第一| 国产 日韩 欧美 精品| 免费观看30秒视频久久| 亚州精品天堂中文字幕| 开心激情五月网| 图片婷婷一区| 日韩精品在线一区二区| 色悠悠久久综合网| 中文字幕色婷婷在线视频| 亚洲美女视频一区| 亚洲欧美日韩不卡一区二区三区| 日韩有码第一页| 韩日av一区二区| 国产高清视频一区三区| 久久综合久久鬼| 偷拍欧美精品| 色老头一区二区三区| 成人免费看aa片| 精品无人区一区二区| 欧美一激情一区二区三区| 亚洲综合色在线观看| 韩日成人影院| 好吊成人免视频| 欧美美女黄色网| 黄色成人在线观看| 国产精品久久久久久久浪潮网站| 日本一区二区三区视频免费看| 色综合视频在线| 国产成人h网站| 91九色蝌蚪成人| 国产色综合视频| 久草这里只有精品视频| 国产有码一区二区| 一区二区三区免费在线| 日本午夜一区二区| 国产精品美乳一区二区免费| 国产成人麻豆免费观看| 三级欧美韩日大片在线看| 久久久久一本一区二区青青蜜月| 日日骚一区二区三区| 中文字幕av亚洲精品一部二部| 色婷婷av一区二区三区久久| 午夜黄色福利视频| 欧洲乱码伦视频免费| 亚洲午夜av电影| 91成人精品一区二区| 成人黄色小视频| 视频在线观看一区二区| 韩国一级黄色录像| 欧美激情自拍| 午夜欧美不卡精品aaaaa| 日韩欧美国产亚洲| 麻豆九一精品爱看视频在线观看免费| 欧美亚洲视频在线看网址| 欧美a视频在线观看| 可以看av的网站久久看| 国产精品欧美日韩| 91久久久久国产一区二区| 国内精品久久久久影院一蜜桃| 亚洲qvod图片区电影| 亚洲老妇色熟女老太| proumb性欧美在线观看| 日本成人三级电影网站| 日本激情视频在线观看| 亚洲综合色视频| 国产精品宾馆在线精品酒店| 欧美aaa大片视频一二区| 欧美精品一卡两卡| 人妻精油按摩bd高清中文字幕| 欧美人妖视频| 永久免费看mv网站入口亚洲| 精品国产视频一区二区三区| 影院欧美亚洲| 国产精品成人一区二区三区吃奶| 国产又色又爽又黄又免费| 懂色av一区二区在线播放| 欧美日韩综合另类| a免费在线观看| 日韩欧美国产视频| 色综合五月婷婷| 窝窝社区一区二区| 久久久av免费| 国产精品视频123| 久久99蜜桃精品| 精品一区日韩成人| 麻豆视频在线观看免费| 欧美日韩激情网| 国产成人在线综合| 亚洲日本三级| 欧美激情a在线| 特级西西444www高清大视频| 懂色av一区二区三区免费看| 亚洲一区二区三区免费看| 大桥未久在线视频| 91精品国产91久久久久久一区二区| 久久人人妻人人人人妻性色av| 欧美国产偷国产精品三区| 88xx成人精品| 亚洲精品视频专区| 中文字幕一区日韩精品欧美| 一本大道熟女人妻中文字幕在线 | 视频三区在线| 粉嫩老牛aⅴ一区二区三区| 一级网站在线观看| 日本在线电影一区二区三区| 91国在线精品国内播放| 午夜精品久久久久久久91蜜桃| 中文av字幕一区| 日韩中文字幕三区| 豆花视频一区二区| 欧美大尺度激情区在线播放| 亚洲专区第一页| 国产亚洲1区2区3区| 欧美二区在线视频| 爱爱精品视频| 欧美高清自拍一区| 国产人妻精品一区二区三| 中文无字幕一区二区三区| 黄色国产精品视频| 日韩母乳在线| 97在线视频免费| 国精产品一品二品国精品69xx | 亚洲性夜色噜噜噜7777| 影音先锋亚洲天堂| 北岛玲一区二区三区四区| 国产在线无码精品| 精品国产一区二| 久久影院资源网| 国产老女人乱淫免费| 中文字幕日韩av资源站| 三级性生活视频| 国产精品88久久久久久| 成人黄色片在线| 麻豆电影在线播放| 91精品国产欧美一区二区| 男人av资源站| 国产尤物一区二区在线| 青青草综合视频| 日韩一区二区三区在线看| 九九热r在线视频精品| 亚洲第一天堂在线观看| 亚洲大片在线观看| av无码av天天av天天爽| 久久激情久久| 亚洲高清在线观看一区| 色999久久久精品人人澡69 | 久久精品国产精品国产精品污 | 一二三不卡视频| 久久婷婷激情| 日本一区二区在线视频| 福利精品在线| 久久99视频精品| 天堂中文网在线| 一本大道久久a久久综合婷婷| 日本精品在线观看视频| 激情文学综合插| 欧洲精品在线播放| 亚洲人成精品久久久| 国产精品一区电影| 新版中文在线官网| 精品亚洲一区二区三区在线播放 | 欧美一区二区三区精品| 久久久久噜噜噜亚洲熟女综合| 成人午夜精品一区二区三区| 欧美一级在线看| 日韩免费视频| 国产精品区二区三区日本| 久久青青视频| xvideos亚洲| 四虎影院在线域名免费观看| 在线看一区二区| 欧美三根一起进三p| 91丨porny丨国产入口| 爆乳熟妇一区二区三区霸乳| 欧美一区91| 免费av在线一区二区| 欧美爱爱视频| 97在线看福利| 黄色在线播放网站| 精品亚洲国产成av人片传媒 | 欧美日韩精品一区| 久久久国产精品入口麻豆| 91大神福利视频在线| 毛片在线不卡| 亚洲嫩模很污视频| 性一交一乱一乱一视频| 在线免费观看日本一区| 日产精品久久久久久久| 国产精品久久久久久久久久免费看 | 8v天堂国产在线一区二区| 制服.丝袜.亚洲.中文.综合懂色| 中文字幕一区二区三区四区| 无码人妻aⅴ一区二区三区| 国产资源在线一区| 中文字幕欧美人妻精品一区| 亚洲二区在线| 免费成人进口网站| 激情五月色综合国产精品| 国产精品久久久久久久久久直播 | 欧美aaa级片| 不卡的av在线| 免费观看黄网站| 美女脱光内衣内裤视频久久网站 | 九色|91porny| 久久国产乱子伦免费精品| 国产精品草草| 国产三级中文字幕| 色综合久久一区二区三区| 欧美精品七区| 欧美激情99| 国产精品国产三级欧美二区 | 国产丝袜精品丝袜| 久久躁日日躁aaaaxxxx| 在线免费黄色| 这里只有精品在线播放| 精品久久av| 亚洲欧美成人网| 色偷偷在线观看| 亚洲白拍色综合图区| 亚洲欧美另类日韩| 日韩欧美在线影院| 国产高清视频免费| 日韩亚洲欧美一区二区三区| 国产三级小视频| 日韩亚洲欧美中文三级| 成 人 免费 黄 色| 日韩美女视频一区二区在线观看| 国产青青草视频| 日韩欧美中文字幕制服| 丰满少妇高潮在线观看| 欧美刺激脚交jootjob| www.桃色av嫩草.com| 日韩免费高清视频| 色哟哟国产精品色哟哟| 国产丝袜精品第一页| 青草久久伊人| 在线播放国产精品| 欧美被日视频| 九九九久久国产免费| 91九色美女在线视频| 91sa在线看| 中文字幕在线看片| 国产福利视频一区二区| 久久国产三级| 18成人在线| 老牛精品亚洲成av人片| 蜜桃久久影院| 久久国产精品亚洲人一区二区三区 | 亚洲男人天堂久久| 日韩精品丝袜在线| 青青久在线视频免费观看| 伊人青青综合网站| 麻豆传媒在线免费看| 欧美激情视频免费观看| 欧美gv在线| 国产精品海角社区在线观看| 四虎影视国产精品| 电影午夜精品一区二区三区| 日韩成人av在线资源| 日本高清久久一区二区三区| 国产国产精品| 少妇人妻在线视频| 青青草91视频| 91人人澡人人爽| 久久日一线二线三线suv| 91免费在线看片| 亚洲第一精品在线| 成人一二三四区| 日韩你懂的在线观看| 国产黄在线观看| 久久99热这里只有精品国产| 亚洲欧美在线成人| av噜噜色噜噜久久| 欧美精品色图| 成人黄色大片网站| 免费av网站大全久久| av电影在线播放| 国产精品三级久久久久三级| 久久视频免费在线观看| 欧美日本一区二区| 亚洲av成人精品日韩在线播放| 日韩中文av在线| 午夜久久中文| 成人羞羞视频免费| 欧美一区电影| 日本a在线免费观看| 久草精品在线观看| 久久国产精品影院| 亚洲综合男人的天堂| 亚洲一区二区色| 日韩精品欧美国产精品忘忧草| 菠萝菠萝蜜在线观看| 国产xxx69麻豆国语对白| 91成人噜噜噜在线播放| 亚洲午夜激情| 久久高清国产| 丰满少妇xbxb毛片日本| 亚洲欧洲国产日韩| 樱花视频在线免费观看| 亚洲国产精品网站| 新版中文在线官网| 成人自拍性视频| 欧美色图国产精品| 日韩av在线综合| 不卡的电视剧免费网站有什么| 国语对白在线播放| 欧美三级一区二区| 国产三级在线| 欧美在线观看日本一区| 国产日韩三级| 亚洲中文字幕无码一区二区三区| 蓝色福利精品导航| 国产精品理论在线| 91久久香蕉国产日韩欧美9色| 神宫寺奈绪一区二区三区| 九九精品视频在线观看| 欧美精品影院| 女同性恋一区二区| 激情欧美一区二区| 国产精品69久久久久孕妇欧美| 91久久精品一区二区| 欧美捆绑视频| 国产999精品久久久影片官网| 同性恋视频一区| 免费午夜视频在线观看| 久久影音资源网| 日韩欧美成人一区二区三区| 日韩av在线不卡| 欧美极品videos大乳护士| 精品免费日产一区一区三区免费| aⅴ色国产欧美| 中国av免费看| 欧美性猛交xxxx免费看| 男女网站在线观看| 国产成人激情小视频| 成人一级毛片| 中文字幕视频三区| 亚洲人成人一区二区在线观看| 国产乱码精品一区二区三区精东 | 激情aⅴ欧美一区二区欲海潮| 国产乱码精品一区二区三区日韩精品 | 视频欧美精品| 一区二区日本| 国产精品亚洲专一区二区三区| 九九热国产在线| 亚洲精品在线观看网站| 天堂√中文最新版在线| 日韩高清dvd| 极品销魂美女一区二区三区| 国产免费无码一区二区视频| 欧美mv日韩mv国产| 久久青草伊人| 色女孩综合网| 国产乱码精品1区2区3区| 久视频在线观看| 亚洲免费av网址| 四虎国产精品免费久久| 国产1区2区3区中文字幕| 91亚洲精品一区二区乱码| 香蕉影院在线观看| 日韩在线视频中文字幕| 中文字幕一区二区三区日韩精品| 欧美爱爱视频免费看| 中文字幕精品一区二区精品绿巨人 | 美女洗澡无遮挡| 欧美日韩国产高清一区二区三区| 日皮视频在线观看| 日本公妇乱淫免费视频一区三区| 精品一区二区三区不卡 | 91精品久久久久久蜜桃| 国产精品婷婷| 国产性生活大片| 日韩精品中文字幕久久臀| 成人不卡视频| 日韩一级性生活片| 国产精品久久久一本精品| 日本高清视频www| 成人黄色大片在线免费观看| 9色精品在线|