精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepMind讓大模型學(xué)會(huì)歸納和演繹,GPT-4準(zhǔn)確率提升13.7%

人工智能 機(jī)器學(xué)習(xí)
現(xiàn)在,來自谷歌、Mila 研究所等研究機(jī)構(gòu)的研究者聯(lián)合探索了一種新方法 —— 讓 LLM 學(xué)習(xí)推理規(guī)則,并提出一種名為假設(shè)到理論(Hypotheses-to-Theories,HtT)的新框架。

當(dāng)前,大型語言模型(LLM)在推理任務(wù)上表現(xiàn)出令人驚艷的能力,特別是在給出一些樣例和中間步驟時(shí)。然而,prompt 方法往往依賴于 LLM 中的隱性知識(shí),當(dāng)隱性知識(shí)存在錯(cuò)誤或者與任務(wù)不一致時(shí),LLM 就會(huì)給出錯(cuò)誤的回答。

現(xiàn)在,來自谷歌、Mila 研究所等研究機(jī)構(gòu)的研究者聯(lián)合探索了一種新方法 —— 讓 LLM 學(xué)習(xí)推理規(guī)則,并提出一種名為假設(shè)到理論(Hypotheses-to-Theories,HtT)的新框架。這種新方法不僅改進(jìn)了多步推理,還具有可解釋、可遷移等優(yōu)勢。

論文地址:https://arxiv.org/abs/2310.07064

對(duì)數(shù)值推理和關(guān)系推理問題的實(shí)驗(yàn)表明,HtT 改進(jìn)了現(xiàn)有的 prompt 方法,準(zhǔn)確率提升了 11-27%。學(xué)到的規(guī)則也可以遷移到不同的模型或同一問題的不同形式。

方法簡介

總的來說,HtT 框架包含兩個(gè)階段 —— 歸納階段和演繹階段,類似于傳統(tǒng)機(jī)器學(xué)習(xí)中的訓(xùn)練和測試。

在歸納階段,LLM 首先被要求生成并驗(yàn)證一組訓(xùn)練樣例的規(guī)則。該研究使用 CoT 來聲明規(guī)則并推導(dǎo)答案,判斷規(guī)則的出現(xiàn)頻率和準(zhǔn)確性,收集經(jīng)常出現(xiàn)并導(dǎo)致正確答案的規(guī)則來形成規(guī)則庫。

有了良好的規(guī)則庫,下一步該研究如何應(yīng)用這些規(guī)則來解決問題。為此,在演繹階段,該研究在 prompt 中添加規(guī)則庫,并要求 LLM 從規(guī)則庫中檢索規(guī)則來進(jìn)行演繹,將隱式推理轉(zhuǎn)換為顯式推理。

然而,該研究發(fā)現(xiàn),即使是非常強(qiáng)大的 LLM(例如 GPT-4)也很難在每一步都檢索到正確的規(guī)則。為此,該研究開發(fā)了 XML tagging trick,來增強(qiáng) LLM 的上下文檢索能力。

實(shí)驗(yàn)結(jié)果

為了評(píng)估 HtT,該研究針對(duì)兩個(gè)多步驟推理問題進(jìn)行了基準(zhǔn)測試。實(shí)驗(yàn)結(jié)果表明,HtT 改進(jìn)了少樣本 prompt 方法。作者還進(jìn)行了廣泛的消融研究,以提供對(duì) HtT 更全面的了解。

他們?cè)跀?shù)值推理和關(guān)系推理問題上評(píng)估新方法。在數(shù)值推理中,他們觀察到 GPT-4 的準(zhǔn)確率提高了 21.0%。在關(guān)系推理中,GPT-4 的準(zhǔn)確性提高了 13.7%,GPT-3.5 則獲益更多,性能提高了一倍。性能增益主要來自于規(guī)則幻覺的減少。

具體來說,下表 1 顯示了在算術(shù)的 base-16、base-11 和 base-9 數(shù)據(jù)集上的結(jié)果。在所有 base 系統(tǒng)中,0-shot CoT 在兩個(gè) LLM 中的性能都最差。

表 2 呈現(xiàn)了在 CLUTRR 上比較不同方法的結(jié)果。可以觀察到,在 GPT3.5 和 GPT4 中,0-shot CoT 的性能最差。對(duì)于 few-shot 提示方法,CoT 和 LtM 的性能相似。在平均準(zhǔn)確率方面,HtT 始終比兩種模型的提示方法高出 11.1-27.2%。值得注意的是,GPT3.5 在檢索 CLUTRR 規(guī)則方面并不差,而且比 GPT4 從 HtT 中獲益更多,這可能是因?yàn)?CLUTRR 中的規(guī)則比算術(shù)中的規(guī)則少。

值得一提的是,使用 GPT4 的規(guī)則,GPT3.5 上的 CoT 性能提高了 27.2%,是 CoT 性能的兩倍多,接近 GPT4 上的 CoT 性能。因此,作者認(rèn)為 HtT 可以作為從強(qiáng) LLM 到弱 LLM 的一種新的知識(shí)蒸餾形式。

表 3 顯示,HtT 顯著提高了 GPT-4(文本版)的性能。對(duì)于 GPT3.5 來說,這種改進(jìn)并不顯著,因?yàn)樵谔幚砦谋据斎霑r(shí),它經(jīng)常產(chǎn)生除規(guī)則幻覺以外的錯(cuò)誤。

責(zé)任編輯:趙寧寧 來源: 機(jī)器之心
相關(guān)推薦

2023-10-14 13:09:53

谷歌模型

2023-09-19 14:56:00

模型訓(xùn)練

2024-08-02 13:14:51

2025-05-26 08:33:00

2023-11-20 21:56:04

AI推理

2024-01-03 13:37:00

模型數(shù)據(jù)

2023-09-19 09:20:16

2025-01-21 08:00:00

2023-12-04 13:51:00

模型數(shù)據(jù)

2023-09-03 12:56:43

2024-02-26 00:50:00

數(shù)據(jù)AI

2025-05-06 15:32:23

模型AI測試

2024-01-29 12:49:00

AI模型

2023-11-15 09:23:00

模型AI

2023-11-03 13:07:00

AI模型

2024-03-08 13:18:44

模型訓(xùn)練

2023-10-26 08:40:15

模型隱私推理

2024-12-06 14:19:50

2024-11-18 09:50:00

模型訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

成人香蕉视频| 成人午夜一级二级三级| 欧美少妇一区| 神马久久精品综合| 精品欧美不卡一区二区在线观看 | 国产精品99| 成人一级视频在线观看| 中文字幕日韩综合av| 黄色片网址在线观看| 国产精品无码AV| 欧美变态挠脚心| 一区二区三区视频在线观看| 5278欧美一区二区三区| 国产成人精品综合久久久久99 | 狠狠色综合播放一区二区| 亚洲欧美国产精品va在线观看| 国产一二三区在线播放| 91av国产精品| 日韩大片在线| 在线视频一区二区三区| 韩日午夜在线资源一区二区| 久久久久久福利| 日本免费精品| 一区二区三区欧美视频| 久久综合一区二区三区| 日韩欧美中文字幕一区二区| 777久久精品| 亚洲欧美一区二区三区孕妇| 成人激情视频在线播放| 影音先锋在线国产| 国产精品三级| 91国在线观看| 日韩精品久久久| 精品成人无码久久久久久| 少妇精品久久久| 日本大香伊一区二区三区| 青草全福视在线| 99国产精品久久久久久久成人| 91精品观看| 51久久夜色精品国产麻豆| 在线免费观看成人网| 亚洲午夜激情视频| 一区二区三区毛片免费| 日韩视频永久免费| 亚洲人成无码网站久久99热国产| 五月天婷婷在线播放| 性欧美精品高清| 国产一区二区三区久久精品 | 日韩限制级电影在线观看| 欧美精品aaaa| 免费日本一区二区三区视频| 国产一区二区精品在线观看| 久久久久久久影院| 欧美老熟妇乱大交xxxxx| 黄色精品视频| 亚洲女人的天堂| 国产高清精品一区| 黄色污污网站在线观看| 久久不射网站| 久久精品国产欧美亚洲人人爽| 国产毛片久久久久久| hd国产人妖ts另类视频| 久久丝袜美腿综合| 成人精品视频久久久久| 一二三区中文字幕| 麻豆91在线播放| 欧美激情一区二区三区在线视频观看| 永久免费看片视频教学| 在线中文一区| 欧美国产日韩二区| 久久久久亚洲av无码a片| 99久久久国产| 欧美午夜激情在线| 日韩少妇中文字幕| av在线三区| av亚洲精华国产精华| 国产美女久久久| 日韩男人的天堂| 99精品国产99久久久久久福利| 在线亚洲午夜片av大片| 九一在线免费观看| 欧美激情影院| 亚洲美女在线看| 最近中文字幕在线mv视频在线| 日韩最新av| 亚洲国产精久久久久久| 青青在线免费观看视频| 草莓视频丝瓜在线观看丝瓜18| 欧美激情一二三区| 国产亚洲自拍偷拍| 国产色视频在线| 国产精品中文有码| 国产精品久久久久久久av大片| 久久久一二三区| 久久国产精品毛片| 国产日韩中文字幕| 国产精品51麻豆cm传媒| 国产精品综合色区在线观看| 欧美日韩爱爱视频| 一区视频免费观看| 98精品视频| 亚洲网址你懂得| www.99re6| 日韩成人三级| 久久久久国产视频| 国产成人a v| 天堂一区二区在线| 2020久久国产精品| 91在线你懂的| 91免费国产在线观看| 国产亚洲欧美一区二区| 1pondo在线播放免费| 亚洲国产高清在线| 日日夜夜精品网站| 韩国三级av在线免费观看| 亚洲婷婷在线视频| 国产成人久久777777| 国产日韩电影| 日韩欧美一区在线| 亚洲色偷偷色噜噜狠狠99网| 亚洲精品在线播放| 中文字幕精品久久久久| 国产精品黄色网| 国产精品自拍av| 亚洲精品一卡二卡三卡四卡| 日本在线视频观看| 亚洲欧洲日产国产综合网| 亚洲精品免费在线看| 忘忧草在线日韩www影院| 欧美日韩在线第一页| www黄色日本| 日韩免费电影| 欧洲人成人精品| 婷婷五月精品中文字幕| 亚洲欧洲日韩| 国产精品久久久久9999| 日本福利片高清在线观看| 久久精品亚洲一区二区三区浴池| 日韩一区国产在线观看| 免费v片在线观看| 91久久精品一区二区二区| 亚洲一二三四五| 欧洲精品一区| 久久久久国产精品免费网站| 国产后入清纯学生妹| 成人av资源站| 人偷久久久久久久偷女厕| av电影在线观看网址| 色综合久久久久久久久| 亚洲欧美国产中文| 成人影院中文字幕| 精品无人区太爽高潮在线播放 | 亚洲资源在线播放| 国产日韩欧美精品一区| 中文字幕一区二区三区四区五区人 | 97蜜桃久久| 欧美精品一区二区三区蜜桃| v8888av| 国产精品99一区二区三| 久久久久久成人| 亚洲第一页视频| 久久精品日产第一区二区三区高清版 | 在线免费观看av网| 五月天久久久| 91精品国产91久久久久青草| 无码精品视频一区二区三区| 亚洲6080在线| 手机在线成人免费视频| 91亚洲无吗| 久久久久久69| 天堂在线中文字幕| 亚洲欧美一区二区三区久本道91 | 免费在线观看黄网站| 99精品国产91久久久久久| 一区二区在线不卡| 粉嫩一区二区三区在线观看| 亚洲欧洲激情在线| 久久精品一区二区三| 青青草伊人久久| 国模一区二区三区私拍视频| 欧美激情20| 在线日韩中文字幕| 亚洲日本视频在线观看| 久久精品视频免费| 欧美又黄又嫩大片a级| 亚洲第一网站| 亚洲精品免费在线视频| 国产福利在线观看| 午夜视频在线观看一区二区| 一本色道久久综合亚洲精品图片 | 中文字幕一区久久| 中国av一区| 97国产真实伦对白精彩视频8| 国产精品久久久久久久久久久久久久久久 | 欧美欧美欧美欧美| 国产男女猛烈无遮挡a片漫画| 久久亚洲综合| 在线观看三级网站| 亚洲一区导航| 97香蕉超级碰碰久久免费软件| www黄在线观看| 精品国产91洋老外米糕| 最新国产中文字幕| 亚洲国产成人高清精品| 欧美69精品久久久久久不卡 | 一色屋精品亚洲香蕉网站| 日批免费观看视频| 另类综合日韩欧美亚洲| 男女啪啪免费视频网站| 日韩av有码| 久久精品日产第一区二区三区精品版 | 蜜桃成人精品| 亚洲精品中文字幕有码专区| 国产精品久久久久久久久久久久久久久久 | 高潮在线视频| 精品福利一区二区三区| 波多野结衣视频在线看| 亚洲国产精品久久久久秋霞影院 | 天天综合网天天综合| 亚洲图片一区二区| 成人做爰69片免费| 亚洲网址在线| av一区二区在线看| 菠萝蜜视频在线观看www入口| 国产亚洲成精品久久| 少妇高潮久久久| 欧美一区二区视频在线观看2022| 国产精品视频一区二区三 | 欧美在线观看视频在线| www.av天天| 99久久99久久精品国产片果冻| 在线免费观看av网| 男女男精品网站| 三年中国中文在线观看免费播放| 久久99久久人婷婷精品综合| 精品免费视频123区| 91成人福利| 91精品黄色| 成人av在线播放| 国产一区在线播放| 成人在线免费av| 国产成人短视频| 精精国产xxxx视频在线| 日韩你懂的在线观看| 一级黄色短视频| 欧美三级电影网站| 麻豆一区产品精品蜜桃的特点| 一色屋精品亚洲香蕉网站| 五月天婷婷丁香网| 中文乱码免费一区二区 | 国产精品国产自产拍高清av王其| 午夜一区二区视频| 美女视频第一区二区三区免费观看网站 | 日本三级在线播放完整版| 国产一区二区久久精品| av一本在线| 日韩小视频在线观看| 亚洲乱码在线观看| 一级精品视频在线观看宜春院 | 日韩视频一区二区三区四区| 成人免费在线视频网站| 国产精一区二区| 91久久爱成人| 国产精品天天看天天狠| 日韩av日韩在线观看| 中文字幕有码在线观看| 国产婷婷色综合av蜜臀av| 欧美zozo| 精品久久国产老人久久综合| 国产亚洲久一区二区| 欧美色偷偷大香| 国产精品嫩草影院精东| 日韩欧美亚洲另类制服综合在线 | 亚洲欧美一区二区三区| 热久久免费国产视频| 超碰个人在线| 国产一区二区三区在线| 最近高清中文在线字幕在线观看| 精品国产欧美一区二区三区成人| 国产网友自拍视频导航网站在线观看| 久久综合久久八八| 黄色毛片在线观看| 最近2019年手机中文字幕| 天堂资源最新在线| 中文字幕国产亚洲| 国内高清免费在线视频| 欧美专区福利在线| 免费视频成人| 18久久久久久| 久久一卡二卡| 欧美另类交人妖| 免费v片在线观看| 国产精品人人做人人爽| 亚洲日本天堂| 国产一区二区在线免费视频| 精品欧美午夜寂寞影院| 97netav| 国产a久久精品一区二区三区 | 欧美激情一区| 亚洲精品日韩在线观看| 欧美视频亚洲视频| 亚洲成色www.777999| 高清成人免费视频| 日韩av福利在线观看| 激情综合色丁香一区二区| 国产污在线观看| 国产精品私房写真福利视频| 国产一级免费av| 亚洲综合区在线| 毛片在线免费播放| 亚洲国产天堂网精品网站| 动漫av一区二区三区| 亚洲人成毛片在线播放| 青青草原av在线| 国产在线精品自拍| 在线成人动漫av| 欧美亚洲黄色片| 亚洲视频福利| 手机免费av片| 国产一区在线观看麻豆| 尤物视频最新网址| 亚洲成va人在线观看| 国产欧美一区二区三区视频在线观看| 亚洲免费精彩视频| 91破解版在线观看| 97se国产在线视频| 中文在线播放一区二区| 无限资源日本好片| 久久这里只精品最新地址| 精品无码m3u8在线观看| 欧美一区二区日韩| 日韩黄色影院| 国产成人在线播放| 一区二区美女| koreanbj精品视频一区| 福利电影一区二区| 校园春色 亚洲| 午夜视频在线观看一区二区| www.午夜激情| 日韩高清免费在线| 成人免费在线电影| 奇门遁甲1982国语版免费观看高清| av成人男女| www.日本在线视频| 国产91丝袜在线播放九色| 国模无码国产精品视频| 欧美一区二区三区精品| 黄色在线视频网站| 91精品视频免费| 国产精品一线| 无码人妻少妇伦在线电影| 国产精品69毛片高清亚洲| 国产又粗又猛又色| 国产精品免费av| 久久精品欧美一区二区| 欧美一级久久久| 新版中文在线官网| 日产精品99久久久久久| 日韩精品免费一区二区三区竹菊| 亚洲欧洲国产精品久久| 青青草精品视频| 国产午夜精品福利视频| 亚洲一区二区在线免费看| 国产xxxx孕妇| 久久久久久亚洲精品不卡| 国产一区丝袜| 亚洲精品无码久久久久久| 国精品**一区二区三区在线蜜桃| 日韩激情小视频| 日韩欧美极品在线观看| 日本韩国一区| 国产精品久久久久久网站| 99热在线成人| 苍井空张开腿实干12次| 亚洲成在人线在线播放| 秋霞av在线| 国产欧美精品一区二区| 欧美另类视频| 极品白嫩丰满美女无套| 亚洲欧美色一区| 三级网站免费观看| 国产国语刺激对白av不卡| 婷婷综合亚洲| 性色av蜜臀av浪潮av老女人| 综合激情成人伊人| 亚洲AV午夜精品| 日韩av大片在线| 亚洲澳门在线| xxxx黄色片| 欧美日韩午夜在线| 国产精品偷拍| 婷婷精品国产一区二区三区日韩| 国产伦精品一区二区三区免费迷 | 欧美性大战久久久久久久蜜臀 | www.色婷婷.com| 欧美在线一级视频| 一本到12不卡视频在线dvd| 丰满少妇在线观看资源站| 欧美精品日韩综合在线| 手机在线观看av网站|