精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR 2024:思維框架 原創(chuàng)

發(fā)布于 2024-4-30 14:53
瀏覽
0收藏

本工作旨在減少大型語言模型(LLMs)的端到端生成延遲。高生成延遲的主要原因之一是幾乎所有最先進的LLMs都采用了順序解碼方法。在這項工作中,受到人類思考和寫作過程的啟發(fā),研究人員提出了思維框架(SoT),它首先指導(dǎo)LLMs生成答案的骨架,然后進行并行API調(diào)用或批處理解碼以并行完成每個骨架點的內(nèi)容。SoT不僅可以顯著加速12個LLMs的速度,而且還可以潛在地提高幾個問題類別的答案質(zhì)量。SoT是對推理效率進行數(shù)據(jù)中心優(yōu)化的初步嘗試,進一步強調(diào)了將LLMs推向更像人類思考的潛力,以提高答案質(zhì)量。

背景

大型語言模型(LLMs)的生成過程很慢。例如,Claude(于2023年7月中旬通過Slack訪問)回答“工作場所沖突解決最有效的策略是什么”問題需要22秒,Vicuna-33B V1.3(基于33B LLaMA模型,本地在一臺NVIDIA A100 GPU上運行)需要43秒。

LLM的慢推理問題有三個主要原因:

  • (1)由大型模型大小引起的大內(nèi)存、內(nèi)存訪問和計算量;
  • (2)流行的Transformer架構(gòu)中注意力的二次內(nèi)存和計算復(fù)雜度;
  • (3)生成過程采用逐個生成標記的順序解碼方法。大量文獻已經(jīng)通過壓縮/重新設(shè)計模型或重新設(shè)計服務(wù)系統(tǒng)和硬件來解決前兩個問題軸線。

能否加速現(xiàn)成的LLMs而不對它們的模型、系統(tǒng)或硬件進行任何更改?研究人員展示了對現(xiàn)成LLMs進行并行解碼的可行性!

方法

這個想法源于反思人類如何回答問題。人類不總是按順序思考問題并寫答案。相反,對于許多類型的問題,我們首先根據(jù)某些協(xié)議和策略導(dǎo)出骨架,然后添加證據(jù)和細節(jié)來完善和闡明每一點。在像提供咨詢、參加考試、寫論文等正式場合,尤其如此。我們能讓LLMs以同樣的方式思考嗎?為此,研究人員提出了思維框架(SoT)。具體來說,如下所示,首先引導(dǎo)LLMs自行導(dǎo)出一個骨架?;诠羌埽琇LMs可以并行完成每個點,從而獲得加速。請注意,SoT可以用于加速具有批處理解碼的開源模型和具有并行API調(diào)用的閉源模型。

ICLR 2024:思維框架 -AI.x社區(qū)

(1)骨架階段

SoT首先使用骨架提示模板和原始問題組裝一個骨架請求。骨架提示模板編寫以指導(dǎo)LLMs輸出答案的簡明骨架。然后,從LLMs的骨架響應(yīng)中提取B個點。

骨架提示模板:為了使輸出骨架簡短且格式一致,以提高效率和點提取的便利性,骨架提示模板(1)精確描述任務(wù),(2)使用兩個簡單的演示,(3)提供部分答案“1.”供LLMs繼續(xù)寫作。研究人員發(fā)現(xiàn),在大多數(shù)情況下,骨架響應(yīng)都符合期望的格式。因此,可以簡單地使用正則表達式從骨架響應(yīng)中提取點索引和點骨架。

(2)點擴展階段

根據(jù)骨架,研究人員使用點擴展提示模板組裝B個點擴展請求,并讓LLMs并行擴展每個點。對于僅具有API訪問權(quán)限的專有模型,可以發(fā)出多個并行API調(diào)用。對于開源模型,讓模型將點擴展請求作為批處理處理(在點擴展請求的左側(cè)添加填充)。最后,在完成所有點之后,連接點擴展響應(yīng)以獲得最終答案。

點擴展提示模板:點擴展提示模板描述點擴展任務(wù)并提供部分答案。研究人員還提供了“非常簡短地寫”1~2句的指示,以便LLMs保持答案簡明。與骨架提示模板不同,研究人員發(fā)現(xiàn)不需要演示也可以獲得合理的結(jié)果。

具有路由器的SoT(SoT-R):自適應(yīng)觸發(fā)SoT

SoT進行獨立和并行的點擴展。因此,它不適用于以下類型的問題:(1)需要逐步推理的問題,(2)僅需要非常簡短答案的問題,以及(3)不能獨立解碼以保持連貫性的問題。因此,為了推動SoT的實際應(yīng)用,研究人員探索了僅在合適時自適應(yīng)觸發(fā)SoT的可能性。為實現(xiàn)這一目標,提出了一個路由器模塊,該模塊決定是否應(yīng)用SoT進行用戶請求,并相應(yīng)地調(diào)用SoT或普通解碼。為了實現(xiàn)路由器,研究人員探索了兩種選項:LLM提示作為路由器(無需模型訓(xùn)練),以及在LIMA上進行訓(xùn)練、在Vicuna-80和WizardLM上進行測試的RoBERTa作為路由器。研究人員將整體解決方案命名為帶有路由器的SoT(SoT-R)。

結(jié)果

數(shù)據(jù)集。使用了(1)包含80個問題的Vicuna-80數(shù)據(jù)集,涵蓋編碼、數(shù)學(xué)、寫作、角色扮演等九個類別,以及(2)包含218個問題的WizardLM數(shù)據(jù)集,涵蓋更多類別和不同難度。

模型。對12個最近發(fā)布的模型進行了SoT和SoT-R的測試,包括9個開源模型和3個基于API的模型,如下所示。

效率評估。使用time.time記錄API調(diào)用的延遲,使用torch.cuda.Events記錄本地模型運行的延遲。所有本地模型均使用FastChat - HuggingFace transformer - PyTorch庫堆棧運行,并采用FP16精度。

答案質(zhì)量評估。遵循最近的做法,讓一個LLM判斷比較答案。研究人員使用FastChat和LLMZoo的評估提示,并詢問GPT-4對答案的偏好。

ICLR 2024:思維框架 -AI.x社區(qū)

下圖左側(cè)顯示了整體解決方案SoT-R實現(xiàn)的答案質(zhì)量和加速效果。SoT-R可以加速基于API和開源模型的生成。此外,SoT-R還可以改善許多模型的答案質(zhì)量。這是因為SoT中的骨架階段鼓勵LLMs從圍繞問題的多個角度思考,提高了答案的多樣性和相關(guān)性。

對于SoT-R為何有所幫助的一些詳細信息,請參見下圖右側(cè),該圖顯示SoT-R成功地針對適合的問題類別觸發(fā)SoT,并對其他問題類別進行正常生成,從而保持了這些類別的答案質(zhì)量。

ICLR 2024:思維框架 -AI.x社區(qū)

SoT與路由器(SoT-R)在Vicuna-80上與正常生成相比的凈勝率和加速比。凈勝率是SoT-R的答案優(yōu)于或劣于正常生成的問題分數(shù)之差。加速比是正常生成和SoT-R生成的延遲比率。(1.0, 0.0)表示正常生成。在兩個軸上都更高更好。對于大多數(shù)模型來說,SoT-R不僅加速了生成,還提高了答案質(zhì)量。

ICLR 2024:思維框架 -AI.x社區(qū)

(上圖)SoT和SoT-R在Vicuna-80上不同問題類別的凈勝率。對于不適合SoT的問題類別,SoT-R學(xué)會了回退到正常生成模式。因此,SoT-R可以保持所有問題類別的良好答案質(zhì)量。

(下圖)SoT和SoT-R在Vicuna-80上不同模型的加速比。SoT-R可以為大多數(shù)模型保持>1的加速比。

問題和展望

引導(dǎo)或提高LLMs的能力

SoT展示了提高答案質(zhì)量的潛力。這是最近研究的一個更廣泛趨勢的一部分,例如CoT、ToT和ReAct等工作,這些工作共同證實了在語言中明確表達思維過程可以引出高質(zhì)量的答案的觀點。這些發(fā)現(xiàn)類似于人類的思維:經(jīng)常記錄逐步推理或思維組織,而不是僅依靠第一直覺或純粹的順序思維來獲得高質(zhì)量的答案。這種有趣的類比促使進一步探索如何從人類的思維過程中汲取經(jīng)驗,以促進更有效和高效的人工智能。

例如,SoT目前忽略了點之間的依賴關(guān)系。一個在概念上更好的方法是將這些點組織成思維圖,其中邊表示依賴關(guān)系,并且每個點的解碼是依賴于其祖先點的內(nèi)容。此外,研究人員預(yù)期需要動態(tài)思維圖,而不是遵循靜態(tài)圖,其中高層思維結(jié)構(gòu)由LLMs自己動態(tài)調(diào)整。這可能將SoT的效率和全局思維優(yōu)勢與邏輯推理和即興思考等方法(例如CoT)的優(yōu)勢結(jié)合起來。

此外,還存在自我改進的訓(xùn)練管道,利用CoT生成的理由來微調(diào)LLMs,從而增強它們的推理能力。同樣,有趣的是調(diào)查來自SoT的更結(jié)構(gòu)化答案如何用于微調(diào)LLMs,以增強它們生成井然有序和全面答案的能力。

不同情景下SoT的效率和開銷

服務(wù)系統(tǒng)通常采用批處理來處理并發(fā)查詢。這引發(fā)了一個擔憂,即SoT是否會由于并行請求而影響服務(wù)吞吐量。(1) 當存在未飽和的并發(fā)查詢數(shù)量時,SoT可以有效地減少延遲并提高GPU利用率。示例場景包括(a)具有單個用戶的邊緣應(yīng)用;(b)在用戶請求未飽和且計算能力未充分利用的時期的集中式服務(wù)。有趣的是根據(jù)系統(tǒng)工作負載研究適當?shù)腟oT觸發(fā)條件。(2) 當存在飽和的并發(fā)查詢數(shù)量時,SoT仍然有助于提高答案質(zhì)量。然而,在這種情況下,重要的是考慮來自SoT的計算開銷。

對于基于API的模型,存在一個顯著的問題,即填充令牌的數(shù)量增加。鑒于許多API收取令牌使用費,SoT可能導(dǎo)致更高的成本。為了解決這個問題,可以調(diào)整并行API請求的數(shù)量(通過在單個API調(diào)用中擴展多個點),或者使用提示調(diào)整來設(shè)計更短的SoT提示。

以數(shù)據(jù)為中心的效率優(yōu)化

雖然以數(shù)據(jù)為中心的工程正在流行中用于提高答案質(zhì)量,但其對推理效率的潛力尚未被充分探索。SoT是第一次嘗試。隨著LLM的能力和LLM生成的數(shù)據(jù)量迅速增長,未來數(shù)據(jù)為中心的技術(shù)可能變得更加有用。期待著更多的探索,以發(fā)掘數(shù)據(jù)為中心的效率優(yōu)化的全部潛力。

譯自(有刪改):https://sites.google.com/view/sot-llm


本文轉(zhuǎn)載自公眾號AIGC最前線   

原文鏈接:??https://mp.weixin.qq.com/s/rmdR2eoYvwatlgG8czLsng??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
99国产精品久久久久久久成人 | 免费黄色在线视频| 亚洲欧美韩国| 1000精品久久久久久久久| 国产一区二区免费电影| 中文字幕一区二区三区四区免费看| 艳女tv在线观看国产一区| 日韩激情视频在线| 激情久久综合网| 激情都市亚洲| 亚洲一区二区三区自拍| 日韩免费电影一区二区三区| 亚洲av无码乱码在线观看性色| 日韩电影免费一区| 97人人模人人爽人人喊中文字| 国产又黄又粗又猛又爽的| 久久久久97| 欧美一区二区视频在线观看2020 | 六九午夜精品视频| 精品色蜜蜜精品视频在线观看| 一区二区不卡在线观看| 青青草av免费在线观看| 国产成a人亚洲精品| 国产精品视频区1| 国偷自拍第113页| 欧美午夜电影在线观看| 另类少妇人与禽zozz0性伦| 欧美人与性囗牲恔配| 精品素人av| 欧美成人综合网站| 免费观看黄网站| japansex久久高清精品| 欧美日韩五月天| 男女无套免费视频网站动漫| 成人影院av| 五月天激情小说综合| 欧美黄色免费网址| 亚洲精品一线| 洋洋成人永久网站入口| 浴室偷拍美女洗澡456在线| 免费日本一区二区三区视频| 中国色在线观看另类| 欧美一区观看| 黄上黄在线观看| 久久免费午夜影院| 蜜桃av色综合| 国产玉足榨精视频在线观看| 国产三级精品在线| 日韩精品国内| 91精品专区| 国产精品免费av| 永久免费精品视频网站| 岛国成人毛片| 亚洲综合成人在线视频| 国产色一区二区三区| 黄色在线网站噜噜噜| 精品久久久一区| 国产性生交xxxxx免费| 亚洲成人va| 欧美日韩不卡视频| 亚洲第一成肉网| 岛国精品一区| 国产丝袜精品视频| 伊人影院综合网| 亚洲午夜精品一区二区国产 | 免费看一级一片| 亚洲精华国产欧美| 538国产精品视频一区二区| 日本视频在线观看免费| 麻豆精品久久精品色综合| 91久久精品日日躁夜夜躁国产| a级片在线播放| 成人av免费观看| 欧美在线一二三区| 日韩理伦片在线| 亚洲综合一区二区| 超碰97人人射妻| 久久伊人国产| 精品国产伦一区二区三区观看方式| 尤物网站在线观看| 教室别恋欧美无删减版| 久久久国产精品视频| 国产精彩视频在线观看| 视频一区在线视频| 91日韩久久| 国产无套粉嫩白浆在线2022年| 亚洲天堂中文字幕| 亚洲中文字幕无码中文字| 四虎影视成人精品国库在线观看| 亚洲高清久久久久久| 少妇av片在线观看| 伊人精品在线| 国产一区欧美二区三区| 午夜性色福利视频| 亚洲三级久久久| 国产美女三级视频| 91麻豆精品激情在线观看最新| 亚洲偷熟乱区亚洲香蕉av| 青青草手机在线观看| 久久午夜影视| 国产精品视频一区二区三区经| www.黄在线观看| 亚洲va韩国va欧美va| 天天干天天操天天做| 婷婷综合一区| 色在人av网站天堂精品| 中文字幕人成人乱码亚洲电影| 99久久夜色精品国产网站| 国产又爽又黄ai换脸| 午夜激情在线播放| 精品美女在线观看| 神马久久精品综合| 日本aⅴ亚洲精品中文乱码| 国内精品久久久久久久果冻传媒| 91看片在线观看| 色婷婷久久久综合中文字幕| 中文字幕天堂网| 欧美成人午夜| 国产精品爽黄69| 第一福利在线| 一本大道av一区二区在线播放| 国产一线在线观看| 欧美网站在线| αv一区二区三区| 国产理论在线观看| 欧美三级视频在线播放| av网站免费在线看| 美女精品网站| 蜜桃av久久久亚洲精品| 色网在线免费观看| 亚洲国产精品专区久久| 日本a在线观看| 不卡的av在线播放| 国产高清www| 97久久亚洲| 久久久久久久久久久久久久久久久久av | 一本大道av一区二区在线播放| 亚洲永久无码7777kkk| 在线观看的日韩av| 国产 高清 精品 在线 a| 亚洲综合图区| 精品少妇一区二区三区免费观看 | 日本一区二区三区视频在线观看 | 精品综合久久久久久8888| 亚洲精品8mav| 粉嫩一区二区三区在线观看| 久久久精品国产亚洲| 国产精品久久久久久久免费看| 日本一二三四高清不卡| 亚洲午夜精品一区| 欧美aⅴ99久久黑人专区| 97久久天天综合色天天综合色hd| 日本一级理论片在线大全| 欧美不卡在线视频| 国产无遮无挡120秒| 91在线观看免费视频| 爱福利视频一区二区| 欧美欧美黄在线二区| 国产精品福利久久久| 男人在线资源站| 欧美一级欧美三级在线观看| 久久久久久久极品内射| 91网站最新网址| www.涩涩涩| 欧美91大片| 久久www免费人成精品| 台湾佬中文娱乐久久久| 久久在线免费视频| 蜜桃av中文字幕| 在线免费一区三区| 希岛爱理中文字幕| 91在线视频免费91| 中文字幕一区二区三区四区在线视频| 91亚洲国产成人久久精品| 97视频热人人精品| 欧美电影免费观看| 久久视频国产精品免费视频在线| 亚洲第一免费视频| 色网站国产精品| 中文乱码字幕高清一区二区| 成人网页在线观看| 天堂在线资源视频| 国产精品九九| 亚洲精品日韩精品| 99精品国产高清一区二区麻豆| 日韩av123| 日本在线视频网址| 少妇高潮久久77777| 女人18毛片水真多18精品| 欧美性色黄大片| 久草视频手机在线观看| 欧美激情中文不卡| 国产精品久久久久久亚洲色| 美国一区二区三区在线播放| 国产资源在线视频| 亚洲先锋影音| 日韩欧美一区二区三区四区五区| 日韩有吗在线观看| 国产精品久久久久久久久| 爱啪视频在线观看视频免费| 色爱av美腿丝袜综合粉嫩av| 丝袜+亚洲+另类+欧美+变态| 日韩午夜中文字幕| 最近中文字幕在线观看| 午夜视频在线观看一区二区三区| 永久av免费网站| 国产偷国产偷精品高清尤物| 国产 xxxx| 国产成人av一区二区三区在线观看| 日本人视频jizz页码69| 久久精品官网| 久久久999视频| 欧美日韩免费观看一区=区三区| 性欧美大战久久久久久久免费观看| 国产精品网在线观看| 成人女保姆的销魂服务| 久久精品国产精品亚洲毛片| 日本精品中文字幕| 国产乱码午夜在线视频| 欧美国产日韩一区二区| 成a人片在线观看| 日韩中文娱乐网| 国产私人尤物无码不卡| 日韩精品中文字幕久久臀| 好吊色视频一区二区| 日韩欧美国产麻豆| 国产av精国产传媒| 欧美一区二区视频网站| 国产农村妇女毛片精品久久| 欧美日韩国产免费一区二区| 日本三级一区二区三区| 91精品1区2区| 国产情侣呻吟对白高潮| 欧美性感一区二区三区| 18国产免费视频| 欧美日韩视频在线观看一区二区三区| 日韩黄色一级视频| 欧美中文字幕亚洲一区二区va在线 | 成人欧美一区二区三区黑人孕妇| 亚洲精品乱码日韩| 成人黄色在线观看| 国产精品一站二站| 91在线播放视频| 风间由美一区二区av101| 国产九色91| 日韩精品免费一区二区夜夜嗨 | 午夜激情久久| 国产三级中文字幕| 国产精品vip| 国自产拍偷拍精品啪啪一区二区| 亚洲美女少妇无套啪啪呻吟| 一本大道熟女人妻中文字幕在线| 噜噜噜在线观看免费视频日韩 | 国产亚洲精彩久久| 成人精品视频99在线观看免费| 国产精一区二区| 国产福利不卡| 啪啪国产精品| 亚洲精品中文字幕在线| 五月激情综合| 久久国产精品网| 久久综合伊人| www.久久久久久久久久久| 国产丶欧美丶日本不卡视频| 黄色污在线观看| 国产精品私房写真福利视频| 日韩精品123区| 图片区日韩欧美亚洲| 无码人妻精品一区二区三区9厂| 欧美色综合久久| av中文字幕观看| 亚洲欧美国产va在线影院| av色图一区| 欧美黑人国产人伦爽爽爽| 色戒汤唯在线| 91精品在线观| 婷婷五月色综合香五月| 麻豆中文字幕在线观看| 99成人精品| 想看黄色一级片| 91丨porny丨中文| 久久久久久视频| 欧美日韩国产在线| 一级黄色录像大片| 亚洲成人在线网| 一区二区高清不卡| 欧美肥臀大乳一区二区免费视频| 成人天堂yy6080亚洲高清| 91精品久久香蕉国产线看观看| 亚洲色图美女| 欧美日韩视频免费| 免费成人美女在线观看| 在线免费观看污视频| 国产精品久久久久一区| 成年免费在线观看| 88在线观看91蜜桃国自产| 欧美挠脚心网站| 欧美激情日韩图片| 四虎影视成人精品国库在线观看| 久久精品午夜一区二区福利| 欧美在线网址| 亚洲va在线va天堂va偷拍| 91在线国内视频| 懂色av.com| 欧美一区二区啪啪| 在线日本中文字幕| 国产成人精品久久二区二区91| 伊人久久大香线蕉av超碰| 在线观看精品视频| 久久人人超碰| av网页在线观看| 亚洲宅男天堂在线观看无病毒| 一区二区小视频| 一区二区三区天堂av| 色偷偷偷在线视频播放| **亚洲第一综合导航网站| 人人狠狠综合久久亚洲婷婷| 久久久精品在线视频| av在线一区二区| 久一区二区三区| 日韩一区二区在线看片| 欧美a在线看| 91精品久久久久久久久| 欧美视频免费| 久久婷婷国产精品| 91女人视频在线观看| 久久久午夜影院| 日韩精品在线免费播放| 99爱在线视频| 国产精品伊人日日| 欧美视频福利| 国产又粗又猛又爽又黄| 一区二区三区四区高清精品免费观看 | 日韩视频一区二区三区| 欧美成人精品一区二区男人看| 国产精品羞羞答答| 久久综合88| 视频二区在线播放| 一区在线观看免费| 国产色片在线观看| 美女少妇精品视频| 伊人久久影院| 国产原创中文在线观看 | 国产一区二区不卡在线| 日韩欧美国产成人精品免费| 91精品国产91久久综合桃花| a毛片在线看免费观看| 成人激情直播| 国产视频欧美| 国产精品一二三区在线观看| 欧美日本一区二区三区四区| www免费在线观看| 国产精品久久久对白| 99精品国产99久久久久久福利| 欧美大片免费播放器| 在线看国产一区二区| 日本蜜桃在线观看| 成人资源视频网站免费| 国产精品尤物| 男人天堂资源网| 欧美不卡123| 毛片无码国产| 色乱码一区二区三区熟女| 国产不卡视频一区| 日本久久综合网| 精品国内产的精品视频在线观看| 91麻豆精品激情在线观看最新| 中文字幕乱码人妻综合二区三区| 欧美激情在线一区二区三区| 99在线精品视频免费观看20| 久久久免费精品| 欧美少妇xxxx| 亚洲美女高潮久久久| 色偷偷久久一区二区三区| caoporn免费在线视频| 黄色91av| 精品一区二区三区免费观看| 亚洲一区欧美在线| 在线精品播放av| 加勒比久久高清| 在线观看国产一级片| 亚洲不卡av一区二区三区| 成人av毛片| 国产日韩一区欧美| 美女精品自拍一二三四| 国产稀缺真实呦乱在线| 综合久久五月天| 精品视频在线你懂得| 欧美视频亚洲图片| 欧美性生交xxxxx久久久| av片在线观看网站| 日韩精品一区二区三区色偷偷| 国产成人啪午夜精品网站男同| 国产一级片一区二区| 欧美激情视频在线| 国产大片一区| 精品无码在线观看| 亚洲精品xxxx| 麻豆精品在线| 久久国产这里只有精品|