精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最火AI角色扮演流量已達(dá)谷歌搜索20%!每秒處理2萬(wàn)推理請(qǐng)求,Transformer作者公開優(yōu)化秘訣

人工智能 新聞
大模型的一大痛點(diǎn)是顯存占用高,導(dǎo)致無(wú)法支持大批量推理。Attention 層中的 Key-Value(KV)緩存便是罪魁禍?zhǔn)字弧?/div>

什么AI應(yīng)用每秒處理20000個(gè)AI推理請(qǐng)求,達(dá)到2024年谷歌搜索流量的1/5

答案是獨(dú)角獸Character.ai,由Transformer作者Noam Shazeer(后面簡(jiǎn)稱沙哥)創(chuàng)辦。

剛剛,沙哥公布了推理優(yōu)化獨(dú)門秘訣,迅速引起業(yè)界熱議。

圖片

具體來(lái)說(shuō)Character.ai在整個(gè)服務(wù)堆棧中實(shí)現(xiàn)了如下成績(jī):

  • 內(nèi)存高效架構(gòu)設(shè)計(jì):將KV緩存大小減少20倍以上,而不會(huì)降低質(zhì)量
  • Attention狀態(tài)緩存:95%請(qǐng)求無(wú)需重算
  • 直接用in8精度量化訓(xùn)練:推理零損失還省顯存

Character.AI通過(guò)以上種種優(yōu)化,已經(jīng)把推理成本降低到最初的1/33,如果用市場(chǎng)上最好的商業(yè)API來(lái)支撐這種級(jí)別的流量,成本會(huì)比現(xiàn)在高出13.5倍!

眾多公布的方法中,原生int8訓(xùn)練是最受關(guān)注的。

圖片

雖然大多數(shù)技巧都來(lái)自公開研究,但是正如網(wǎng)友所說(shuō),知道如何把它們高效整合在一起實(shí)現(xiàn)的團(tuán)隊(duì)才是真正的護(hù)城河。

圖片

秘訣1:高效利用顯存,attention 參數(shù)量降低20倍

大模型的一大痛點(diǎn)是顯存占用高,導(dǎo)致無(wú)法支持大批量推理。Attention 層中的 Key-Value(KV)緩存便是罪魁禍?zhǔn)字弧?/p>

為了降低顯存占用,Character.AI在Attention層大動(dòng)手術(shù):

  • 全面采用MQA(Multi-Query Attention)

與大多數(shù)開源模型中采用的GQA(Grouped-Query Attention)相比,將KV緩存大小減少了 8 倍。

而MQA正是沙哥本人2019年在谷歌期間提出的,有網(wǎng)友評(píng)價(jià)“當(dāng)一個(gè)人能在生產(chǎn)環(huán)境中引用自己的論文,就達(dá)到了一個(gè)新的高度”。

圖片

  • 混合注意力視野

將局部注意力與全局注意力層交織在一起,使用滑動(dòng)窗口訓(xùn)練局部注意力,將復(fù)雜度從 O(length^2 ) 降低到 O(length)。

團(tuán)隊(duì)發(fā)現(xiàn),將大多數(shù)注意力層的注意力范圍減少到1024不會(huì)對(duì)評(píng)估指標(biāo)產(chǎn)生重大影響,包括長(zhǎng)上下文大海撈針基準(zhǔn)。在Character.ai生產(chǎn)模型中,每6層中只有1層使用全局注意力

  • 跨層KV共享

團(tuán)隊(duì)將KV緩存綁定在相鄰的注意力層上,這進(jìn)一步將 KV緩存大小減少了 2-3 倍。

對(duì)于全局注意力,跨塊綁定多個(gè)全局層的KV緩存,因?yàn)槿肿⒁饬釉陂L(zhǎng)上下文用例中主導(dǎo)KV緩存大小,團(tuán)隊(duì)發(fā)現(xiàn)跨層共享KV不會(huì)降低質(zhì)量。

下圖中左半部分是標(biāo)準(zhǔn)Transformer設(shè)計(jì),每個(gè)注意力都是全局注意力。右半部分為Character.ai的設(shè)計(jì),藍(lán)色框表示全局注意力,綠色框表示局部注意力,連線表示KV共享。

圖片

這一套組合拳下來(lái),KV緩存大小減少20倍以上,顯存再也不是瓶頸了。

秘訣2:巧用狀態(tài)緩存,95%請(qǐng)求無(wú)需重算

Character.AI還有一招神來(lái)之筆,就是在不同對(duì)話之間緩存Attention狀態(tài)

作為聊天機(jī)器人角色扮演服務(wù),Character.AI上大部分對(duì)話都是連續(xù)多輪的,平均每個(gè)對(duì)話包含180條消息。如果每次都要重新計(jì)算前面的狀態(tài),成本可想而知。

于是團(tuán)隊(duì)設(shè)計(jì)了一個(gè)緩存機(jī)制,把每個(gè)對(duì)話的Prefix和生成的消息都緩存在內(nèi)存中,供后續(xù)調(diào)用。

借鑒RadixAttention的思路,樹狀結(jié)構(gòu)的LRU緩存組織緩存的KV張量。緩存的KV值由前綴token的Rolling Hash速檢索最長(zhǎng)匹配的緩存,即使前綴只有部分匹配也能命中。

更妙的是,他們還用會(huì)話保持(Sticky Session)把同一對(duì)話路由到同一個(gè)服務(wù)器,進(jìn)一步提高緩存命中率。最終做到95%的請(qǐng)求都能復(fù)用已有緩存,大幅降低了計(jì)算成本。

下圖中,藍(lán)色框表示主機(jī)內(nèi)存上的緩存張量。綠色和黃色框表示CUDA內(nèi)存上的KV緩存。當(dāng)新查詢到達(dá)時(shí),它檢索最長(zhǎng)匹配前綴的KV緩存,Rolling Hash系統(tǒng)允許檢索部分匹配消息的緩存。

圖片

秘訣3:直接量化訓(xùn)練,推理零損失還省顯存

最后一招,Character.AI沒(méi)有采用常見(jiàn)的“訓(xùn)練后量化”,而是直接用Int8精度訓(xùn)練模型

這種格式雖然表達(dá)精度降低,但通過(guò)精心設(shè)計(jì)定制的矩陣乘和 Attention 內(nèi)核,不僅把訓(xùn)練效率提高了好幾倍,而且還能無(wú)損用于推理。

不過(guò)沙哥在這里暫時(shí)留了一手,表示“量化訓(xùn)練本身就是一個(gè)復(fù)雜的話題,將在以后的文章中繼續(xù)討論。”

沙哥其人

最后再來(lái)介紹一下傳奇人物Noam Shazeer本人。

圖片

他1994年拿了信息學(xué)奧賽IOI金牌,后來(lái)畢業(yè)于杜克大學(xué)。

2000年加入谷歌,當(dāng)時(shí)全公司只有200人左右,他參與了谷歌搜索的拼寫糾正功能,后來(lái)也負(fù)責(zé)過(guò)早期廣告系統(tǒng)。

據(jù)知情人透露,在當(dāng)初面試谷歌時(shí),沙哥就被問(wèn)到如何實(shí)現(xiàn)拼寫糾正。他描述了一種根據(jù)其他用戶的輸入輸入記錄,進(jìn)行統(tǒng)計(jì)驗(yàn)證的方法。

面試官Gmail之父Paul Buchheit意識(shí)到,沙哥的方案比谷歌當(dāng)時(shí)使用的要好。沙哥成功入職之后就把他的面試方案寫出來(lái)了。

圖片

在Transformer開山之作《Attention is All You Need》研究中,沙哥最后一個(gè)加入團(tuán)隊(duì),一來(lái)就負(fù)責(zé)重新編寫了整個(gè)代碼。

在沙哥出手之前,Transformer早期原型性能并沒(méi)有超越當(dāng)時(shí)流行的LSTM方案,是他把早期設(shè)計(jì)中的卷積等模塊都拿掉,給出了一個(gè)極簡(jiǎn)主義方案。最終破了BLEU測(cè)試的記錄,同時(shí)計(jì)算效率也更高。

隊(duì)友用“他是一個(gè)巫師”來(lái)評(píng)價(jià)他的工程和代碼能力。

除此之外,沙哥還有驚人的遠(yuǎn)見(jiàn)。在Transformer架構(gòu)問(wèn)世不久,他就給谷歌高層寫信,提議公司放棄整個(gè)搜索索引,并用Transformer架構(gòu)訓(xùn)練一個(gè)巨大的神經(jīng)網(wǎng)絡(luò)替代。

2021年,沙哥離開谷歌后創(chuàng)辦了Character.AI,讓玩家簡(jiǎn)單自創(chuàng)個(gè)性化AI陪聊,目前估值約50億美元。

圖片

最近有消息稱,Meta與馬斯克的??都在爭(zhēng)取與他們合作,把聊天機(jī)器人引入社交平臺(tái)。

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2011-06-28 10:11:41

Top Girl應(yīng)用

2023-04-18 08:01:30

AI寫作時(shí)間

2024-01-02 12:59:06

AI技術(shù)

2024-11-05 12:42:35

2023-09-12 14:47:09

AI模型

2021-02-06 06:55:33

AI物聯(lián)網(wǎng)人工智能

2024-12-27 13:30:00

2023-11-20 07:29:32

大模型人工智能

2017-04-24 14:39:01

PythonHTTP語(yǔ)言

2018-02-24 16:15:03

PythonHTTP

2020-05-27 11:31:43

Python 開發(fā)程序員

2024-07-01 10:16:44

2024-12-09 14:30:00

2024-07-08 08:50:00

2020-03-24 15:08:07

AI 數(shù)據(jù)人工智能

2024-08-23 11:53:24

2025-01-16 08:30:00

LLMAI訓(xùn)練

2013-09-25 15:28:42

Storm流式處理框架框架

2024-11-04 09:35:00

2025-05-28 05:10:00

策略Spring性能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久最新免费视频| 亚洲一区中文字幕在线观看| 在线观看日本中文字幕| 国产成人精品一区二区三区在线| 国产精品视频一二三区| 91av一区二区三区| 国产高潮久久久| 色乱码一区二区三区网站| 欧美成人r级一区二区三区| www在线观看免费| av中文资源在线| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 精品视频99| 日韩视频一区二区| 日韩精品一区中文字幕| 麻豆tv免费在线观看| 91影院在线免费观看| 成人精品视频99在线观看免费| 国产亚洲精品码| 日韩dvd碟片| 亚洲成人国产精品| 最新国产黄色网址| 欧美大片免费观看网址| 一区二区三区欧美激情| 亚洲高清视频一区二区| 视频一区二区免费| 美国一区二区三区在线播放| 欧美亚洲在线播放| 国产亚洲精品av| 欧美激情亚洲| yw.139尤物在线精品视频| 日本japanese极品少妇| 亚洲国产欧美在线观看| 欧美年轻男男videosbes| 日韩精品视频久久| 9999在线视频| 亚洲午夜免费视频| 穿情趣内衣被c到高潮视频| porn视频在线观看| 久久精品免费在线观看| 裸模一区二区三区免费| 日本精品999| 成人av在线一区二区三区| 不卡一区二区三区视频| 在线视频你懂得| 奇米四色…亚洲| 国产成人一区二区三区电影| 天天做天天爱夜夜爽| 99精品99| 2019中文字幕在线| 日韩少妇裸体做爰视频| 亚洲欧洲日本mm| 午夜精品一区二区三区在线视 | 欧美视频第一页| 337p粉嫩大胆噜噜噜鲁| 国产网站在线| 色综合激情久久| www黄色av| av有声小说一区二区三区| 色婷婷综合久久久中文字幕| 日本成人在线免费视频| 欧美一区久久久| 91久久精品网| 中文字幕在线综合| 99精品视频在线免费播放| 欧美日韩国产色站一区二区三区| 狠狠干狠狠操视频| 日韩欧美另类中文字幕| 精品国产精品网麻豆系列| youjizz.com国产| 欧美激情影院| 国产一区二区三区在线免费观看| av手机在线播放| 日韩精品dvd| 久久成人在线视频| 国产无遮挡又黄又爽| 夜夜嗨一区二区| 日本精品免费观看| 91女人18毛片水多国产| 国产不卡视频在线观看| 久久久久久九九| av在线三区| 亚洲美女免费视频| www婷婷av久久久影片| a√中文在线观看| 日本高清免费不卡视频| 性欧美在线视频| 国产伦精品一区二区三区免费优势| 亚洲精品福利在线观看| 69精品无码成人久久久久久| 先锋资源久久| 91黑丝在线观看| 中文字幕在线视频第一页| 国产精品88av| 日韩hmxxxx| 波多一区二区| 欧美日韩一区二区三区不卡| 怡红院一区二区| 日本久久一二三四| 午夜精品一区二区三区在线播放| a片在线免费观看| 成人免费看黄yyy456| 婷婷久久五月天| 欧洲成人综合网| 欧美色网一区二区| 欧美精品欧美极品欧美激情| 91青青国产在线观看精品| 97视频在线看| 国产精品久久久久久久久久久久久久久久久久 | 欧美黄色成人网| 波多野结衣大片| 不卡一区二区在线| 国产一二三四区在线观看| 欧美精品总汇| 亚洲国产精品资源| 欧美精品xxxxx| 美女网站色91| 青娱乐国产91| 国产免费拔擦拔擦8x在线播放| 91麻豆精品91久久久久同性| 久久久久亚洲av成人无码电影| 亚洲小说欧美另类社区| 成人国产精品av| 韩国中文免费在线视频| 精品久久久久久| 久久黄色一级视频| 久久精品青草| 国产精品入口夜色视频大尺度| 五月婷婷丁香六月| 亚洲国产三级在线| 久久久久久久久久毛片| 日韩国产一区| 国产狼人综合免费视频| 精品乱码一区二区三四区视频| 五月天网站亚洲| 成人区人妻精品一区二| 欧美色综合网| 999在线免费观看视频| 搞黄网站在线观看| 91.com在线观看| 国产3级在线观看| 老汉av免费一区二区三区 | 国产福利小视频在线| 污片在线观看一区二区| 亚洲图片欧美另类| 国产一区日韩一区| 亚洲xxx大片| 婷婷色在线资源| 欧美成人激情免费网| 深夜福利影院在线观看| 国产精品88av| 日本a在线免费观看| 91免费精品国偷自产在线在线| 欧美日韩成人在线视频| 亚洲国产精品久久人人爱潘金莲| 亚洲精品亚洲人成人网| 男人添女人荫蒂国产| 午夜天堂精品久久久久| 国产精品国产三级欧美二区| a级毛片免费观看在线| 日韩欧美色电影| 黄色片视频网站| 久久综合久久久久88| 97xxxxx| 日韩午夜电影网| 91亚洲精品在线观看| 欧美极品少妇videossex| 亚洲成人激情在线| 国产成人精品777777| 亚洲国产精品ⅴa在线观看| 午夜在线观看av| 欧美1级日本1级| 国产区一区二区三区| 在线天堂资源| 色婷婷久久av| 亚洲乱码精品久久久久.. | 国产精品久久久久久免费播放 | 亚洲国产精品无码av| 欧美美女啪啪| 国产精品视频一| 888av在线| 欧美tk—视频vk| 黄色片中文字幕| 日韩码欧中文字| 日批在线观看视频| 蜜臀av国产精品久久久久| 青青草综合在线| 欧美**字幕| 91亚洲永久免费精品| 51精品在线| 日韩中文字幕在线播放| 全国男人的天堂网| 欧美午夜精品免费| 久久久一二三区| 中文字幕不卡的av| 久久精品无码专区| 日本免费在线视频不卡一不卡二 | 网站永久看片免费| 成人精品在线视频观看| 欧美一级特黄a| 亚洲精品1234| 熟女视频一区二区三区| 伊人久久大香线蕉无限次| 91色精品视频在线| 国产综合色区在线观看| 久久久久久12| 欧美私人网站| 亚洲三级免费看| 国精品人妻无码一区二区三区喝尿| 91激情五月电影| 日本网站免费观看| 1区2区3区欧美| 永久免费成人代码| 99re视频精品| 精人妻一区二区三区| 久久99久久久久| 虎白女粉嫩尤物福利视频| 黄色欧美日韩| 色综合久久久久久久久五月| 日韩三级av| 国产伦精品一区二区| 国产亚洲观看| 国产欧美在线观看| 国产在线|日韩| 日韩av黄色在线观看| 91破解版在线观看| 久久99精品久久久久久青青91 | 性猛交xxxx| 欧美成人午夜电影| 国产婷婷在线视频| 欧美精品1区2区| 天天爱天天做天天爽| 欧美色videos| 国产精品久久久久久久久久久久久久久久久 | 视频国产精品| 91|九色|视频| 日韩视频一区二区三区四区| 成人黄色av网站| 色噜噜成人av在线| 国产一区二区色| 四虎精品在线观看| 成人疯狂猛交xxx| 亚洲精品一区av| 成人免费看黄网站| 国产精品麻豆| 2019国产精品视频| 日本一区二区三区视频在线看| 91热福利电影| 亚洲啊v在线免费视频| 超碰97在线人人| 波多野结衣欧美| 精品一区二区国产| 少妇一区二区三区| 秋霞在线观看一区二区三区 | 欧美日韩一级在线| 91精品国产自产在线观看永久∴| 欧美 另类 交| 欧美一区二区三区久久精品茉莉花| 在线天堂一区av电影| 性xxxx欧美老肥妇牲乱| 日本免费黄色小视频| 伊人久久大香线蕉综合热线| 国产午夜福利100集发布| 日韩午夜精品| 亚洲中文字幕久久精品无码喷水| 日韩精品成人一区二区在线| 亚洲精品综合在线观看| 国产成人在线视频播放| 国产黄色三级网站| 国产欧美视频一区二区三区| 激情五月激情综合| 亚洲曰韩产成在线| 久久久午夜影院| 欧美性色黄大片| 国产成人毛毛毛片| 日韩av中文在线| a黄色在线观看| 欧美丰满少妇xxxxx| 英国三级经典在线观看| 国产精品视频男人的天堂| 久久久精品区| 蜜桃传媒视频第一区入口在线看| 日韩精品首页| 成人免费视频91| 久久精品国内一区二区三区| 好吊操视频这里只有精品| 久久欧美一区二区| 91插插插插插插| 欧美视频第一页| 国产chinasex对白videos麻豆| 日韩精品免费在线视频观看| 成人p站proumb入口| 欧美激情第1页| 国产一区二区主播在线| 国产精品99久久久久久久| 精品欧美久久| www.日本在线播放| 久久草av在线| 一区二区三区少妇| 亚洲欧美视频一区| 在线免费观看av网址| 欧美va天堂va视频va在线| 999在线视频| 91精品国产91久久久久久| 色婷婷成人网| 色综合久久久久久久久五月| 亚洲精品黄色| 午夜免费视频网站| 国产免费成人在线视频| 国产奶水涨喷在线播放| 欧美福利视频导航| 国产污视频在线| 91av网站在线播放| 日韩精品一区国产| 大地资源第二页在线观看高清版| 久久成人在线| 中文字幕一区二区三区乱码不卡| 亚洲欧洲av一区二区三区久久| 欧美三级午夜理伦| 精品国产亚洲一区二区三区在线观看| 在线视频1区2区| 国产精品xxx视频| 香蕉久久精品| a级黄色一级片| 不卡电影免费在线播放一区| 在线免费观看亚洲视频| 欧美精品日日鲁夜夜添| 成年在线观看免费人视频| 91tv亚洲精品香蕉国产一区7ujn| 伊色综合久久之综合久久| dy888午夜| 久久国产日韩欧美精品| 久久免费手机视频| 欧美在线观看视频一区二区三区| 三级理论午夜在线观看| 98精品国产高清在线xxxx天堂| 91精品啪在线观看国产爱臀| 草草草视频在线观看| 国产suv精品一区二区三区| 欧美日韩免费一区二区| 欧美一区二区国产| 性欧美猛交videos| 91久久精品一区二区别| 夜间精品视频| 潘金莲一级淫片aaaaaaa| 亚洲精品网站在线观看| 国产xxxx孕妇| 欧美黑人国产人伦爽爽爽| 亚洲一区二区三区日本久久九| 在线观看18视频网站| 成熟亚洲日本毛茸茸凸凹| 久久久久国产精品夜夜夜夜夜| 欧美videofree性高清杂交| 女囚岛在线观看| 精品欧美日韩在线| 久久国产一二区| 夜夜春很很躁夜夜躁| 欧美日韩国产片| 中中文字幕av在线| 国产精品日韩一区二区| 国产欧美一区二区色老头 | 水莓100在线视频| 国产999精品久久久| 日韩久久综合| 手机在线播放av| 午夜婷婷国产麻豆精品| 精品影院一区| 国产乱人伦真实精品视频| 91精品综合久久久久久久久久久| 日韩欧美中文视频| 亚洲国产精品一区二区www在线| 香蕉视频黄色片| 国产精品久久久久久久7电影| 久久久久久久久国产一区| 亚洲乱妇老熟女爽到高潮的片| 欧美性猛交xxxx| 欧美日韩在线看片| 国产高清自拍99| 日韩精品每日更新| 激情五月婷婷小说| 亚洲人成电影网站色| 国产精品一级在线观看| 成人免费观看cn| 国产精品亲子乱子伦xxxx裸| 亚洲成人777777| 国产99久久精品一区二区永久免费| 91精品一区二区三区综合| 在线观看一区二区三区四区| 欧洲精品中文字幕| 欧美韩日亚洲| 水蜜桃亚洲一二三四在线| 国产a视频精品免费观看| 嫩草影院一区二区三区| 久久久久久久香蕉网| 成人动漫免费在线观看| 黄色在线免费播放| 欧美三区在线观看| 色多多在线观看| 波多野结衣与黑人| 国产精品视频一二|