精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

告別復(fù)雜提示詞!螞蟻新方式讓AI自動理解你的個性化需求

人工智能 新聞
如何實現(xiàn)高情商AI?螞蟻通用人工智能研究中心自然語言處理實驗室提出了一個叫AlignXplore的方法。

相信大家都有這樣一個體驗。

跟AI無論什么對話,感覺都是說空話套話。

圖片圖片

有時候為了讓AI懂自己,許多用戶甚至不得不學(xué)習(xí)復(fù)雜的“提示詞技巧”,手動編寫長長的指令,像是在給AI做“崗前培訓(xùn)”。

圖片

那么如何實現(xiàn)高情商AI?螞蟻通用人工智能研究中心自然語言處理實驗室提出了一個叫AlignXplore的方法——

通過強(qiáng)化學(xué)習(xí),AlignXplore能夠通過深度思考從用戶行為中歸納出他/她的偏好,并且這種對人類偏好的洞察可以隨著用戶行為的變化而動態(tài)更新。

更有趣的是,當(dāng)把歸納好的偏好描述遷移到一個下游對齊模型時,能夠讓這個模型的個性化對齊能力得到顯著提升。

圖片

如何讓AI真正懂你?

如何讓AI真正“懂”你?我們需要讓AI從一個“規(guī)則執(zhí)行者”進(jìn)化成一個“模式發(fā)現(xiàn)者”。

這意味著,它要掌握一種被認(rèn)為是人類智慧核心的能力——歸納推理(Inductive Reasoning)。

圖片

△“千人一面”的對齊方式無法滿足用戶多樣的個性化需求,紅字藍(lán)字是對應(yīng)用戶的偏好描述

事實上,AI早已對演繹推理(Deductive Reasoning)駕輕就熟,具備令人驚嘆的數(shù)學(xué)解題和代碼編寫能力。

你給它一個確定的前提(如“求解二次方程 ax2+bx+c=0”)和一套不變的規(guī)則(求根公式),它就能通過一步步嚴(yán)密的邏輯推演,給出一個唯一、可驗證的正確答案。這是一個典型的“自上而下”(Top-Down)的過程:從普適的公理或規(guī)則出發(fā),推導(dǎo)出一個具體的、必然的結(jié)論。 在這個世界里,沒有模糊地帶,只有對與錯。

而歸納推理則完全相反,它是一個自下而上(Bottom-Up)的過程:它沒有預(yù)設(shè)的“個人說明書”。它的“線索”就是你的每一個行為: 你追問了什么問題,說明你關(guān)心什么;你跳過了哪個回答,說明你不喜歡什么風(fēng)格;你對哪個笑話點了贊,暴露了你的幽默感。它的“任務(wù)”就是從這些海量的、碎片化的行為數(shù)據(jù)中,提煉出專屬于你的互動模式與偏好規(guī)律。通過歸納推理,AI有潛力成為你的“知心姐姐”,主動拼湊出一個完整的你。

舉個例子,讓我們來扮演一次AI知心姐姐,看看它是如何通過兩次看似無關(guān)的對話,就精準(zhǔn)捕捉到你的“潛臺詞”的:

  • 第一次交互:你問“什么是人工智能?它在商業(yè)和生活中是怎么用的?”。AI會立刻開始在幕后推理你的偏好:“你可能對AI技術(shù)有特別的興趣,但似乎更關(guān)心實際應(yīng)用,也許是商業(yè)導(dǎo)向”。
  • 第二次交互:你想學(xué)習(xí)冥想,在兩個候選回答中,你選擇了提供具體步驟的那個,而不是闡述冥想哲學(xué)的回答。AI會立刻更新它對你偏好的理解:“你的偏好是獲取能解決眼前需求的、務(wù)實的指導(dǎo),而不是理論探討。”

這種漸進(jìn)式的學(xué)習(xí)和優(yōu)化,讓AI的“記憶”不再短暫。隨著一次次的交互,它會不斷收集新的線索,驗證并修正之前的假設(shè),對你的“人物畫像”進(jìn)行一次又一次的精修。最終,它不再是被動回答問題的機(jī)器,而是在主動地、持續(xù)地學(xué)習(xí)和理解你是誰。

這,就是我們通向真正個性化AI的第一步。

AlignXplore

AlignXplore的訓(xùn)練包括兩個階段。

圖片

第一階段:冷啟動訓(xùn)練(Cold-start Training)——拜師學(xué)藝

研究團(tuán)隊首先引入一個更強(qiáng)大的AI作為“導(dǎo)師模型”圖片。這個導(dǎo)師會生成大量高質(zhì)量的“教學(xué)案例”。對于每個用戶的行為信號集合圖片圖片會生成多組候選的推理鏈r和相應(yīng)的偏好描述d利用獎勵函數(shù)R(r,d)進(jìn)行篩選來獲取高質(zhì)量數(shù)據(jù)圖片。通過在圖片上進(jìn)行SFT,實現(xiàn)偏好歸納模型的冷啟動。

圖片

其中圖片代表可能存在的歷史偏好,而G是為每個實例生成的候選樣本數(shù)量。這里獎勵函數(shù)定義為:

圖片

其中,圖片是下游大語言模型R對回復(fù)的偏好打分函數(shù)。這個通用的獎勵框架可以被實例化為兩種具體的獎勵函數(shù),用于模型的訓(xùn)練與評估:

1、圖片(基于偏好判斷的獎勵)

R作為一個偏好判斷模型,直接評估在給定推斷出的偏好d后“圖片圖片更好”的概率,最大化與用戶真實偏好的一致性:

圖片

圖片提供了更穩(wěn)定和有效的訓(xùn)練信號,是AlignXplore在訓(xùn)練和評估中采用的核心獎勵函數(shù)。

2、圖片(基于生成概率的獎勵)

R作為一個回復(fù)生成模型,衡量在加入偏好描述d前后,模型生成較優(yōu)回復(fù)圖片與生成較差回復(fù)圖片間的對數(shù)概率差值是否有提升:

圖片

第二階段:強(qiáng)化學(xué)習(xí)(Reinforcement Learning)——實戰(zhàn)修行

在這一階段,采用GRPO算法訓(xùn)練,模型會針對用戶的行為,嘗試生成多種不同的推理路徑和偏好結(jié)論圖片。隨后,系統(tǒng)會根據(jù)這些結(jié)論的準(zhǔn)確性給予“獎勵”或“懲罰”。通過這種不斷的試錯和優(yōu)化,模型學(xué)會了如何將初步的分析提煉成更精準(zhǔn)、更具指導(dǎo)性的判斷。

優(yōu)化策略定義如下:

圖片

流式偏好推斷機(jī)制

AlignXplore模型支持流式偏好推斷機(jī)制,即不再需要反復(fù)回看用戶冗長的歷史記錄,而是像處理一條源源不斷的數(shù)據(jù)流一樣,實時、增量地更新對用戶的理解——就像它在之前的例子中發(fā)現(xiàn)用戶“務(wù)實導(dǎo)向”的風(fēng)格一樣。

這種“流式”設(shè)計帶來的好處是顯而易見的:

首先,它大大提高了生成效率;

其次,它極為靈活,當(dāng)用戶從休閑模式切換到工作狀態(tài)時,它能迅速迭代出一個新的“工作版”偏好,而不是固執(zhí)地用舊眼光看用戶。這才是真正能跟上用戶節(jié)奏的動態(tài)進(jìn)化系統(tǒng)。

實驗結(jié)果

在域內(nèi)測試集AlignX_test和域外測試集P-Soups上,AlignXplore模型在個性化對齊任務(wù)上取得了顯著的成功,相較于基座模型DeepSeek-R1-Distill-Qwen-7B平均提升了15.49%。

圖片

△AlignXplore與各種推理/非推理模型在域內(nèi)外數(shù)據(jù)集上的表現(xiàn)

更重要的是,它展現(xiàn)了強(qiáng)大的綜合能力:

高效性: 即使互動歷史變得非常長,流式推理機(jī)制也能保持穩(wěn)定的響應(yīng)速度和準(zhǔn)確率,不會像傳統(tǒng)方法那樣需要每次編碼所有行為信號致使越來越慢。

圖片

△隨著互動的進(jìn)行,流式推理機(jī)制下的響應(yīng)速度和準(zhǔn)確率都保持穩(wěn)定

泛化能力:它不僅能處理特定的反饋數(shù)據(jù),還能從用戶發(fā)布的帖子user-generated content (UGC)等不同形式的內(nèi)容中學(xué)習(xí),并且其推斷出的偏好也能成功地應(yīng)用于與訓(xùn)練時不同的下游模型,包括QwQ-32B、DeepSeek-R1-671B等。

圖片

△泛化性實驗

魯棒性:即使用戶的偏好發(fā)生改變甚至反轉(zhuǎn),AlignXplore也能靈活適應(yīng),不會產(chǎn)生劇烈的效果波動。

圖片

△即便反轉(zhuǎn)初始行為信號的偏好,流式推理機(jī)制也能讓模型靈活調(diào)整偏好推斷

總結(jié)

該工作第一作者為人大高瓴一年級博士生李嘉楠,目前在螞蟻實習(xí);螞蟻通用人工智能研究中心自然語言處理實驗室關(guān)健、武威為共同第一作者、通訊作者。

AlignXplore是大模型個性化路上的一個全新的嘗試。在SOTA結(jié)果的背后,這項研究其實有很多思考:

  • 在智力上限被一波又一波推高的當(dāng)下,如何規(guī)模化訓(xùn)練大模型“情商”是一個沒有得到足夠關(guān)注卻又十分重要的問題。畢竟誰會拒絕一個既聰明又有溫度的AI呢?
  • 深度思考下的長思維鏈?zhǔn)谴竽P椭悄苣芰Φ闹饕苿恿ΑI疃人伎急旧硐木薮螅敲慈绻挥脕硭⒎郑遣皇怯悬c浪費呢?相比于結(jié)果,推理過程中產(chǎn)生的知識是不是更有價值呢?AlignXplore可以看作是推理知識在用戶理解領(lǐng)域進(jìn)行遷移應(yīng)用的一個嘗試。畢竟相對于艱深的數(shù)學(xué)知識,用戶理解知識更容易被看懂,也更容易落地。
  • 如果客觀問題都很快會被AI解決,那么主觀問題該怎么辦呢?這個世界上到底是客觀問題多還是主觀問題多呢?無論如何,研究團(tuán)隊認(rèn)為個性化是通往主觀世界的一條重要通道,而AlignXplore是在這條通道上的一次大膽嘗試。期待未來有更多相關(guān)研究能夠涌現(xiàn)。
責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2015-01-14 14:43:31

豌豆莢移動搜索應(yīng)用內(nèi)搜索

2020-12-04 05:56:19

Vscode 代碼 編輯器

2024-08-15 13:22:17

2015-11-09 10:12:08

大數(shù)據(jù)個性化推薦

2020-06-28 07:00:00

推薦系統(tǒng)智能商務(wù)服務(wù)平臺

2010-09-08 21:45:52

企業(yè)郵箱網(wǎng)絡(luò)通信263郵箱

2022-11-01 07:19:45

推薦系統(tǒng)非個性化

2023-03-05 21:11:44

微軟Windows 1

2023-10-17 08:42:13

ChatGPT定制指令

2023-03-21 12:46:30

智慧城市人工智能大數(shù)據(jù)

2020-08-04 08:10:47

人工智能

2018-08-20 19:35:28

AI教育個性化教育

2021-11-19 22:45:14

Windows系統(tǒng)數(shù)據(jù)

2011-01-20 10:19:21

PowerShell個性化

2025-03-24 10:37:15

2025-08-04 07:53:59

2025-08-07 09:27:17

CursorAI編程

2025-07-23 07:57:53

2017-11-22 09:24:00

點贊
收藏

51CTO技術(shù)棧公眾號

亚洲成人黄色网| 亚洲乱码一区二区三区在线观看| 2019av中文字幕| 老头老太做爰xxx视频| 日本a人精品| 亚洲国产日日夜夜| 亚洲精品一品区二品区三品区| a视频免费在线观看| 亚洲一区区二区| 久久精品最新地址| 女~淫辱の触手3d动漫| 成人永久在线| 日本道免费精品一区二区三区| 99热一区二区三区| 黄色的视频在线免费观看| 国产成人综合在线| 国产精品欧美久久久| 日本三级欧美三级| 五月婷婷六月综合| 亚洲天堂第一页| 一边摸一边做爽的视频17国产| 日本h片久久| 岛国av一区二区三区| 亚洲黄色网址在线观看| 番号集在线观看| 91麻豆精品视频| 动漫美女被爆操久久久| 一级淫片免费看| 首页国产欧美久久| 97av在线视频免费播放| 18精品爽视频在线观看| 一本精品一区二区三区| 一色桃子一区二区| 午夜理伦三级做爰电影| 欧美调教在线| 亚洲激情在线观看视频免费| 欧美xxxx日本和非洲| 蜜桃在线一区| 欧美一级国产精品| 中文字幕亚洲影院| 五月天色综合| 欧美日韩高清一区二区| 日韩欧美在线免费观看视频| 在线观看v片| 欧美日韩国内自拍| 日本成年人网址| 成人免费看视频网站| 精品国产999| 欧美日韩精品在线一区二区 | 成人性生交大片免费看中文| 91精品中国老女人| 91好色先生tv| 狠狠色综合日日| 91久久中文字幕| 国产又粗又猛又爽又黄的视频一| 美国av一区二区| 国产精品一区二区三区成人| 伊人亚洲综合网| 免费av网站大全久久| 国产精品一区二区性色av| 国产天堂第一区| 美女一区二区三区在线观看| 成人激情在线播放| www.日韩高清| 不卡一区二区三区四区| 国产一区二区在线观看免费播放| 视频二区在线观看| 久久久久久夜精品精品免费| 污视频在线免费观看一区二区三区| 9i精品一二三区| 亚洲色大成网站www久久九九| 成人一区二区av| 美女精品视频| 色婷婷综合久色| 天天干天天操天天玩| 精品视频在线播放一区二区三区| 精品久久久网站| 欧美 日本 国产| 日韩黄色大片网站| 九色精品美女在线| 亚洲国产成人无码av在线| 日韩高清一级片| 亚洲a级在线观看| 性感美女视频一二三| 亚洲国产高清aⅴ视频| 欧美精品一区二区性色a+v| 成人免费高清观看| 欧美无乱码久久久免费午夜一区| 天天干天天曰天天操| 里番精品3d一二三区| 一区二区三区四区精品| 欧美日韩在线视频免费| 久久一区二区三区四区五区| 亚洲free嫩bbb| 亚洲三级黄色片| 1024国产精品| 欧美激情国产精品日韩| 精品午夜av| 亚洲性视频网址| 国产一级做a爰片在线看免费| 日本中文一区二区三区| 国产精品12| 精品麻豆一区二区三区| 欧美日韩国产精品一区| 欧美视频亚洲图片| 国产成人手机高清在线观看网站| 美女视频黄免费的亚洲男人天堂| 丰满人妻老熟妇伦人精品| 国产一区二区女| 亚洲精品在线免费| 国产乱码午夜在线视频| 91精品国产免费| 娇妻被老王脔到高潮失禁视频| 国模大胆一区二区三区| 国产精品入口夜色视频大尺度| 乱精品一区字幕二区| 亚洲欧美另类小说视频| 国产高潮免费视频| 色愁久久久久久| 欧美极品美女电影一区| 6—12呦国产精品| 国产欧美一区二区精品婷婷 | 日韩高清不卡一区二区三区| 国产精品久久久对白| 午夜激情视频在线观看| 欧美综合天天夜夜久久| 短视频在线观看| 亚洲福利国产| 国产亚洲福利社区| 黄色羞羞视频在线观看| 日韩视频免费观看高清完整版| 亚洲区一区二区三| 久久99精品久久久| 中文字幕一区二区中文字幕| 亚洲成av在线| 国产一区二区成人| 五月婷婷六月婷婷| 久久亚洲一区二区三区明星换脸 | 婷婷社区五月天| 日本三级亚洲精品| 日产国产精品精品a∨| 韩国精品一区| 精品香蕉一区二区三区| 日韩在线视频免费播放| 97aⅴ精品视频一二三区| 国产91xxx| 欧美挤奶吃奶水xxxxx| 97免费视频在线| 天堂在线视频网站| 欧美日韩一区免费| 日本xxxxxxxxx18| 日韩精品乱码av一区二区| 欧美日韩另类综合| 日本一区二区三区视频在线| 色悠悠久久88| 国产又黄又粗又猛又爽| 亚洲精品国产精品乱码不99| 又黄又色的网站| 99这里有精品| 欧美久久在线| 97人人做人人爽香蕉精品| 爽爽爽爽爽爽爽成人免费观看| 在线视频播放大全| 一区二区三区在线视频免费观看| 日本少妇一区二区三区| 亚洲高清av| 日本一区二区视频| 日韩毛片免费看| 欧美激情国产日韩精品一区18| 国产香蕉在线观看| 欧美怡红院视频| 亚洲综合网在线| 99re热这里只有精品免费视频| 成人黄色片视频| 亚州av乱码久久精品蜜桃| 粉嫩精品一区二区三区在线观看 | 黑丝一区二区三区| 久久精品magnetxturnbtih| 欧美aaa大片视频一二区| 蜜月aⅴ免费一区二区三区| 秋霞网一区二区| 欧美性受xxxx黑人xyx| 欧美精品xxxxx| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 国产亚洲精品bv在线观看| 日本不卡一区| 日韩中文字幕在线一区| 欧美最猛性xxxxx免费| 黄在线免费观看| 国产丝袜高跟一区| 国产普通话bbwbbwbbw| 欧美日韩一区二区在线| 欧美做爰爽爽爽爽爽爽| 久久亚洲精华国产精华液| 中文字幕第一页在线视频| 亚洲综合99| 在线视频精品一区| 亚洲人成网亚洲欧洲无码| 91亚洲一区精品| 人人鲁人人莫人人爱精品| 久久躁狠狠躁夜夜爽| 男女污污视频在线观看| 日韩欧美电影一区| 中文字幕乱伦视频| 午夜精品久久久久久久| 成人在线观看小视频| 国产无一区二区| 在线免费观看a级片| 国产精品资源在线看| 国产原创精品在线| 老**午夜毛片一区二区三区 | 性欧美videos| 国产日韩高清在线| 粉嫩av懂色av蜜臀av分享| 国产成人免费在线观看不卡| 自拍偷拍21p| 久久最新视频| 国内外成人激情视频| 亚洲一级一区| 亚洲理论电影在线观看| 在线中文一区| 亚洲第一页在线视频| 久久精品国产www456c0m| 欧美一区二区三区四区五区六区| 国产精品自在线拍| 91丨九色丨国产| 日韩第一区第二区| 91精品中文在线| 色成人综合网| 91精品综合视频| 福利一区三区| 亚洲aⅴ男人的天堂在线观看| 日韩国产大片| 成人黄色激情网| 国产精品一区二区三区av| 国产精品久久中文| 影音成人av| 国产精品免费在线免费| 欧美一级二级视频| 国产免费一区二区三区香蕉精| 姬川优奈av一区二区在线电影| 91成人在线视频| 亚洲十八**毛片| 国产成人涩涩涩视频在线观看| 日韩伦理福利| 日韩暖暖在线视频| 日韩另类视频| 国产成人精品久久二区二区91| 亚洲美女尤物影院| 国产福利视频一区| a屁视频一区二区三区四区| 国产精品视频中文字幕91| 美女久久久久久| 91在线高清视频| 97久久亚洲| 精品一区二区视频| 欧洲激情视频| 亚洲国产精品影视| 欧美特黄一区| 日韩精品一区二区三区色欲av| 日本免费新一区视频| 天天操狠狠操夜夜操| 国产精品一区二区男女羞羞无遮挡| 一二三级黄色片| 成人国产精品免费观看视频| 久久精品成人av| 国产精品视频一区二区三区不卡| 啪啪一区二区三区| 亚洲韩国精品一区| 中文字幕av影院| 欧美日韩精品电影| 亚洲av无码一区二区三区dv| 亚洲精品国产电影| 成人福利在线| 欧美乱大交xxxxx| 在线天堂新版最新版在线8| 国产精品偷伦视频免费观看国产| 日韩精品一区二区三区中文在线| 好吊色欧美一区二区三区| 不卡一区2区| 国产乱子伦精品无码专区| 噜噜噜91成人网| 性xxxxxxxxx| 国产欧美日韩综合精品一区二区| 少妇久久久久久被弄高潮| 色综合欧美在线视频区| 国产美女三级无套内谢| 日韩精品亚洲元码| 精精国产xxxx视频在线| 欧美一级高清免费播放| 国产区一区二| 欧美韩国日本精品一区二区三区| 天天久久综合| av片中文字幕| 懂色av噜噜一区二区三区av| 我想看黄色大片| 亚洲第一av色| 一级特黄色大片| 亚洲欧美日韩中文视频| 日本不卡影院| 国产日韩在线视频| 美女少妇全过程你懂的久久| 成人在线观看www| 日韩电影在线一区二区| xfplay5566色资源网站| 日韩美女视频19| 久草视频在线免费| 精品在线欧美视频| 成人超碰在线| 4444kk亚洲人成电影在线| 欧美亚洲国产精品久久| 青青草国产精品视频| 国产黑丝在线一区二区三区| www中文在线| 一本色道a无线码一区v| 亚洲乱色熟女一区二区三区| 色七七影院综合| 蜜桃视频成人m3u8| 狼狼综合久久久久综合网| 海角社区69精品视频| 在线能看的av网站| 中文av字幕一区| 欧美人一级淫片a免费播放| 精品爽片免费看久久| 国产伦子伦对白在线播放观看| 亚洲一区二区自拍| 希岛爱理一区二区三区| 美女在线视频一区二区| 国产女主播一区| 欧美在线视频精品| 国产一区二区三区在线看| 怡红院成人在线| 日本在线观看一区二区| 久久国产日韩| 久久久久久久久久久久| 欧美在线999| 91啦中文在线| 国产欧美一区二区三区在线 | 国产黄色激情视频| 国产69精品久久久久777| www青青草原| 精品久久五月天| 国产理论在线| 欧美日韩视频在线一区二区观看视频 | 99久久久精品| 黄色一级片免费在线观看| 日韩精品999| 欧美成人影院| 亚洲欧洲一区二区| 国内成人免费视频| 青娱乐av在线| 亚洲激情视频在线播放| 偷拍自拍在线看| 视频一区二区综合| 久久国产夜色精品鲁鲁99| 成人涩涩小片视频日本| 日韩一级免费观看| www.8ⅹ8ⅹ羞羞漫画在线看| 精品不卡在线| 久久亚洲视频| 亚洲天堂网av在线| 欧美精品一区二区三区一线天视频| 国产777精品精品热热热一区二区| 麻豆一区区三区四区产品精品蜜桃| 久久国产日韩| 日韩av手机在线免费观看| 欧美成人精品福利| 在线一区av| 国产精品av免费| 99久久精品国产观看| 波多野结衣电车痴汉| 久久亚洲欧美日韩精品专区 | 涩涩日韩在线| 国产一级精品在线| 日本免费观看视| 色悠悠国产精品| 精品国产午夜肉伦伦影院| 人妻丰满熟妇av无码区app| 中文字幕亚洲视频| 黄色av免费观看| 国产精品男人的天堂| 国产精品mv在线观看| 国产性生活毛片| 欧美日韩在线综合| 国产传媒在线观看| 在线看成人av电影| 91免费观看视频在线| 国产精品羞羞答答在线| 2019中文字幕免费视频| 午夜影院欧美| 免费在线观看污| 欧美大胆人体bbbb| 国产激情久久| 欧美三级一级片| 亚洲精品va在线观看| 成年人在线看| 国产麻豆日韩| 狠狠色丁香九九婷婷综合五月| 黄色片网站在线免费观看| 欧美www在线|