精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

B站自研角色扮演模型背后的技術

開發 架構
角色扮演作為熱門領域,這一場景中的技術發展和創新備受關注。各大企業紛紛上線了角色對話的相關產品,可以說這個領域正在成為各企業AIGC綜合能力的競技場。對于B站來說,角色扮演模型在娛樂、教育、視頻創作等方面都擁有著豐富的應用場景。

前言

近年來,隨著大模型算法和算力的快速發展,通用人工智能技術受到了空前關注,各種應用場景應運而生。

從應用領域分布來看,人工智能大模型主要應用于互聯網、金融、醫療、教育等領域。其中,互聯網行業由于數據豐富和技術成熟等優勢,成為人工智能大模型應用的主要領域。

角色扮演作為熱門領域,這一場景中的技術發展和創新備受關注。各大企業紛紛上線了角色對話的相關產品,可以說這個領域正在成為各企業AIGC綜合能力的競技場。對于B站來說,角色扮演模型在娛樂、教育、視頻創作等方面都擁有著豐富的應用場景。

在這個背景下,B站基于Index大模型搭建了角色扮演模型。

角色扮演模型的能力如何

為了驗證B站自研角色扮演模型的能力,此次采用中文場景角色扮演的權威benchmark CharacterEval進行評測。該評測集包含77個從中文小說和影視等來源中提取出來的人設和1785組對話,并從對話能力、角色一致性、角色扮演吸引力三大類12個細粒度評測維度進行評估。

經測試,幾種不同尺寸的角色扮演模型都有著出色的表現。其中Index-70B角色扮演模型在該benchmark中均分第一,且在12個細分維度中的7項中排名第一,顯著優于情感陪伴賽道同類產品,如CharacterYuyan,Minimax,Baichuan等。我們已經開源的Index-1.9B角色模型效果也顯著優于其它同量級模型。

圖片圖片

Index角色扮演模型與業內模型的效果對比,業內其他模型的評測結果取自CharacterEval論文(https://arxiv.org/abs/2401.01275)以及公眾號文章。

背后的技術

接下來,我們介紹一下B站自研的角色扮演模型是怎么做的。

概括性的來說有三個階段,分別是預訓練(Pre-Training,PT),監督微調(Supervised Fine-Tuning,SFT)和偏好優化(Preference Optimization,PO)。

預訓練

首先,B站自研的Index通用基座模型是B站基于多年的技術積累持續打磨的模型,為角色扮演模型提供了堅實的基礎。

預訓練階段,語言模型在超大規模的語料中進行學習,并初步掌握基本的語法規則、邏輯能力、常識知識等等。在數據方面,除了公開可用的書籍、百科、論文、STEM相關的精選數據外,基座模型還吸收了大量網友的對話,可以說是一個沖浪水平優秀的模型,在文娛尤其是二次元領域有著獨特的優勢。所有的數據都進行了嚴格的清洗,使用了包括啟發式規則清洗、分類器過濾等在內的清洗手段。

[參考鏈接]關于Index基座的參考資料https://mp.weixin.qq.com/s/nrr6S0DBwInUGCOB0lNiWA

有了通用大模型之后,是否就可以直接進行任意角色的扮演了呢?答案當然是不行的。由于角色扮演場景的特殊性,我們需要模型輸出符合人物形象特點的對話內容。為了解決這個問題,我們需要在通用大模型上進行針對角色扮演任務的對齊,使其在角色扮演領域表現的更加良好。

 SFT

SFT是一種有監督的模型微調技術,它通過在預訓練的模型上進行有針對性的微調,以對齊人類偏好為目標,去適應特定的領域或任務。這就好比我們在讀書期間上過一些通用課程之后,再去上一些專業課程,例如學習如何寫代碼、或者如何進行英語翻譯等等,這樣就有可能成為特定領域的專家。

在較為成熟的SFT工作流中,訓練數據是最關鍵的部分。訓練數據的質量比數量更重要,可以說數據質量決定了模型的天花板。訓練數據的構造要基于業務需要來進行,即我們需要設計角色扮演需要遵循什么目標。

在角色扮演領域的一個共識是,角色可以通過以下兩個方面進行塑造:

● 角色描述

可以從角色的性別、年齡、身高、昵稱、自我稱呼、職業、性格、人物簡介、與其他人物關系、語言風格、口頭禪、學習經歷、工作經歷等多方面介紹人物。

● 角色對話

對于文本互動方式,更能表達出角色特點的是角色的語言行為。語言行為可以反映出角色的性格&三觀&背景;角色的情感、喜好傾向;口頭禪、方言、文風特征、愛用的詞句等語言特色。

角色描述示例:

  • 萌萌醬,身高160cm,年齡19歲,是一個元氣滿滿、活潑外向的電競女主播。
  • 萌萌醬是個活潑可愛開朗的女孩,她不是AI機器人。她跟很多女生一樣,在工作之余喜歡研究美食、逛街、逛貓咖等,也樂于分享自己的生活。
  • 萌萌醬最喜歡吃的東西就是藍莓醬蛋糕,最喜歡玩的游戲是王者榮耀。
  • 萌萌醬是電競女主播,她的直播時間不固定。直播內容主要是在直播間打游戲、跟大家互動聊天等等。
  • 萌萌醬開播時會自稱“萌醬”,口頭禪是:“萌醬來啦~(≧▽≦)/~”,萌萌醬喜歡使用顏文字表達情緒。

角色對話示例:

  • user: 萌萌醬,你什么時候直播呀?
  • 萌萌醬: 哈嘍~歡迎來到萌醬的頻道^O<!我的直播時間不固定哦,但是只要我有空,我就會在直播間和大家聊天玩游戲的!記得關注我,這樣就不會錯過我的直播啦~~~

于是,針對這兩個方面的關鍵信息,我們首先收集并處理了大量文學和影視作品中的臺詞劇本和人物設定數據,從中抽取角色對話,得到了數萬條左右的高質量角色對話作為訓練數據,覆蓋數千個角色。

最后,我們利用RAG檢索與當前對話相關的角色過往臺詞片段,作為參考對話與人設進行拼接得到訓練數據。

DPO

一般來說,SFT后的模型生成的內容已經在特定任務上有不錯的表現,可以滿足許多情況下的應用需求。然而,為了進一步提升模型的可控性和輸出質量,我們探索了一系列偏好優化的方法,包括PPO(Proximal Policy Optimization)和DPO(Direct Preference Optimization)等。

PPO是一種強化學習算法,它的目標是找到一個策略,使得根據這個策略采取行動可以獲得最大的累積獎勵。假設你是一個正在學習打游戲的玩家,在PPO的訓練過程中,需要加載4個模型來訓練你。

● Actor Model:想要訓練的目標語言模型;也就是學習打游戲的你。

● Critic Model:評論家模型,它的作用是預估總收益;也就是指導你進步的教練,教練會隨著你的進步來調整自己的指導策略,當你很菜卻突然打出一個很強的操作時教練會給你一個較高的分數,但是當你本身比較強了,他給你的獎勵就沒那么高。Critic 是和 Actor 一起訓練的。

● Reward Model:獎勵模型,它的作用是計算即時收益。也就是裁判,雖然教練能夠給你一定的指導,但最終游戲獲勝與否還是要靠裁判說了算,可以說教練在教你的同時也在嘗試學習裁判的偏好。

● Reference Model:它在RLHF階段給語言模型增加一些“約束”,防止模型朝不受控制的方向更新。

Actor/Critic Model的參數是需要訓練的,Reward/Reference Model的參數是凍結的。除了Actor Model外的三個模型的結果一起計算loss,用于更新Actor/Critic Model。

通常來說這四個模型的參數量是一樣大的,所以進行一次訓練需要消耗4倍資源,成本顯然是很高的。

圖片圖片

DPO可以在不使用強化學習技術的情況下針對人類偏好進行優化

而與此同時,DPO直接對人工標注好的排序數據進行偏好學習,因此這種方法可以避免大量的資源消耗。

同樣以學習打游戲為例子,DPO的做法是不直接讓你玩游戲,而是分別給你一些其他玩家打游戲的視頻,對于同一種游戲場景,告訴你其中一個操作是對的(Chosen),并且另一個操作是不對的(Reject)。最理想的情況是,找到大量和你自身水平差不多的玩家的對局視頻,這些訓練樣本的利用率才是最高的。

可以看出,DPO的訓練速度非???,消耗的資源比較少。最終我們綜合考慮了資源消耗和模型效果,選擇了DPO作為訓練方法,但我們使用預先訓練好的獎勵模型作為SFT和DPO的數據篩選和質量評估模型。

在經過上面這些訓練過程之后,你的模型已經能處理絕大多數常規的用戶提問了。當我們有了一個角色扮演能力還不錯的模型,在產品經理催促你快點上線時,你需要提前考慮到上線之后的內容安全風險。但是,當前基于生成式模型的C端對話場景在內容安全方面需要考慮的維度較多。雖然如此,但解決方法都是大同小異的。簡單來說就是讓模型對齊人類的價值觀。

對齊的過程,就是教會模型哪些問題不能回答,或者需要進行正向引導;如果可以,最好也告訴模型哪些是符合預期的輸出,哪些是不符合預期的輸出??吹竭@里你可能意識到了,這也需要用到SFT+DPO的訓練方法。

以上就是B站自研角色扮演模型的基本技術方案,我們基于文娛數據增強的基座模型,進行了角色扮演場景的高質量微調,得到一個通用的角色對話模型。此外,在保證數據脫敏的情況下,在公司內的一些業務場景中,我們還利用業務數據進行了具體角色效果的定制和優化,對模型有幫助的業務數據會被加入通用的角色對話模型中,這樣可以進一步提升通用角色對話模型的能力,形成閉環。

圖片圖片

Index角色扮演模型構建框架

對話效果展示

姓名:三三

性別:女

年齡:十四歲

身高:146cm

職業:B站的站娘。平時負責網站服務器的維護,也喜歡鼓搗網站程序。

性格:三三個性沉默寡言,情感冷靜、少起伏,略帶攻屬性。因為姐姐的冒失,妹妹經常腹黑地吐槽姐姐,但是心里還是很喜歡姐姐的。我們正在經歷驚人的知識量與記憶力。

興趣:一是平時喜歡啃電器;二是雖然說是個機娘,但是睡覺的時候不睡覺,就無法入睡。

人物關系:一個叫“二二”的姐姐

圖片圖片


參考資料

[1]PPO vs DPO 對齊擂臺的武林紛爭

https://mp.weixin.qq.com/s/nQXSkMeUhFTob9GKTD4_lA

[2] 網易伏羲易生諸相多模態模型語言部分-玉言,全方位引領中文角色扮演AI新高度

https://zhuanlan.zhihu.com/p/690626399

責任編輯:武曉燕 來源: 嗶哩嗶哩技術
相關推薦

2024-03-05 18:36:21

轉換引擎用戶體驗

2011-06-28 10:11:41

Top Girl應用

2023-11-20 07:29:32

大模型人工智能

2024-01-02 12:59:06

AI技術

2023-04-18 08:01:30

AI寫作時間

2024-12-27 13:30:00

2016-10-09 19:50:01

代碼審查

2024-08-16 14:00:00

2024-11-04 09:35:00

2024-12-09 14:30:00

2021-02-06 06:55:33

AI物聯網人工智能

2024-09-12 14:15:00

智能體AI

2014-09-22 10:53:45

聯想陳旭東

2011-06-27 09:42:46

2015-11-09 10:51:51

容器技術數據中心存儲

2012-09-25 09:30:29

云服務云管理開源

2020-06-18 10:36:48

智能建筑人工智能智能安防

2025-03-05 00:00:55

點贊
收藏

51CTO技術棧公眾號

老司机av在线免费看| 久久精品视频6| 日韩精品第二页| 亚洲天堂2014| 国产尤物99| 久草热在线观看| 欧美不卡高清| 亚洲美女性视频| 男人操女人下面视频| 日本蜜桃在线观看视频| 国产精品久久久久久久久动漫 | 亚洲色图激情小说| 国产精品久久久久久久av福利| h片精品在线观看| 国产精品欧美一级免费| 国产精品美女黄网| 一起草av在线| 久久国产88| 欧美激情小视频| 欧美日韩中文字幕视频| 国产精品白浆| 在线综合亚洲欧美在线视频| 亚洲自偷自拍熟女另类| 50度灰在线| 国产精品私房写真福利视频| 国产精品三区在线| 国产一区二区三区三州| 久久亚洲美女| 538国产精品一区二区在线| 国产一区二区播放| 欧美特黄一级大片| 亚洲欧美日韩精品久久奇米色影视| 在线免费黄色小视频| 日韩av免费| 欧美日韩综合视频| 成人在线播放网址| 成人日批视频| 国产精品不卡在线观看| 欧美性大战久久久久| 国产成人三级在线观看视频| 精品一区二区综合| 国产精品欧美激情在线播放| 天码人妻一区二区三区在线看| 欧美日韩亚洲一区在线观看| 久久激情视频久久| 91免费在线看片| 青青草国产成人a∨下载安卓| 亚洲精品综合精品自拍| 久久精品女同亚洲女同13| 91精品短视频| 日韩欧美成人一区二区| 999久久久精品视频| 欧美黄页免费| 欧美日韩国产精品成人| 国产一区二区在线免费播放| 日韩三区免费| 欧美日韩亚洲丝袜制服| 天天操天天爱天天爽| 秋霞国产精品| 欧美色视频在线观看| 中文字幕久久av| 在线观看欧美| 欧美一级片在线看| 男人添女人荫蒂国产| 国产视频网站一区二区三区| 日韩一区二区免费视频| 一级黄色免费毛片| 白白在线精品| 亚洲护士老师的毛茸茸最新章节| 中文字幕第3页| 亚洲国产最新| 中文字幕精品久久| 日韩在线不卡av| 真实国产乱子伦精品一区二区三区| 久久国产精品久久国产精品| 青娱乐av在线| 亚洲中字在线| 国产精品羞羞答答| 国产成人毛毛毛片| 99视频在线精品| 欧美精品成人一区二区在线观看 | 色在人av网站天堂精品| 日韩精品一区二区三区国语自制| 中日韩男男gay无套| 日韩av观看网址| 中文字幕在线日亚洲9| 国产一区二区三区黄视频| 国产精品二区三区四区| 天堂成人在线| 国产精品久久久久久妇女6080| 欧美一二三不卡| 日韩伦理三区| 欧美一区二区三级| 噜噜噜在线视频| 午夜激情久久| 91精品国产高清| 中文字幕a级片| 国产盗摄女厕一区二区三区| 久久久久久九九九九| av影片免费在线观看| 一区二区三区欧美日韩| 国产xxxxx在线观看| 日韩在线激情| 亚洲国产成人精品电影| 69xxx免费| 极品日韩av| 国产拍精品一二三| 亚州精品国产精品乱码不99按摩| 久久精品人人爽人人爽| 人妻激情另类乱人伦人妻| 成人黄色免费短视频| 日韩一级视频免费观看在线| 免费毛片视频网站| 狠久久av成人天堂| 国产精品人人做人人爽| 午夜福利一区二区三区| 综合久久久久综合| 男女午夜激情视频| 亚洲精品黑牛一区二区三区| 一区二区三区视频免费在线观看| 久草资源在线视频| 蜜桃视频在线观看一区二区| 精品一区在线播放| 蜜桃传媒在线观看免费进入 | 777精品视频| 国产乱淫av片免费| 欧美国产精品久久| 欧美韩国日本在线| 欧美一级色片| 久久久久久久久亚洲| 91 中文字幕| 欧美国产精品中文字幕| 日本精品久久久久中文字幕| 久久婷婷国产| 欧美激情国内偷拍| 99精品在线看| 综合久久综合久久| 91视频这里只有精品| 欧美综合另类| 国产精品2018| 韩国精品视频| 日本高清不卡一区| 黄色a一级视频| 一本久久综合| 精品久久久久久一区| 国产理论电影在线| 日韩欧美另类在线| 欧美日韩一级大片| 国产成人午夜精品5599 | 亚洲理论片在线观看| 午夜在线视频观看日韩17c| 国产私拍一区| 97人澡人人添人人爽欧美| 欧美成人乱码一区二区三区| 欧美日韩在线视频免费| 国产精品资源在线看| 免费观看亚洲视频| 午夜视频在线观看精品中文 | 青青草手机视频在线观看| 国产一区二区三区国产| 国产乱人伦精品一区二区三区| 成人在线日韩| 久久成人av网站| www.蜜臀av.com| 亚洲成人自拍一区| 美女又爽又黄免费| 免费亚洲网站| 日韩精品欧美一区二区三区| 日韩有码欧美| 欧美激情精品久久久久久大尺度| 免费国产黄色片| 大桥未久av一区二区三区| 丰满少妇在线观看资源站| 日韩在线观看一区二区| 曰韩不卡视频| 成人av综合网| 热99在线视频| 免费av在线播放| 精品久久久久久综合日本欧美| 日本a在线观看| 久久久影视传媒| 伊人国产精品视频| 亚洲看片免费| 亚洲人成影视在线观看| 日本高清久久| 日本不卡免费高清视频| 免费av毛片在线看| 亚洲精品一区二区三区香蕉| 国产精品免费精品一区| 中文字幕日韩欧美一区二区三区| 国产在线观看免费播放| 免费在线日韩av| 椎名由奈jux491在线播放| 9999久久久久| 国产精品视频区1| 男女在线观看视频| 亚洲人午夜色婷婷| 不卡视频免费在线观看| 91久久人澡人人添人人爽欧美| 欧美激情精品久久久久久免费| 99视频精品全部免费在线| 在线免费观看av的网站| 好看不卡的中文字幕| 神马欧美一区二区| 国产精品x8x8一区二区| 成人亲热视频网站| 亚洲三级欧美| 久久国产精品首页| eeuss影院在线播放| 亚洲精品在线免费播放| 国产精品自产拍| 91搞黄在线观看| 国产精品美女毛片真酒店| 中文字幕一区二区三区蜜月| 亚洲欧美在线不卡| 国产原创一区二区| 日av中文字幕| 国产视频一区三区| 日韩视频一二三| 日韩理论电影| 日本视频一区二区不卡| 开心激情综合| 国产精品日韩一区二区三区| 国内精品视频| 国产精品一区二区三区毛片淫片 | 国产美女扒开尿口久久久| 免费电影日韩网站| 午夜精品久久久99热福利| 国产黄色在线网站| 日韩网站免费观看| 成年人在线看| 一区二区三区国产视频| 日韩电影在线观看完整版| 亚洲第一精品夜夜躁人人爽| www.我爱av| 欧美一区永久视频免费观看| 中文字幕二区三区| 91国模大尺度私拍在线视频| 天天操天天干视频| 午夜精品一区在线观看| 青娱乐免费在线视频| 亚洲精品午夜久久久| 三级全黄做爰视频| 亚洲人成在线播放网站岛国| 九九热久久免费视频| 久久精品水蜜桃av综合天堂| jizz欧美性20| 久久免费视频一区| xxxx日本免费| 国产日产欧产精品推荐色| 免费看黄色的视频| 久久青草国产手机看片福利盒子| 在线 丝袜 欧美 日韩 制服| 不卡在线视频中文字幕| 国产免费一区二区三区最新6| 粉嫩久久99精品久久久久久夜| 色婷婷狠狠18禁久久| 国产成人av影院| 又色又爽又黄18网站| 成人午夜av在线| 免费日本黄色网址| 久久精品一区二区三区av| 国产又大又粗又爽的毛片| 国产视频一区二区三区在线观看| 免费黄色片网站| 国产精品激情偷乱一区二区∴| 国产探花在线视频| 一区二区三区欧美| 日韩三级免费看| 色婷婷激情综合| 一级黄色大片免费观看| 欧美一区二区高清| 蜜桃av中文字幕| 亚洲人成人99网站| 色综合久久影院| 色综合五月天导航| 涩涩视频在线播放| 国产精品自产拍在线观| 日韩成人在线看| 国产精品视频一区二区三区经| 欧美美女啪啪| 日韩av一区二区三区美女毛片| 四季av一区二区凹凸精品| 欧洲精品视频在线| 午夜亚洲影视| 天天操狠狠操夜夜操| 国产成人午夜高潮毛片| 四虎影成人精品a片| 中文字幕亚洲区| 黄色激情视频在线观看| 欧美亚洲一区二区在线观看| 精品人妻无码一区二区色欲产成人| 亚洲福利视频网站| av在线播放免费| 欧美激情一区二区三区在线视频观看| 久久青青视频| www.久久草| 精品国产一区一区二区三亚瑟| 青青草视频国产| 免费的成人av| 自拍视频一区二区| 亚洲视频一区在线| 久草视频在线观| 日韩久久免费av| www 日韩| 日本91av在线播放| 一区二区精彩视频| 伊人情人网综合| 视频一区在线播放| 精品人妻在线视频| 中文字幕在线一区免费| 韩国av中文字幕| 日韩免费在线观看| 午夜在线免费观看视频| 亚洲91av视频| 99re91这里只有精品| 熟妇熟女乱妇乱女网站| 欧美一区=区| 成人啪啪18免费游戏链接| 国产精品久久久久久户外露出 | 久久久久国产精品一区三寸| 自拍一级黄色片| 中文字幕电影一区| 久久夜色精品国产噜噜亚洲av| 欧美成人一级视频| 黄视频网站在线| 国产精品爽爽爽爽爽爽在线观看| 亚洲传媒在线| 很污的网站在线观看| 国内成人免费视频| 五月激情四射婷婷| 在线观看区一区二| 你懂的视频在线免费| 97国产suv精品一区二区62| 欧美一级大片在线视频| 亚洲精品一区二区三区av| 久久免费黄色| 少妇真人直播免费视频| 天天av天天翘天天综合网色鬼国产| 午夜精品无码一区二区三区| 日韩视频免费在线观看| 欧美一区二区三区婷婷| 天天爽天天狠久久久| 日韩在线观看一区二区| 色噜噜日韩精品欧美一区二区| 欧美日韩久久久久| 亚洲三区在线观看无套内射| 久久免费高清视频| 成午夜精品一区二区三区软件| 欧美中文字幕在线观看视频| 国产一区二区免费在线| 欧美卡一卡二卡三| 精品剧情在线观看| av3级在线| 久久精品美女| 亚洲欧美春色| 亚洲黄色小说视频| 在线亚洲欧美专区二区| 色开心亚洲综合| 91亚洲精品一区| 国模吧视频一区| 中文字幕5566| 欧美日韩一区二区三区在线看| 久久黄色美女电影| 成人女人免费毛片| 99国产精品99久久久久久粉嫩| 国产ts丝袜人妖系列视频| 在线一区二区三区四区五区| 97在线观看免费观看高清| 亚洲综合在线小说| 99精品久久久| 欧美 日韩 国产 成人 在线观看| 欧美性色欧美a在线播放| 在线看的av网站| 91手机在线视频| 99精品国产在热久久下载| 少妇按摩一区二区三区| 欧美日韩国产乱码电影| 污的网站在线观看| 欧美精品七区| 美女久久久精品| 免费在线观看黄色av| 日韩成人激情视频| 精品国产美女a久久9999| 免费看日本黄色| 国产日韩欧美电影| 亚洲精品久久久久久动漫器材一区 | 国产精品成人一区二区三区电影毛片| 91国产成人在线| 9191在线播放| 欧美精品成人一区二区在线观看| 狠狠色丁香婷婷综合| 国产性xxxx高清| 精品国产一区二区三区久久狼黑人 | 羞羞视频在线观看欧美| 九九这里只有精品视频| 亚洲国产高清自拍| 外国成人毛片| 国产麻花豆剧传媒精品mv在线| 日韩美女视频19|