精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

百川智能發布千億參數大模型,中文能力超越GPT-4!

原創 精選
人工智能
1月29日,百川智能發布超千億參數的大語言模型Baichuan 3。在多個權威通用能力評測如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展現了出色的能力,尤其在中文任務上更是超越了GPT-4。而在數學和代碼專項評測如MATH、HumanEval和MBPP中同樣表現出色,證明了Baichuan 3在自然語言處理和代碼生成領域的強大實力。

出品 | 51CTO技術棧(微信號:blog51cto)

“追上ChatGPT水平,我覺得今年內可能就能夠實現,但對于GPT-4或者GPT-5,我認為可能需要3年左右的時間,應該不會低于兩年。”去年4月,百川智能創始人王小川當初曾這樣判斷自己入局大模型賽道后的進度。就在昨天,千億參數規模的百川大模型終于來了!

1月29日,百川智能發布超千億參數的大語言模型Baichuan 3。在多個權威通用能力評測如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展現了出色的能力,尤其在中文任務上更是超越了GPT-4。而在數學和代碼專項評測如MATH、HumanEval和MBPP中同樣表現出色,證明了Baichuan 3在自然語言處理和代碼生成領域的強大實力。

不僅如此,其在對邏輯推理能力及專業性要求極高的MCMLE、MedExam、CMExam等權威醫療評測上的中文效果同樣超過了GPT-4,是中文醫療任務表現最佳的大模型。Baichuan 3還突破“迭代式強化學習”技術,進一步提升了語義理解和生成能力,在詩詞創作的格式、韻律、表意等方面表現優異,領先于其他大模型。

小編一時手癢,第一時間測試下了,效果還是非常驚艷。

圖片圖片

1、基礎能力全面提升,多項權威評測中文任務成績超越GPT-4

Baichuan 3在多個英文評測中表現出色,達到接近GPT-4的水平。而在CMMLU、GAOKAO等多個中文評測榜單上,更是超越GPT-4展現了其在中文任務上的優勢。

圖片圖片

圖片圖片

此外,在MT-Bench、IFEval等對齊榜單的評測中,Baichuan 3超越了GPT-3.5、Claude等大模型,處于行業領先水平。

圖片圖片

與百億、幾百億級別參數模型訓練不同,超千億參數模型在訓練過程中對高質量數據,訓練穩定性、訓練效率的要求都高出幾個量級。為更好解決相關問題,百川智能在訓練過程中針對性地提出了“動態數據選擇”、“重要度保持”以及“異步CheckPoint存儲”等多種創新技術手段及方案,有效提升了Baicuan 3的各項能力。

高質量數據方面,傳統的數據篩選依靠人工定義,通過濾重篩選、質量打分、Textbook篩選等方法過濾數據。而百川智能認為,數據的優化和采樣是一個動態過程,應該隨著模型本身的訓練過程優化,而非單純依靠人工先驗進行數據的采樣和篩選。為全面提升數據質量,百川智能設計了一套基于因果采樣的動態訓練數據選擇方案,該方案能夠在模型訓練過程中動態地選擇訓練數據,極大提升數據質量。

訓練穩定性方面,超千億參數的模型由于參數量巨大,訓練過程中經常會出現梯度爆炸、loss跑飛、模型不收斂等問題。對此,百川智能提出了“重要度保持”(Salience-Consistency)的漸進式初始化方法,用以保證模型訓練初期的穩定性。并且優化了模型訓練過程的監控方案,在梯度、Loss等指標上引入了參數“有效秩”的方法來提早發現訓練過程中的問題,極大加速對訓練問題的定位,確保了最后模型的收斂效果。

此外,為了確保在數千張GPU上高效且穩定地訓練超千億參數模型,百川智能同步優化了模型的訓練穩定性和訓練框架,并采用“異步CheckPoint存儲”機制,可以無性能損失地加大存儲的頻率,減少機器故障對訓練任務的影響,使Baichuan 3的穩定訓練時間達到一個月以上,故障恢復時間不超過10分鐘。

訓練效率方面,百川智能針對超千億參數模型的并行訓練問題進行了一系列優化,如高度優化的RoPE, SwiGLU計算算子;在數據并行中實現參數通信與計算的重疊,以及在序列并行中實現激活值通信與計算的重疊,從而有效降低了通信時間的比重;在流水并行中引入了將激活值卸載至CPU的技術,解決了流水并行中顯存占用不均的問題,減少了流水并行的分段數量并顯著降低了空泡率。通過這些技術創新,Baichuan 3的訓練框架在性能方面相比業界主流框架提升超過30%。

2、醫療數據集Token數超千億,醫療能力逼近GPT-4

大模型醫療背后蘊含著巨大的社會價值和產業價值,從疾病的診斷、治療到患者護理與藥物研發,大模型不僅能夠幫助醫生提高診療效率和質量,幫助患者獲得更好的服務和體驗,還能幫助社會降低醫療成本和風險,助力醫療資源實現普惠和平權。并且醫療問題專業性強、知識更新速度快、準確性要求高、個體差異大,能充體現大模型的各項能力,被百川智能稱為“大模型皇冠上的明珠”。因此,諸如OpenAI、谷歌等頭部大模型企業都將醫療作為模型的重點訓練方向和性能評價的重要體系。ChatGPT早在2023年2月便已通過了美國醫學執照考試(USMLE),顯示出其在醫學領域的強大能力。而谷歌對醫療領域的重視更甚,基于PaLM模型打造了醫療大模型Med-PaLM,迭代后的Med-PaLM 2在醫學考試MedQA中的成績超過80分,達到專家水平。

在醫療領域,大模型的全能特性發揮著至關重要的作用。首先,其多模態學習能力能夠整合文本、影像、聲音等多種類型的醫療數據,提供更全面、準確的分析和診斷。其次,大模型的深層推理能力有助于復雜醫療決策的制定。此外,穩定的性能和知識更新能力確保了醫療建議的可靠性和時效性。同時,大模型的語言理解和生成能力使其能夠處理專業術語和復雜句式。最后,模式識別與學習能力在大模型中的應用,使其能夠從復雜的醫療數據中學習和識別出重要的模式和特征。所以,大模型想要在醫療領域擁有良好效果并不容易,既需要豐富的醫療知識、合適的Prompt,還需要模型本身具備過硬的邏輯推理能力。

為了給Baichuan3注入豐富的醫療知識,百川智能在模型預訓練階段構建了超過千億Token的醫療數據集,包括醫學研究文獻、真實的電子病歷資料、醫學領域的專業書籍和知識庫資源、針對醫療問題的問答資料等。該數據集涵蓋了從理論到實際操作,從基礎理論到臨床應用等各個方面的醫學知識,確保了模型在醫療領域的專業度和知識深度。

針對醫療知識激發的問題,百川智能在推理階段針對Prompt做了系統性的研究和調優,通過準確的描述任務、恰當的示例樣本選擇,讓模型輸出更加準確以及符合邏輯的推理步驟,最終不僅提升了Baichuan 3在多項醫療考試上的成績,并且在真實的醫療問答場景下也能給用戶提供更精準、細致的反饋。

邏輯推理方面,Baichuan 3在數學和代碼等多個權威評測上接近GPT-4的優異成績,已經充分證明了其強大的基礎邏輯推理能力。在擁有豐富高質量專業醫療知識,并能通過調優后的Prompt對這些知識進行充分激發的基礎上,結合超千億參數的推理能力,Baichuan 3在醫療領域的任務效果提升顯著,在各類中英文醫療測試中的成績提升了2到14個百分點。

Baichuan 3在多個權威醫療評測任務中表現優異,不僅MCMLE、MedExam、CMExam等中文醫療任務的評測成績超過GPT-4,USMLE、MedMCQA等英文醫療任務的評測成績也逼近了GPT-4的水準,是醫療能力最強的中文大模型。

圖片圖片

3、突破“迭代式強化學習”技術,創作精準度大幅提升

語義理解和文本生成,作為大模型最基礎的底層能力,是其他能力的支柱。為提升這兩項能力,業界進行了大量探索和實踐,OpenAI、Google以及Anthropic等引入的RLHF(基于人類反饋的強化學習)和RLAIF(基于AI反饋的強化學習)便是其中的關鍵技術。

基于強化學習對齊后的模型不僅可以更精準地理解用戶指令,尤其是多約束以及多輪對話下的指令,還能進一步提升生成內容的質量。但是在大模型中充分發揮強化學習的作用不僅需要穩定且高效的強化學習訓練框架和高質量的優質偏序數據,還需要在“探索與利用”兩者間進行平衡,實現模型能力持續爬坡。

對于以上問題,百川智能進行了深入研究,并給出了針對性的解決方案。強化學習訓練框架方面,百川智能自研了訓練推理雙引擎融合、多模型并行調度的PPO訓練框架,能夠很好支持超千億模型的高效訓練,訓練效率相比業界主流框架提升400%。偏序數據方面,百川智能創新性的采用了RLHF與RLAIF結合的方式來生成高質量優質偏序數據,在數據質量和數據成本之間獲得了更好的平衡。在此基礎上,對于“探索與利用”這一根本挑戰,百川智能通過PPO探索空間與Reward Model評價空間的同步升級,實現“迭代式強化學習”(Iterative RLHF&RLAIF)。基于強化學習的版本爬坡,可以在SFT的基礎上進一步發揮底座模型的潛力,讓Baichuan 3的語義理解和生成創作能力大幅提升。

以文本創作中最具挑戰的唐詩宋詞為例,作為中國傳統文化的瑰寶,詩詞不僅在格式、平仄、對偶、韻律等方面均有著嚴格的約束條件,并且內容高度凝練、寓意深遠。如果僅通過SFT的微調學習,一方面高質量詩詞的創作數據需要極高的專家成本,另一方面不能在平仄、對偶、韻律等多個方面實現較好的約束理解和遵循。此外,傳統的單次RLHF范式在唐詩宋詞面前也遇到極大挑戰,PPO在訓練過程中生成的Response有可能超出Reward Model的評價范圍導致“探索”的過程失控。

Baichuan 3結合“RLHF&RLAIF”以及迭代式強化學習的方法,讓大模型的詩詞創作能力達到全新高度。可用性相比當前業界最好的模型水平提升達500%,文采遠超GPT-4。對于宋詞這種格式多變,結構深細、韻律豐富的高難度文體,生成的內容亦能工整對仗、韻腳和諧。其精準、深厚的創作功底,將讓每個人都能輕松創作出詠物、寄思的五言律詩、七言絕句,寫下的言志、抒情的“沁園春”、“定風波”,這不僅可以提升大眾的人文素養,還能助力中華傳統文化在大模型時代真正地“活”起來。

圖片圖片

圖片圖片

作為參數規模超過千億的大語言模型,Baichuan 3不僅英文效果達到接近GPT-4的水平,還在多項通用中文任務的表現上實現了對GPT-4的超越,是百川智能的全新里程碑。Baichuan 3全面的通用能力以及在醫療領域的強大表現,將為百川智能打造“超級應用”,把大模型技術落地到諸多復雜應用場景提供有力支撐。

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2023-09-06 19:44:26

昇騰

2025-05-30 07:40:56

2024-02-04 12:22:47

AI數據

2023-09-11 15:57:16

人工智能模型GPT-4

2025-09-25 09:09:22

2024-04-19 14:52:13

MetaGPT-4模型

2025-03-20 18:11:44

2023-09-15 13:18:53

數據訓練

2023-06-07 14:16:11

AIGPT-4

2023-07-05 09:57:11

2023-11-13 19:35:12

訓練數據

2023-10-08 13:11:00

訓練數據

2023-09-19 14:56:00

模型訓練

2023-07-12 16:10:48

人工智能

2023-11-03 11:08:03

PhindAI搜索工具

2024-03-27 13:32:00

AI數據

2024-02-07 12:39:00

AI數據
點贊
收藏

51CTO技術棧公眾號

色偷偷中文字幕| 国产人妻人伦精品| 波多野结衣网站| 羞羞色午夜精品一区二区三区| 欧美精品xxxxbbbb| 男人天堂手机在线视频| 久久久久久久影视| 蓝色福利精品导航| 午夜精品在线视频| 国产精品一二三区在线观看| 成人噜噜噜噜| 色综合咪咪久久| 五月天色婷婷综合| 亚洲色大成网站www| 看国产成人h片视频| 97免费中文视频在线观看| 永久免费观看片现看| 成人免费直播在线| 欧美视频一区在线| 男人添女人下面高潮视频| 2019中文字幕在线视频| 99久久精品国产观看| 国产精品亚洲欧美导航| 日韩视频在线观看一区| 欧美日韩1区| 中文字幕国产亚洲| 国精品无码人妻一区二区三区| 2020国产精品小视频| 色综合久久88色综合天天免费| 91精品国产吴梦梦| 在线观看黄av| 久久久久久久久99精品| 国产精品美女诱惑| av一级黄色片| 激情文学综合丁香| 国产成人jvid在线播放| www成人在线| 激情综合自拍| 欧美老女人在线视频| 黄大色黄女片18免费| 天堂av一区二区三区在线播放| 日韩一二三区视频| 亚洲精品在线视频播放| 桃花岛成人影院| 五月天欧美精品| 日韩精品在线视频免费观看| 中文字幕中文字幕在线十八区| 国产精品蜜臀在线观看| 色综合电影网| 欧美视频综合| 久久久精品黄色| 麻豆一区区三区四区产品精品蜜桃| 人妻无码一区二区三区久久99| 粉嫩绯色av一区二区在线观看 | 可以免费在线观看的av| 亚洲一级特黄| 羞羞色国产精品| 日韩精品久久久久久久| 亚洲美女啪啪| 欧美最顶级的aⅴ艳星| 亚洲 欧美 视频| 日韩视频一区| 人妖精品videosex性欧美| 中文字幕视频网| 日韩综合在线视频| 国产日韩中文字幕在线| 国产伦精品一区二区三区免.费 | 一本大道久久a久久精品综合 | 精品一二三四区| 成人在线播放av| www.久久久久久| 成+人+亚洲+综合天堂| 国产麻豆日韩| 免费动漫网站在线观看| 中文字幕 久热精品 视频在线 | 欧美少妇一区二区| 潘金莲激情呻吟欲求不满视频| 2020国产精品小视频| 日韩欧美高清在线| 中文字幕在线播放视频| 国产一区二区三区91| 色一区av在线| 久久久久久天堂| 亚洲在线视频| 国产一区香蕉久久| 亚洲国产精品久久人人爱潘金莲 | 国产精品www爽爽爽| 亚洲经典一区| 国产91精品高潮白浆喷水| 夜夜躁日日躁狠狠久久av| 精品中文字幕一区二区小辣椒| 91久久国产综合久久蜜月精品| 黄色小视频免费在线观看| 国产丝袜美腿一区二区三区| 伊人狠狠色丁香综合尤物| 欧美四级在线| 欧美在线三级电影| www日本在线观看| 久久不见久久见免费视频7| 久久久精品一区| 中文字幕黄色片| 国产精品中文欧美| 色大师av一区二区三区| 色婷婷av在线| 欧美性色欧美a在线播放| 国产无套精品一区二区三区| 久久最新网址| 欧美激情精品在线| 在线免费av网| 91啪亚洲精品| 毛片av在线播放| 国产成人免费| 亚洲另类xxxx| 动漫精品一区一码二码三码四码| 美女在线视频一区| 精品久久久久久中文字幕动漫| 丝袜美腿美女被狂躁在线观看 | 中文av免费观看| 99精品国产热久久91蜜凸| 国产卡一卡二在线| 欧美不卡高清一区二区三区| 亚洲第一黄色网| 尤物在线免费视频| 日韩精品色哟哟| 久久精品日产第一区二区三区乱码| 免费网站黄在线观看| 欧美性xxxxxxxxx| 国产在线不卡av| 欧美不卡视频| 91亚洲va在线va天堂va国| 韩国中文字幕2020精品| 狠狠久久亚洲欧美专区| 亚洲成人激情小说| 天天插综合网| 国产日韩在线看| 97视频在线观看网站| 色婷婷精品久久二区二区蜜臀av | 国产精品欧美激情在线观看| www.神马久久| 色在人av网站天堂精品| 国产成人精品亚洲精品色欲| 成人免费视频在线观看| 伊人影院综合在线| 日韩一区亚洲二区| 国产精品视频免费在线| 国产在线三区| 在线看国产一区二区| 欧美做受高潮6| 久久一区二区三区超碰国产精品| 精品在线视频一区二区三区| 国模私拍一区二区国模曼安| 亚洲激情中文字幕| 欧美三级午夜理伦| 91年精品国产| 999香蕉视频| 精品久久精品| 国产精品一区二区三区在线播放| 尤物在线视频| 欧美一区二区日韩| 免费在线观看国产精品| 成人一级黄色片| 无码专区aaaaaa免费视频| 啪啪国产精品| 国产福利视频一区| 69av亚洲| 日韩欧美一区二区三区在线| 久久一区二区三| www久久精品| 亚洲少妇第一页| 99久久亚洲精品| 亚洲一区二区三区xxx视频| 肉肉视频在线观看| 亚洲第一区第一页| 麻豆成人免费视频| 国产精品天美传媒沈樵| 国产资源中文字幕| 99成人在线| 日韩欧美激情一区二区| 96视频在线观看欧美| 久久久久久噜噜噜久久久精品| 手机看片福利在线| 欧美吞精做爰啪啪高潮| 动漫性做爰视频| 91香蕉视频mp4| 制服丝袜综合网| 欧美日韩一区二区国产| 欧美日韩精品免费观看| 天堂久久一区| 午夜精品久久久99热福利| p色视频免费在线观看| 欧美一级高清片| 欧美日韩一级黄色片| 中文字幕亚洲不卡| 六十路息与子猛烈交尾| 蜜臀va亚洲va欧美va天堂| 天堂8在线天堂资源bt| 国产午夜一区| 成人动漫在线观看视频| 成人自拍视频网| 久久久久国产精品免费| yw193.com尤物在线| 精品国产自在久精品国产| 日韩国产成人在线| 亚洲国产成人av| 亚洲国产精品一区二区久久hs| www.性欧美| 日本黄色福利视频| 免费日韩精品中文字幕视频在线| 伊人av成人| 精品国产精品| 黄色小网站91| 中文字幕一区日韩精品| 国产一区二区在线免费| 成人欧美magnet| 久久久亚洲欧洲日产国码aⅴ| 在线观看黄av| 伊人亚洲福利一区二区三区| 色屁屁草草影院ccyycom| 7799精品视频| 一区二区三区麻豆| 精品国产91乱高清在线观看| 欧美黄色免费看| 17c精品麻豆一区二区免费| 伊人网伊人影院| 成人av电影在线观看| 杨幂一区二区国产精品| 老司机一区二区| 高清一区二区视频| 国产欧美日韩一级| 青青草精品视频在线| 欧美久久视频| 无码毛片aaa在线| 亚洲国产精品日韩专区av有中文| 亚洲精品人成| 国产精品中文字幕亚洲欧美| 久久人人九九| 少妇精品导航| 久久99精品久久久久久三级| 久久中文资源| 精品视频一区二区| 国产成人在线中文字幕| 国产欧美日韩伦理| 黄色成人美女网站| 国产区欧美区日韩区| 成人在线视频你懂的| 国产精品一区二区三区免费| av综合网页| 国产精品一区在线播放| jazzjazz国产精品久久| 亚洲自拍偷拍区| 天堂久久av| 国内一区二区三区在线视频| 欧美一级三级| 欧美精品123| 欧美影院三区| 椎名由奈jux491在线播放| 欧美大人香蕉在线| 黄色网址在线免费看| 欧美一区视频| 久久综合色视频| 国产欧美日韩亚洲一区二区三区| 99精品视频在线看| 日韩不卡一二三区| 午夜免费看毛片| 国产精品18久久久久久久网站| 亚洲成a人无码| 99免费精品视频| 国产熟女一区二区| 亚洲三级在线看| 久久午夜无码鲁丝片| 午夜精品福利一区二区三区av| 69成人免费视频| 欧美日韩精品一区二区三区四区 | 精品乱码一区二区三区四区| 亚洲va码欧洲m码| 精品素人av| 性欧美.com| 欧美在线观看天堂一区二区三区| 国产日韩欧美精品在线观看| 免费在线亚洲欧美| 粉色视频免费看| 成人激情免费网站| 色欲狠狠躁天天躁无码中文字幕| 亚洲天天做日日做天天谢日日欢| 欧美激情国产精品免费| 91久久人澡人人添人人爽欧美| 一区二区三区黄| 亚洲精品国产免费| 日韩精品黄色| 91黑丝高跟在线| 国产美女久久| 精品欧美国产一区二区三区不卡| 精品美女视频| av无码久久久久久不卡网站| 日本午夜精品视频在线观看| 亚洲精品鲁一鲁一区二区三区| 久久先锋影音av| 欧美日韩三级在线观看| 日本丰满少妇一区二区三区| aaa一区二区三区| 亚洲欧美综合区自拍另类| av中文字幕在线播放| 欧美最猛黑人xxxx黑人猛叫黄 | 精品国产一区二区三区免费| 色男人天堂综合再现| 俄罗斯av网站| 国产精品一区二区在线观看不卡 | 亚洲精品国产a| 正在播放木下凛凛xv99| 亚洲国产日韩欧美综合久久| 久久综合网导航| 国产成+人+综合+亚洲欧洲 | 五码日韩精品一区二区三区视频| 欧美日韩一卡| 午夜视频在线观| 国产欧美一区二区精品忘忧草 | 日韩精品91亚洲二区在线观看| 国产麻豆剧传媒精品国产| 国产精品三级电影| 亚洲自拍一区在线观看| 亚洲黄色免费三级| 在线观看三级视频| 91久久精品在线| 欧美r级电影| 在线免费视频a| 久久综合久久综合亚洲| 国产在线观看成人| 日韩一区二区三区在线| 在线播放麻豆| 国产精品香蕉国产| 欧美精品尤物在线观看| 久久精品99国产| 99久久精品99国产精品 | 欧美日韩一区二区三区高清| 免费成人av电影| 日韩美女在线播放| 日韩高清在线免费观看| 国产极品尤物在线| 不卡大黄网站免费看| 国产无遮挡又黄又爽又色| 欧美成人激情免费网| 天堂8中文在线| 成人av免费看| 激情综合在线| 亚洲综合自拍网| 精品久久久久久久中文字幕| 天天干天天做天天操| 91爱爱小视频k| 伊人久久大香线蕉无限次| 男人天堂1024| 久久蜜桃av一区精品变态类天堂 | 91精品国产91久久久久久最新毛片 | 成人午夜亚洲| 亚洲一区二区三区涩| 麻豆精品一区二区三区| 一本一本久久a久久| 欧美一区欧美二区| 在线播放免费av| 国产精品xxxx| 国产精品久久久久久模特| 欧美成人午夜精品免费| 欧美吻胸吃奶大尺度电影| 免费在线看黄色| 爱情岛论坛亚洲入口| 激情婷婷亚洲| 在线不卡av电影| 欧美日韩亚洲综合一区| 久久bbxx| 国产精品一区二区你懂得| 麻豆91精品| 久久久久人妻一区精品色| 91精品国产欧美日韩| 成人高潮aa毛片免费| 欧美精品七区| 久久超级碰视频| 国产亚洲欧美久久久久| 亚洲精品国产综合区久久久久久久| 超碰一区二区| 欧美性受黑人性爽| av电影在线观看一区| 人人妻人人爽人人澡人人精品| 久久久www成人免费精品张筱雨| 一区二区网站| 玩弄japan白嫩少妇hd| 成人免费一区二区三区在线观看| www五月婷婷| 日韩美女主播视频| 午夜久久影院| 午夜时刻免费入口| 欧美一区二区三区免费观看视频| av中文资源在线资源免费观看| 亚洲 国产 日韩 综合一区| 国产成人自拍在线| 91精品国产高清一区二区三密臀| 日韩中文字幕av| 伦理一区二区三区| 日本高清一区二区视频| 欧美日韩国产一中文字不卡| 久久五月精品| 日本一区美女|