精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

200億「書生·浦語2.0」正式開源!數推性能比肩ChatGPT,200K超長上下文完美召回

人工智能 新聞
新一代國產開源大語言模型來了!200K超長上下文「完美」支持,20B版本綜合性能全面領先。

就在今天,上海人工智能實驗室與商湯科技聯合香港中文大學和復旦大學,正式發布新一代大語言模型書?·浦語2.0(InternLM2)。

Github:https://github.com/InternLM/InternLM

HuggingFace:https://huggingface.co/internlm

ModelScope:https://modelscope.cn/organization/Shanghai_AI_Laboratory

新一代InternLM2經過2.6萬億token高質量語料訓練,包含7B及20B兩種參數規格,以及基座、對話等版本。

它可以支持200K超長上下文,約30萬字文本,在「大海撈針實驗」中實現了完美的召回率。

相較于初代InternLM,新一代大模型輕量級(7B)及中量級(20B)性能在同量級模型中表現優異。尤其在數學推理方面,20B參數模型在GSM8K和MATH評測中性能超越ChatGPT(GPT-3.5)。

研究團隊表示,InternLM2的核心理念在于「回歸語言建模的本質」,致力于通過提高語料質量及信息密度,實現模型基座語言建模能力獲得質的提升。

圖片

InternLM2的輕量級及中量級版本性能在同量級開源模型中表現優異

可以看到,InternLM2在數理、代碼、對話、創作等各方面都取得了長足進步,綜合性能達到同量級開源模型的領先水平。而上海AI實驗室也秉持著「以高質量開源賦能創新」理念,繼續提供InternLM2免費商用授權。

此外,為促進AI生態發展,推動大模型在各行業的應用落地,書生·浦源大模型挑戰賽同日啟動。

賽事由上海市經濟和信息化委員會、上海市科學技術委員會、徐匯區人民政府共同指導,上海人工智能實驗室(上海AI實驗室)主辦,上海市人工智能行業協會承辦,首期賽事包含行業應用和創新創意兩個賽道,即日起面向全球進行場景和賽隊征集。

回歸語言建模本質,筑牢大模型能力基礎

過去一段時間,國內外機構開源了多個優秀的大語言模型,并帶來豐富的下游應用,有力推動了全球大模型開源生態的繁榮。大模型應用生態的發展和繁榮是建立在模型基座強大的通用基礎能力之上的。

上海AI實驗室聯合團隊研究認為,大模型各項性能提升的基礎在于語言建模能力的增強,對于大模型的研究應回歸語言建模本質,通過更高質量的語料以及更高的信息密度,筑牢大模型能力基礎。

為此,聯合團隊提出了新一代的數據清洗過濾技術,主要發展了以下幾個方面的技術方法:

- 多維度數據價值評估:基于語言質量、信息密度等維度對數據價值進行綜合評估與提升;

- 高質量語料驅動的數據富集:利用高質量語料的特征從物理世界、互聯網以及語料庫中進一步富集類似語料;

- 針對性的數據補齊:針對性補充語料,重點加強現實世界知識、數理、代碼等核心能力。

目前,浦語背后的數據清洗過濾技術已經歷三輪迭代升級,僅使用約60%的訓練數據即可達到使用第二代數據訓練1T token的性能表現,模型訓練效率大幅提升。

第三代數據清洗過濾技術大幅度提升模型訓練效率

基于第三代數據清洗過濾技術,InternLM2語言建模能力顯著增強。

與第一代InternLM相比,InternLM2在大規模高質量的驗證語料上的Loss分布整體左移,表明了其語言建模能力的實質性增強

支持200K超長上下文,「大海撈針」近乎完美

長語境輸入及理解能力能夠顯著拓展大模型的應用場景,比如支持大型文檔的處理、復雜的推理演算和實際場景的工具調用等。

然而,大模型有限的上下文長度仍為當前學界及業界面臨的重要難題。

為此,InternLM2通過拓展訓練窗口大小和改進位置編碼,實現了對200K token上下文的支持,能夠一次性接受并處理約30萬漢字(約五六百頁的文檔)的輸入內容,準確提取關鍵信息,實現長文本中「大海撈針」。

參考業界范例,研究人員對InternLM2進行了「大海撈針」試驗:將關鍵信息隨機插入一段長文本的不同位置并設置問題,測試模型能否從中提取出關鍵信息。

InternLM2「大海撈針」試驗效果

上圖展示了InternLM2在不同長度的上下文(橫軸)及上下文中不同位置(縱軸)上召回關鍵信息的準確率(Recall)。紅色代表較低的召回準確率,而綠色則代表較高的召回率。

試驗結果表明,InternLM2在上下文長度延展到200K時依舊保持了近乎完美的召回成功率,驗證了InternLM2對于超長上下文堅實的支持能力。

為測試InternLM2在真實長文本處理任務中的能力,研究人員將一份時長3小時的公開會議錄音轉錄稿輸入模型中,并要求InternLM2從中提取出關鍵信息。

測試結果表明,盡管在未校對的文本中存在較多錯別字,但InternLM2仍從中準確提煉出了關鍵信息,并總結了發言人的主要觀點。

InternLM2準確總結「聯合國2023年10月2日召開的聯合國貿易和發展會議會議記錄」

性能全面提升,綜合能力領先的開源模型

InternLM2的各項能力獲得全面進步,相比于初代InternLM,在推理、數學、代碼等方面的能力提升尤為顯著,綜合能力領先于同量級開源模型。

根據大語言模型的應用方式和用戶關注的重點領域,研究人員定義了語言、知識、推理、數學、代碼、考試等六個能力維度,在55個主流評測集上對多個同量級模型的表現進行了綜合評測。

結果顯示,InternLM2的輕量級(7B)及中量級(20B)版本性能在同量級模型中表現優異。

InternLM2的輕量級及中量級版本性能在同量級開源模型中表現優異

下面的表格對比了InternLM2各版本與ChatGPT(GPT-3.5)以及GPT-4在典型評測集上的表現。可以看到,InternLM2只用20B參數的中等規模,即在整體表現上達到了與ChatGPT比肩的水平。

其中,在AGIEval、 BigBench-Hard(BBH)、GSM8K、MATH等對推理能力有較高要求的評測上,InternLM2表現甚至優于ChatGPT。

InternLM2與ChatGPT的評測結果對比

與此同時,綜合性能的增強帶來了下游任務的全方位能力提升。新發布的InternLM2提供優秀的對話及創作體驗,支持多輪任務規劃及工具調用,并提供實用的數據分析能力。

對話及創作:更溫情、更富想象力

InternLM2不僅在客觀性能指標上提升顯著,在主觀體驗上也有明顯改善,可以為用戶提供優秀的對話和交互體驗。

研究測試表明,InternLM2-Chat可以精準地理解和遵循用戶意圖,具備較強的共情能力和豐富的結構化創作能力。下面展示幾個示例:

1. 在嚴格的格式要求下編制課程大綱

InternLM2設計的課程大綱精準遵循用戶要求(比如格式、數量、內容等)

2. 以富有人文關懷的回答開解用戶

InternLM2能夠在對話中與用戶「共情」

3. 展開想象力,編寫《流浪地球3》的劇本

InternLM2設計的具備充滿豐富的合理想象,比如外星遺跡、量子糾纏的引入等。同時整個故事表現了人類面對危機時的勇氣和團結精神

對話和創造的體驗進步的原因,一方面是基礎語言能力的顯著增強,另一方面也得益于微調技術的提升。

在微調的過程中,InternLM2不僅使用了經過第三代數據清洗過濾技術處理的指令微調語料,同時也采用了更強的Online RLHF。

期間,研究人員還對獎勵模型和對話模型進行了三輪迭代更新,每一輪更新均針對前一輪模型的表現更新偏好數據與提示詞。

在獎勵模型訓練(RM)和近端策略優化(PPO)階段,研究人員均衡采用各類提示詞,不僅提高了對話的安全性,也提升了用戶體驗。

工具調用:能力升級,更精準的工具選用,更可靠的多步規劃

基于更強大、更具泛化性的指令理解、工具篩選與結果反思等能力,InternLM2可支持復雜智能體的搭建,支持對工具進行多輪有效調用及多步驟規劃,完成復雜任務。

為了便于評估,聯合團隊針對多種任務構建了細粒度工具調用評測集T-Eval。

項目地址:https://open-compass.github.io/T-Eval/

結果顯示,InternLM2-Chat-7B在該評測集上的表現已經超越了Claude-2.1和目前的開源模型,性能接近GPT-3.5。

InternLM2工具調用能力全面提升

通過工具的調用,大語言模型便可以利用搜索、計算、代碼解釋器等來獲取知識并處理更復雜的問題,從而拓展應用邊界。

針對模型調用工具流程,研究人員還實施了細粒度的拆解和分析,針對規劃、推理、工具選擇、理解、執行、反思等步驟進行了針對性增強和優化。

圖片

基于InternLM2通過開源智能體框架 Lagent搭建的用戶助手智能體,能夠在一次指令回應中完成地圖查詢、路線規劃、發郵件等任務

數理推理:會做題,還會可視化分析

數學能力是大模型邏輯思維和推理能力的重要體現。

為此,上海AI實驗室通過構建更加科學的預訓練語料,對InternLM2的數學能力進行全面提升,使其達到了當前開源模型的標桿水平。

在不依靠計算器等外部工具的情況下,擁有著極強內生計算能力的InternLM2在100以內的簡單數學運算上能夠做到接近100%的準確率,在1000以內達到80%左右的運算準確率。

在GSM8K和MATH評測中,InternLM2-20B的表現更是超過了ChatGPT(GPT-3.5)。

InternLM2在100以內的簡單數學運算上能夠做到接近100%的準確率

為應對各類復雜計算,InternLM2-Chat還可借助代碼解釋器(Code-Interpreter)編寫代碼進行計算,或對推理的結果進行形式化驗證,從而解決計算要求更高或者演算過程更加復雜的問題。

在典型的數學評測集 GSM8K 和 MATH 上,配合代碼解釋器,InternLM2取得了更高的評測分數。

其中,對于難度更高的 MATH 數據集,InternLM2的計算精度從 32.5 大幅提升到 51.2,甚至超過了 GPT-4 的表現。

InternLM2與ChatGPT的數學能力評測結果對比

下面的示例展示了InternLM2可以和代碼解釋器結合解決較復雜的高等數學問題。

InternLM2能夠完成積分求解等高等數學題目

基于在計算及工具調用方面強大的基礎能力,InternLM2在語言模型中具備了數據分析和可視化實用能力,進一步貼近用戶使用場景。

圖片

向InternLM2輸入國家統計局公布的「2023年3-11月份規模以上工業企業主要財務指標(分行業)」,InternLM2能夠分析數據并繪制折線圖

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-05-09 09:15:00

2024-04-03 10:05:00

LLM性能基準測試

2025-01-15 12:27:11

2025-10-31 01:00:00

2024-01-18 15:10:47

開源模型開源InternLM2

2024-03-11 13:20:00

模型AI

2025-09-10 09:38:56

2024-09-30 14:10:00

2025-01-15 13:09:12

2025-10-10 02:10:00

2025-10-20 09:06:00

2025-06-03 00:00:09

AI長上下文推理 RL大模型

2025-07-10 09:03:27

2024-09-05 08:24:09

2024-04-29 13:09:10

LLM架構性能

2024-01-03 13:40:00

AI訓練

2023-10-31 12:29:25

模型訓練

2017-05-11 14:00:02

Flask請求上下文應用上下文
點贊
收藏

51CTO技術棧公眾號

亚洲精品20p| 官网99热精品| 嘿嘿视频在线观看| 亚洲日本中文| 亚洲综合色噜噜狠狠| 国产高清精品一区二区| 欧美日韩一二三四区| 色综合天天爱| 亚洲精品久久久久久久久久久久久| 国产乱子伦农村叉叉叉| 欧美69xxxx| 成人综合在线观看| 国产日韩欧美黄色| 日韩av女优在线观看| 欧美岛国激情| 亚洲欧美日本另类| 伊人av在线播放| 中韩乱幕日产无线码一区| 一卡二卡欧美日韩| 亚洲精品tv久久久久久久久| 亚洲精品911| 久久99热这里只有精品| 欧亚精品中文字幕| 精国产品一区二区三区a片| 精品国产精品| 日韩精品在线观看一区| 国产探花一区二区三区| 国产成人毛片| 色婷婷亚洲一区二区三区| 大荫蒂性生交片| 黄av在线播放| 国产精品无遮挡| 欧美日韩亚洲在线| 午夜视频在线免费播放| 国产精品88av| 国产中文字幕91| 毛片在线免费播放| 久久精品天堂| 538国产精品一区二区在线| 青青草国产在线观看| 天天天综合网| 色999日韩欧美国产| 蜜桃av免费看| 婷婷精品视频| 亚洲激情视频在线观看| 最新中文字幕日本| 在线精品视频一区| 日韩天堂在线观看| 韩国三级丰满少妇高潮| 成人国产精品久久| 3751色影院一区二区三区| 欧美日韩亚洲自拍| 日韩av电影资源网| 欧美日韩久久一区| 99re精彩视频| 亚洲国产伊人| 91精品欧美久久久久久动漫 | 亚洲激情婷婷| 欧美国产中文字幕| 久久一二三四区| 亚洲性感美女99在线| 欧美激情视频网站| 国产亚洲精久久久久久无码77777| 91精品国产调教在线观看| 久久久999精品免费| 日韩在线一卡二卡| 欧美jizzhd精品欧美巨大免费| 久久国产精品久久久久久| 疯狂试爱三2浴室激情视频| 在线观看国产精品入口| 色综合天天狠天天透天天伊人| 欧美人妻一区二区| 国产欧美日韩一级| 国产精品18久久久久久首页狼| 亚洲婷婷久久综合| 国产一二精品视频| 国产日韩一区二区| 国产黄色在线| 日韩一区欧美一区| 被灌满精子的波多野结衣| 欧美一级鲁丝片| 91久久精品网| 91丨porny丨九色| 女同一区二区三区| 少妇激情综合网| 久草免费在线视频观看| 久久九九精品| 999精品视频一区二区三区| 蜜桃av中文字幕| 国产喷白浆一区二区三区| 中国黄色录像片| 伊人网在线播放| 这里是久久伊人| av2014天堂网| 外国成人激情视频| 91av视频在线播放| 国产孕妇孕交大片孕| 99国产精品视频免费观看| 一区二区三区不卡在线| h片在线观看下载| 欧美午夜精品一区二区蜜桃| 日本精品一二三| 成人一级毛片| 91大神在线播放精品| 91在线精品入口| 99精品欧美一区| 国产又粗又爽又黄的视频| 中日韩脚交footjobhd| 日韩女优av电影| 国产综合精品久久久久成人av| 欧美婷婷在线| 成人欧美一区二区三区黑人| 欧美成人片在线| 亚洲综合在线观看视频| 久久人人爽av| 一区二区小说| 久久久久久久久久久免费精品 | 丁香影院在线| 欧美精品一二三| 亚洲色成人网站www永久四虎| 国产精品vip| 亚洲free性xxxx护士白浆| 风间由美一区| 欧美日韩性视频| 特级特黄刘亦菲aaa级| 一区二区三区四区电影| 国产精品视频一| 黄色在线视频观看网站| 亚洲va国产天堂va久久en| 中文国产在线观看| 91精品秘密在线观看| 国产精品午夜一区二区欲梦| 黄色软件在线| 色综合久久久久| 人妻在线日韩免费视频| 91久久在线| 国产精品免费在线| 麻豆福利在线观看| 精品剧情v国产在线观看在线| 男女男精品视频网站| 欧美a一区二区| 视频一区二区三| 欧美成人精品三级网站| 亚洲免费伊人电影在线观看av| 日韩乱码一区二区| 97超碰欧美中文字幕| 久久国产精品网| 加勒比色综合久久久久久久久| 久久久久国产一区二区三区| www香蕉视频| 亚洲综合视频在线| 无码人妻一区二区三区在线| 国产精品观看| 精品999在线观看| 午夜久久中文| 亚洲丝袜在线视频| 欧美高清69hd| 自拍偷拍国产亚洲| 美国黄色一级视频| 国产视频一区免费看| 美女主播视频一区| 性感美女一区二区在线观看| 一本色道久久88综合日韩精品| 一级黄色在线观看| 国产精品久久久久三级| 最新av免费在线观看| 欧美激情麻豆| 精品久久一区二区三区蜜桃| 亚洲男人av| 日韩在线视频免费观看| 国产黄色片av| 欧美视频二区36p| 能免费看av的网站| 极品少妇一区二区三区精品视频 | 99精品视频免费观看| 免费99视频| 日韩三级一区| 欧美激情在线一区| 久草福利在线视频| 日韩一区二区免费在线电影| 国产无码精品在线观看| 久久综合九色综合欧美98| 天天综合网日韩| 欧美久久成人| 欧美三日本三级少妇三99| 成人国产精品久久| 国产69久久精品成人看| 91在线看黄| 精品99999| 中文字幕在线播放日韩| 亚洲一二三区视频在线观看| 国产肥白大熟妇bbbb视频| 国产一区二区在线观看免费| 免费看一级大黄情大片| 99精品美女| 久久久久天天天天| 国产精品日本一区二区三区在线 | 亚洲老司机网| 97成人精品视频在线观看| 在线视频三区| 精品亚洲一区二区三区在线播放 | 国产成人免费视频一区| 国产自偷自偷免费一区| 亚洲成人中文| 香蕉视频在线网址| 红桃成人av在线播放| 国产 高清 精品 在线 a| jvid一区二区三区| 97avcom| 久久久久久久久免费视频| 日韩高清a**址| 99久久99久久久精品棕色圆| 一本一道久久a久久精品综合蜜臀| 乱h高h女3p含苞待放| 国产日产欧美一区二区三区| 免费看毛片的网站| 国产一区二区免费视频| 日韩无套无码精品| 国产欧美三级| 人体内射精一区二区三区| 中文精品久久| 亚洲一卡二卡三卡| 欧美伦理在线视频| 欧美18视频| 果冻天美麻豆一区二区国产| 91亚洲精品丁香在线观看| 国产情侣一区二区三区| 国产经典一区二区| 欧产日产国产精品视频| 久久久欧美精品| 一区二区三区伦理| 成年人精品视频| 国内精品久久久久国产| 日韩一级黄色av| 69久久久久| 中文字幕亚洲综合久久| 电影在线高清| 伊人久久五月天| 国产在线视频网址| 亚洲视频第一页| 精品av中文字幕在线毛片| 亚洲热线99精品视频| 欧洲天堂在线观看| 国产一区av在线| av在线中文| www国产91| 国产原创在线观看| 欧美日韩国产成人在线| 欧美日韩经典丝袜| 91sa在线看| 黑人巨大亚洲一区二区久| 日本久久久久久| av激情成人网| 国产欧美在线视频| 精品国产18久久久久久二百| 91观看网站| 精品国产一区二区三区成人影院| 国产一区二区三区av在线| 色先锋久久影院av| 欧洲av一区| 羞羞答答成人影院www| 成人国产一区二区三区| 亚洲清纯自拍| 国产精品亚洲a| 蜜臀久久久99精品久久久久久| 看看黄色一级片| 国产91丝袜在线播放0| 波多野结衣有码| 国产亚洲欧美一级| 欧美激情图片小说| 午夜在线成人av| 亚洲色成人www永久网站| 欧美男人的天堂一二区| wwwxxxx国产| 亚洲欧美日韩天堂| 国产成人无吗| 性欧美xxxx| 精品九九久久| 国产精品10p综合二区| 欧美精品第一区| 7777在线视频| 亚洲一区日本| 伊人国产精品视频| 91在线国内视频| 亚洲波多野结衣| 欧美日韩亚洲成人| 国产三级漂亮女教师| 日韩电影免费在线观看中文字幕 | 亚洲欧洲日本精品| 成人美女在线观看| jizzjizz日本少妇| 欧美日韩国产综合视频在线观看中文| 姑娘第5集在线观看免费好剧| 欧美成人video| 在线视频91p| 91a在线视频| 中文字幕一区图| 亚洲精品成人自拍| 宅男噜噜噜66一区二区| 午夜一级免费视频| 久久久亚洲国产美女国产盗摄| √天堂中文官网8在线| 色欧美88888久久久久久影院| 性生活免费网站| 色系列之999| 末成年女av片一区二区下载| 91超碰rencao97精品| 波多野结衣一区| 女性隐私黄www网站视频| 东方欧美亚洲色图在线| 久久国产高清视频| 在线观看欧美精品| 午夜黄色小视频| 在线看片成人| 精品少妇无遮挡毛片| 成人久久久精品乱码一区二区三区| 亚洲精品国产精品国自| 欧美色xxxx| 人妻91麻豆一区二区三区| 久久久91精品国产| 国产精品久久久久久妇女| 精品国产一二| 黄色成人av网站| 性久久久久久久久久久久久久| 国产清纯白嫩初高生在线观看91| 日韩 欧美 综合| 精品国产一区二区三区av性色 | 三级视频中文字幕| 久久亚洲综合色一区二区三区 | 欧美日韩中文字幕一区| 香蕉视频911| 97在线日本国产| 精品福利网址导航| 国产美女网站在线观看| 成人精品高清在线| 精品视频一区二区在线观看| 欧美一区日韩一区| 国产精品剧情一区二区在线观看| 国产精品一二三在线| 成久久久网站| 亚洲免费999| 亚洲欧洲国产专区| 国产女人爽到高潮a毛片| 久久激情五月丁香伊人| 狠狠久久伊人中文字幕| 亚洲一区二区三区四区中文| 日韩av在线发布| 在线观看日本中文字幕| 欧洲精品中文字幕| porn亚洲| 91精品国产自产在线| 仙踪林久久久久久久999| 亚洲高清视频免费| 一区二区激情视频| 日本xxxx人| 日本精品性网站在线观看| 欧美精品momsxxx| 国产视频1区2区3区| 综合色天天鬼久久鬼色| 国产黄色一区二区| 性色av一区二区咪爱| 亚洲精品一级二级三级| 国产免费人做人爱午夜视频| 国产精品网站在线观看| 国产精品国产av| 欧美激情2020午夜免费观看| 国产精品极品国产中出| 日韩av片在线看| 中文一区二区在线观看| av高清一区二区| 91精品国产色综合| 欧美视频网址| 下面一进一出好爽视频| 欧美性xxxx在线播放| www日韩tube| 波多野结衣久草一区| 午夜亚洲伦理| 成年人二级毛片| 日韩高清免费在线| 亚洲二区av| 香港三级韩国三级日本三级| 国产精品久久久久国产精品日日| av中文字幕在线免费观看| 国产91成人在在线播放| 日韩专区精品| 污片免费在线观看| 欧美日韩国产一区| sqte在线播放| 亚洲日本精品一区| eeuss国产一区二区三区| 少妇又紧又色又爽又刺激视频| 欧美精品在线看| 国产乱码精品一区二区亚洲| 亚洲国产综合av| 在线视频一区二区免费| 日韩少妇视频| 午夜精品一区二区三区在线观看| 成人免费高清在线观看| 一女二男一黄一片| 欧洲日本亚洲国产区|