精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1

發布于 2025-4-27 00:24
瀏覽
0收藏

大型語言模型(LLMs)在推理能力上的進展引發了對其在復雜任務中表現的關注,尤其是在金融領域。DianJin-R1是一個針對金融領域的推理增強框架,通過推理增強監督和強化學習,提升金融推理任務的表現。

DianJin-R1模型在金融測試集(CFLUE、FinQA、CCC)上顯著優于基礎模型,尤其在CFLUE和CCC上表現突出,DianJin-R1-32B在CFLUE上準確率從77.95提升至86.74,CCC上從56.50提升至96.00,超越DeepSeek-R1。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

摘要

DianJin-R1是一個針對金融領域的推理增強框架,旨在解決大語言模型在該領域的推理挑戰。該框架使用DianJin-R1Data數據集,結合CFLUE、FinQA和中國合規檢查(CCC)數據,涵蓋多樣的金融推理場景。模型DianJin-R1-7B和DianJin-R1-32B基于Qwen2.5進行微調,采用結構化格式生成推理步驟和最終答案。通過應用群體相對策略優化(GRPO)強化學習,模型獲得了結構化輸出和答案正確性的雙重獎勵信號。

在五個基準測試上,DianJin-R1模型在復雜金融任務中表現優于非推理模型,尤其在真實世界的CCC數據集上,單次推理模型的表現超過多代理系統。DianJin-R1展示了通過結構化監督和獎勵對齊學習提升金融推理的有效性,提供了可擴展的實際應用解決方案。

簡介

大型語言模型(LLMs)在推理能力上的進展引發了對其在復雜任務中表現的關注,尤其是在金融領域。DianJin-R1模型通過推理增強監督和強化學習,提升金融推理任務的表現。構建了高質量的推理數據集DianJin-R1-Data,來源包括CFLUE、FinQA和合規性數據集CCC。采用GPT-4o進行驗證,確保生成答案與推理步驟的一致性。

DianJin-R1-7B和DianJin-R1-32B模型通過結構化輸出格式進行監督微調,并使用GRPO強化學習算法優化推理質量。在CFLUE、FinQA、CCC等基準測試中,DianJin-R1模型表現優于非推理模型,尤其在金融領域。實際應用中,基于LLMs的多代理系統在CCC數據集上進行條件合規檢查,整合中間推理步驟以得出最終判斷。DianJin-R1結合高質量監督、結構化推理生成和獎勵驅動的強化學習,提供了一種可擴展的金融推理增強策略。

DianJin-R1-Data建設

數據源

CFLUE數據集。包含38,638道金融考試多選題,經過長度、難度和模糊性三步篩選,確保問題清晰且具備深度推理能力,適合評估LLMs的金融推理能力。

FinQA數據集。包含8,281個金融問答對,經過相同的長度和難度篩選,適合評估英語金融推理。

CCC數據集。內部數據集,評估服務代理的合規性,包含客戶與服務代理的對話,經過人工審核,確保合規與非合規案例的平衡分布。

推理數據集構建

針對CCC、CFLUE和FinQA數據集的差異,采用不同的推理構建方法。

CFLUE問題的推理生成

定義DCFLUE MCQ為包含問題、解釋和答案的多選題數據集。使用GPT-4o將DCFLUE MCQ中的多選題轉換為開放式問題,生成DCFLUE OE數據集。利用DeepSeek-R1生成推理鏈和預測答案,并用GPT-4o驗證答案和推理的一致性。滿足條件的實例保留為有效推理樣本,未滿足的實例最多重試3次,最終未成功的實例歸為難題樣本。

生成的推理增強數據集為RCFLUE MQC,難題數據集為GCFLUE MQC。對DCFLUE OE應用相同流程,生成RCFLUE OE和GCFLUE OE數據集。

FinQA問題的推理生成

FinQA數據集的QA對已為開放式格式,表示為D FinQA。將CFLUE中的推理生成過程應用于D FinQA,得到推理增強數據集R FinQA。生成的非推理數據集為G FinQA。

基于多Agent的CCC對話推理生成

CCC數據集DCCC包含對話x_i及其對應的合規性判斷答案y_i,判斷過程復雜,需遵循指導原則。開發了一個工作流程,從開始節點到兩個結果節點,評估合規性違規與否。

使用多代理LLM系統生成推理,采用Qwen2.5-72B-Instruct為每個條件節點生成中間推理鏈(CoTs)和答案。最終答案a_i由結果節點決定,若與金標準答案y_i匹配,則合并中間推理鏈生成統一推理r_i。若不匹配,最多重試T次,生成的推理增強數據集為RCC,未增強數據集為GCC。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

模型訓練

訓練大型語言模型(LLMs)進行金融推理分為兩個階段:

  • 通過監督微調(SFT)學習推理。
  • 通過強化學習(RL)增強推理能力。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

使用SFT學習推理

使用R CFLUE MCQ、RCFLUE OE、R FinQA和RCCC數據集對LLMs進行微調,以生成推理鏈(CoT)和最終答案。每個訓練實例包含問題x、推理路徑r和答案y。在微調過程中,問題x作為模型輸入,推理r和答案y作為目標輸出,幫助模型學習生成連貫的推理步驟和正確的解決方案。

使用強化學習增加推理能力

GCFLUE MCQ數據集用于強化學習(RL),旨在提升推理能力。采用Group Relative Policy Optimization(GRPO)算法,結合兩種獎勵機制:

  • 格式獎勵:輸出需包含一個推理段(...)和一個最終答案(...),格式正確得1分,錯誤得0分。
  • 準確性獎勵:若標簽內內容與參考答案完全一致,得1分;否則得0分,鼓勵生成準確答案。

實驗

實驗設置

DianJin-R1-Data的統計信息總結在表1中,CFLUE MCQ占SFT數據的大部分,數據經過洗牌以防止過擬合。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

模型訓練分為兩個階段,使用NVIDIA A100 GPU,7B模型在單節點8 GPU上訓練,32B模型在4節點32 GPU上訓練。SFT階段使用DeepSpeed的Zero-3優化,學習率1.0 × 10^-5,序列長度16K,bf16精度,訓練3個epoch,梯度累積16步。RL階段每個樣本進行8次回合,訓練批量大小1024,回合批量大小256,學習率1.0 × 10^-6,采樣溫度0.6,訓練5個epoch。

評估模型使用三個金融基準數據集:CFLUE、FinQA和自有數據集CCC,以及兩個推理能力評估基準:MATH500和GPQA-Diamond。報告準確率,即正確回答問題的比例,并計算所有測試集的平均準確率。CFLUE和CCC為中文數據集,其余為英文。FinQA和CCC的答案正確性由GPT-4o評估,其他數據集通過規則方法提取答案并與標準答案比較。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

基線模型分為兩類:一類為無明確推理能力的通用LLM(如GPT-4o、DeepSeekV3等);另一類為具備推理能力的通用LLM(如DeepSeek-R1及其衍生模型)。

結果

DianJin-R1模型在金融測試集(CFLUE、FinQA、CCC)上顯著優于基礎模型,尤其在CFLUE和CCC上表現突出,DianJin-R1-32B在CFLUE上準確率從77.95提升至86.74,CCC上從56.50提升至96.00,超越DeepSeek-R1。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

在一般領域測試集(MATH-500、GPQA-Diamond)上,DianJin-R1模型也有提升,但由于未使用一般領域推理數據,表現仍低于大型模型或經過一般推理數據微調的模型。

一般推理模型(如DeepSeek-R1、QwQ-32B)在一般推理基準上表現優異,但在金融基準上不一定更好,DeepSeek-R1在CFLUE和CCC上優于DeepSeek-V3,但在FinQA上表現下降,DeepSeek-R1-Distill-Qwen-7B在所有金融測試集上均不及Qwen-2.5-7B-Instruct。

討論

SFT顯著提升了模型在所有數據集上的表現,增強了推理能力。RL在所有數據集上均有改善,唯獨FinQA例外,可能因RL實例為中文,FinQA為英文,未來將加入英文示例。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

SFT使用的三個數據源為CFLUE、FinQA和CCC,其中CFLUE對性能影響最大,包含31,000多個推理實例,單獨使用時準確率從59.26提升至65.67。添加FinQA或CCC主要提升各自測試集的表現,對整體影響有限。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

多代理LLM系統用于檢測CCC數據集中的合規性違規,采用條件節點的推理生成工作流程。引入多代理方法后,準確率從55.50提升至95.00,顯示出結構化推理的有效性,但平均每個實例需8.15次API調用。DianJin-R1-7B和DianJin-R1-32B模型在僅一次API調用的情況下,表現出與多代理方法相當或更優的性能,體現了有效推理和組織推理路徑的能力。

DianJin-R1:金融領域推理增強大模型,全面超越DeepSeek-R1-AI.x社區

總結和未來工作

DianJin-R1是一個針對金融領域的大型語言模型的推理增強框架,結合結構化監督和強化學習算法(GRPO),提升復雜金融和合規任務的表現。實驗表明,推理感知訓練顯著提高了模型的準確性和可解釋性。

本文轉載自???靈度智能???,作者:靈度智能

收藏
回復
舉報
回復
相關推薦
欧美蜜桃一区二区三区| 成人综合激情网| 影音先锋日韩有码| 在线免费视频a| 国产专区在线| 日韩av中文字幕一区二区三区| 亚洲人成在线观| 99久久国产宗和精品1上映 | 日韩一级黄色大片| 99久re热视频精品98| 精品人妻一区二区三区浪潮在线| 久久理论电影| 欧美成人vr18sexvr| cao在线观看| 你懂的在线网址| 久久国产剧场电影| 欧美激情在线狂野欧美精品| 日本黄色特级片| 在线观看网站免费入口在线观看国内 | 国产成人精品一区二| 韩国精品久久久999| xxxx日本免费| 电影中文字幕一区二区| 亚洲精品菠萝久久久久久久| 精品在线一区| 中文字幕av影视| 国内久久视频| 亚洲色图美腿丝袜| 麻豆传媒在线看| 成人自拍视频网| 亚洲午夜久久久久久久久久久| 你懂的网址一区二区三区| 6—12呦国产精品| 国产日韩亚洲| 另类视频在线观看| 日本黄色特级片| 人人九九精品视频| 在线免费观看日本一区| 91网站在线观看免费| 黄色片在线播放| 国产suv精品一区二区6| 国产精品免费久久久久影院| 日本一级淫片免费放| 欧美xxxx中国| 亚洲欧洲日产国产网站| 久久久久亚洲AV成人网人人小说| 成人亚洲免费| 欧美性xxxx极品hd欧美风情| 男人添女人下部视频免费| 黄网页在线观看| 99精品偷自拍| 国产精品爽爽ⅴa在线观看| 国产大片中文字幕| 欧美在线观看天堂一区二区三区| 亚洲天堂男人天堂| 亚洲调教欧美在线| 91蜜桃臀久久一区二区| 91麻豆精品91久久久久久清纯 | 欧美日韩精品一区视频| 免费在线激情视频| 国产黄色大片在线观看| 中文字幕中文字幕在线一区| 欧美在线激情| 日韩福利一区二区| 不卡一区二区在线| 91久久夜色精品国产网站| 亚洲永久精品一区| 三级不卡在线观看| 91av在线国产| 亚洲免费在线观看av| blacked蜜桃精品一区| 91精品午夜视频| 久久精品一区二| 精精国产xxxx视频在线播放| 亚洲天堂精品视频| 一本色道久久综合亚洲精品婷婷 | 超碰手机在线观看| 91精品蜜臀一区二区三区在线| 在线精品国产成人综合| 国产精成人品免费观看| 女厕嘘嘘一区二区在线播放 | 亚洲欧美在线x视频| 欲求不满的岳中文字幕| 国产精品乱战久久久| 精品久久人人做人人爱| 9.1在线观看免费| ady日本映画久久精品一区二区| 日韩一本二本av| 黑人玩弄人妻一区二区三区| 欧美亚洲tv| 亚洲人精品午夜在线观看| 熟女俱乐部一区二区视频在线| 亚洲美女久久| 最新91在线视频| 视频国产一区二区| 成人看的羞羞网站| 日韩最新在线视频| 女人18毛片毛片毛片毛片区二| 天天综合国产| 久久久久久久久久久免费| 91久久国产视频| 国产日韩欧美一区在线| 国产精品免费久久久久久| 国产内射老熟女aaaa∵| 粉嫩av一区二区三区在线播放| 成人在线免费网站| 性感美女福利视频| 国产精品美女久久久久aⅴ | 怡红院一区二区| 精品中文字幕一区二区三区av| 精品视频在线播放| 国产激情在线免费观看| 日韩啪啪电影网| 欧美日韩国产成人在线观看| 日韩av无码中文字幕| 老司机精品福利视频| 成人免费视频97| 少妇精品视频一区二区| 国产精品久久久久天堂| 久久久久久免费看| jizzyou欧美16| 日韩免费高清av| 一色道久久88加勒比一| 中文字幕一区二区三区久久网站 | 国产精品人成在线观看免费| 黄色一级大片免费| 91国拍精品国产粉嫩亚洲一区| 91.com在线观看| 国产又黄又粗又猛又爽的视频 | 91丨porny丨在线中文 | 一区二区三区四区欧美| 国产黄大片在线观看画质优化| 亚洲国产精品一区二区久久| 亚洲xxx在线观看| 伊人春色精品| 欧美激情a在线| 亚洲一区二区人妻| 懂色av中文字幕一区二区三区| 久久亚裔精品欧美| 一色桃子av在线| 欧美日韩国产精品成人| 成人网站免费观看| 一区二区视频欧美| 成人久久精品视频| aaa日本高清在线播放免费观看| 亚洲国产视频a| 国产精品igao网网址不卡| 红桃视频在线观看一区二区| 欧美激情乱人伦一区| 欧美三级网站在线观看| 99热这里都是精品| 国产91在线亚洲| 国产午夜久久av| 亚洲网址你懂得| 国产一级特黄毛片| 国产九色精品成人porny| 久久一区二区精品| 含羞草www国产在线视频| 欧美午夜精品理论片a级按摩| 伊人成人免费视频| 欧美日韩水蜜桃| 日本亚洲欧美成人| 手机福利小视频在线播放| 亚洲成人综合在线| 免费黄色在线播放| 欧美精品网站| 91精品网站| 午夜视频在线观看免费视频| 欧美日韩精品三区| 久久美女免费视频| 日本午夜精品视频在线观看| 日韩一区二区三区资源| 国产在线|日韩| 中文字幕精品网| 在线观看亚洲国产| 亚洲欧美韩国综合色| 999久久久精品视频| 青青草国产免费一区二区下载| 欧美怡春院一区二区三区| 亚洲国产精品久久久久久久| 一区二区三区在线观看网站| 欧美一级特黄aaa| 欧美区国产区| 国产精品乱码视频| 欧美momandson| 精品国产一区二区三区在线观看| 国产精品人妻一区二区三区| 亚洲欧美经典视频| 亚洲一级片免费观看| 五月综合激情| 国产成人精品日本亚洲11| 阿v视频在线观看| 精品网站999www| 成人黄色片在线观看| **欧美大码日韩| 亚洲一区二区三区四区av| 亚洲欧美日韩国产一区二区| 五月天色一区| 肉色欧美久久久久久久免费看| 亚洲欧洲偷拍精品| 一级久久久久久久| 亚洲三级在线免费观看| 日本少妇xxxx| 日韩1区2区日韩1区2区| 欧美黄色免费网址| 亚州综合一区| 国产日韩在线看| 午夜在线激情影院| 亚洲免费电影一区| 国产av无码专区亚洲av| 色视频成人在线观看免| 欧美三级免费看| 国产午夜精品一区二区三区嫩草| 在线播放av中文字幕| 亚洲区一区二| 亚洲人久久久| 美女一区2区| 国产在线视频2019最新视频| 黑人极品ⅴideos精品欧美棵| 亚洲色图综合网| 国产农村老头老太视频| 天天色图综合网| www.xx日本| 91丨九色porny丨蝌蚪| 欧美momandson| 亚洲美女网站| 国产女人水真多18毛片18精品 | 小处雏高清一区二区三区| 国产区二精品视| 亚洲国产伊人| 午夜精品福利在线观看| 男人天堂亚洲二区| 日韩欧美国产综合一区 | 久久久精品一区二区| 暖暖视频在线免费观看| 精品国产乱码91久久久久久网站| 这里只有精品9| 欧美色xxxx| www.av视频在线观看| 国产精品乱码人人做人人爱 | 丰满的护士2在线观看高清| 在线成人中文字幕| 无码精品在线观看| 欧美成人精品二区三区99精品| 一级片在线免费播放| 亚洲第一福利视频在线| 欧美精品久久久久久久久46p| 久久女同精品一区二区| 你懂的在线观看网站| 国产东北露脸精品视频| 黄色一级片免费播放| 蜜臀精品久久久久久蜜臀 | 黄色av免费在线看| 亚洲黄页网在线观看| 亚洲大尺度网站| 欧美一级理论片| 国产极品999| 欧美日韩美女一区二区| 中日精品一色哟哟| 91成人免费在线| 国产乡下妇女三片| 欧美三区在线观看| 伊人网av在线| 欧美日韩精品久久久| 中国一级片黄色一级片黄| 欧美影院午夜播放| 中文字幕有码无码人妻av蜜桃| 在线一区二区观看| 亚洲一区二区三区高清视频| 欧美美女一区二区| 99热这里只有精品99| 日韩三级视频在线看| 精品国产一级片| 欧美精品一区二区三| 国产 欧美 自拍| 亚洲精品大尺度| 欧美精品a∨在线观看不卡| 欧美变态口味重另类| 国模人体一区二区| 日韩精品视频在线播放| 欧美精品久久久久久久久久丰满| 国产亚洲精品久久| 欧美另类极品| 久久久久国产精品免费网站| 免费毛片b在线观看| 欧洲s码亚洲m码精品一区| 国产v综合v| 国产在线播放91| 一区二区三区在线资源| 久久99热只有频精品91密拍| 免费欧美视频| 一区高清视频| 久久一区二区三区电影| 一区二区不卡在线视频 午夜欧美不卡'| 精品久久中文| 一本一本a久久| 雨宫琴音一区二区在线| 女性隐私黄www网站视频| 久久aⅴ国产欧美74aaa| 极品人妻一区二区| 久久这里都是精品| 999精品视频在线观看播放 | 国产网站在线看| 在线观看91视频| 国产成人麻豆精品午夜在线| 精品av综合导航| 国产黄色免费在线观看| 久久精品国产视频| 狂野欧美性猛交xxxxx视频| 欧洲一区二区视频| 日本超碰一区二区| 日韩成人在线资源| 欧美日韩视频| 日本久久久久久久久久久久| 国产成人精品影视| av黄色在线免费观看| 一区二区成人在线| www.亚洲激情| 精品国产凹凸成av人导航| 国产在线一在线二| 久久综合伊人77777| 国产三线在线| 国产一区香蕉久久| 视频一区中文| 日韩五码在线观看| 精品一区二区免费在线观看| 中文字幕人妻一区| 中文字幕日韩欧美一区二区三区| 亚洲午夜18毛片在线看| 日韩精品最新网址| 尤物网址在线观看| 人人澡人人澡人人看欧美| 国产精品视频一区二区三区综合| 久久国产主播精品| 欧美日本一区二区视频在线观看| 91视频免费版污| 91免费小视频| 久草视频精品在线| 日韩美一区二区三区| 黄色网在线播放| 国产精品久久国产精品99gif| 麻豆一区二区| 国产二区视频在线| 精品一区二区av| 国产精品一区二区入口九绯色| 亚洲激情在线激情| 中文字幕在线观看国产| 欧美精品一区二区在线观看| 在线免费观看的av| 成人美女av在线直播| 91综合视频| 日本肉体xxxx裸体xxx免费| 国产亚洲一区二区三区四区| 日本五十熟hd丰满| 欧美三级视频在线| 日本激情一区二区三区| 久久久久国产精品免费| 操欧美女人视频| 国产一级爱c视频| 白白色亚洲国产精品| 久久高清无码视频| 7777精品伊人久久久大香线蕉的| av在线第一页| 国产精品一区二区三区毛片淫片 | 日本成人看片网址| 丝袜美腿一区二区三区| av网在线播放| 欧美男男青年gay1069videost| 麻豆传媒在线免费| 91在线免费视频| 欧美日韩午夜| 91传媒理伦片在线观看| 狠狠躁18三区二区一区| 台湾av在线二三区观看| 日韩美女主播视频| 日韩片欧美片| 男女污污视频网站| 亚洲激情在线播放| 欧美日韩激情视频一区二区三区| 国产大片精品免费永久看nba| 成人毛片免费看| 男人午夜视频在线观看| 一区二区三区在线观看欧美| 日韩一级片免费在线观看| 国产精品视频最多的网站| 国产精品久久久久一区二区三区厕所| 中文字幕66页| 亚洲主播在线播放| 日韩资源在线| 国产欧美日韩亚洲精品| 亚洲第一区色| 第一次破处视频| 91精品国产91久久综合桃花| 青春草在线视频| 欧美在线播放一区| 精品综合久久久久久8888| 国产精品999在线观看| 在线日韩欧美视频| 午夜免费欧美电影| 日本成人中文字幕在线|