精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估

發布于 2025-10-13 07:10
瀏覽
0收藏

大型語言模型(LLMs)在推理、工具使用和決策方面表現出色,但金融領域的研究仍然不足。現有金融基準主要測試靜態知識,未能反映交易的動態和迭代特性。

本文提出STOCKBENCH基準,旨在評估LLM在真實股票交易環境中的盈利能力和風險管理能力。評估結果顯示,大多數LLM智能體未能超越簡單的買入持有基準,表明靜態問答能力與動態市場交易策略之間存在差距。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

摘要

大型語言模型(LLMs)在推理、工具使用和決策方面表現出色,但金融領域的研究仍然不足。現有金融基準主要測試靜態知識,未能反映交易的動態和迭代特性。

STOCKBENCH用于評估LLM在多月股票交易環境中的表現。智能體每天接收市場信號(價格、基本面、新聞),并需做出買、賣或持有的決策。評估指標包括累計回報、最大回撤和Sortino比率。

評估結果顯示,大多數LLM智能體未能超越簡單的買入持有策略,但部分模型在回報和風險管理上表現出潛力。研究表明,靜態金融知識的優秀表現不一定能轉化為成功的交易策略。STOCKBENCH作為開源資源發布,以支持可重復性和未來研究。

簡介

大型語言模型(LLMs)推動了自主智能體的發展,展現出在推理、工具使用和長期決策中的強大能力。現有金融智能體基準主要集中在靜態問答任務,未能反映實際交易場景。

本文提出STOCKBENCH基準,旨在評估LLM在真實股票交易環境中的盈利能力和風險管理能力。STOCKBENCH特點:真實市場互動、連續決策、數據無污染。評估結果顯示,大多數LLM智能體未能超越簡單的買入持有基準,表明靜態問答能力與動態市場交易策略之間存在差距。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

STOCKBENCH

STOCKBENCH由兩個主要構建塊組成:

  • 回測環境,包含歷史數據用于股票交易決策,模擬真實股票交易。
  • 股票交易智能體工作流,評估LLM骨干作為智能體在回測環境中的表現。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

環境

交易環境設計:模擬真實股票交易,交易智能體僅接觸決策時可用數據。

投資目標:選擇20只道瓊斯工業平均指數中權重最高的股票,確保評估結果穩定,避免短期情緒驅動的波動。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

歷史市場數據:收集股票的開盤價及基本面指標(市值、P/E比率、股息收益率等),防止未來信息泄露。

新聞語料庫:每日收集過去48小時內的相關股票新聞,保留五篇最相關的文章,模擬零售投資者的反應。

數據收集時間窗口:評估窗口為2025年3月3日至6月30日,確保不與訓練數據重疊,涵蓋波動和趨勢反轉。

股票交易智能體工作流程

本文提供一個股票交易智能體工作流程,使大型語言模型(LLM)能與回測環境互動。設計目標:1) 簡化工作流程,避免引入偏見;2) 真實反映零售投資者的決策過程。

工作流程分為四個階段:

  • 投資組合概覽:智能體掃描市場所有股票,獲取相關數據(新聞、持倉、歷史操作、開盤價)。
  • 深入股票分析:選擇特定股票進行詳細分析,獲取基本面數據(市值、市盈率、股息收益率)。
  • 決策生成:基于分析結果,生成對每只股票的決策(增加、減少或持有)。
  • 執行與驗證:將決策轉化為股數,檢查流動性,確保決策可執行,鎖定新組合權重,進入下一天。

STOCKBENCH的特點

真實市場互動:通過精選投資目標、可靠的價格和基本數據、及時的新聞語料,模擬真實交易環境,避免不切實際的輸入。

持續決策:智能體進行投資組合概覽、深入股票分析,并基于分析生成每日交易決策,反映零售投資者的決策過程。

數據無污染:確保智能體在訓練期間未接觸測試數據,通過使用近期市場數據實現時間上的分離,避免與現代大語言模型的訓練數據重疊。

主要實驗

實驗設置

實驗設置:評估LLM智能體在STOCK BENCH交易工作流中的表現,包括交易環境、基準模型、被動基線和評估指標。

交易環境:選擇20只道瓊斯工業平均指數(DJIA)股票,評估期為2025年3月3日至6月30日,共82個交易日。模型以$100,000現金和零持倉開始,每日開盤交易,輸入包括過去7天的歷史操作、48小時內的新聞和基本面數據。

評估模型:基準包括多種LLM模型(如Qwen3、DeepSeek、Kimi-K2等)和閉源API(如OpenAI的O3、Anthropic的Claude-4-Sonnet),所有模型使用32,768個token上下文窗口,運行三次以確保結果可靠。

被動基線:實施等權重買入持有策略,初始資本均勻分配于所有股票,作為比較的基準。

評估指標:

  • 最終回報:投資組合價值的百分比變化,反映整體盈利能力。
  • 最大回撤:投資組合價值從峰值到谷底的最大下降,衡量下行風險。
  • Sortino比率:風險調整回報指標,僅懲罰下行波動,適用于非對稱收益。

綜合排名:通過計算每個指標的z-score并平均,得出單一性能評分,平衡盈利能力與風險管理。

結果

LLM智能體在真實市場中能夠盈利,大多數模型超越了被動買入持有基準(0.4%回報,-15.2%最大回撤,Sortino比率0.0155),部分智能體回報超過2%,風險更低。

LLM智能體有效管理下行風險,所有模型的最大回撤均低于基準,最佳智能體的回撤在-11%至-14%之間。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

理性模型不一定表現更佳,盡管Qwen3-235B-Think等模型在復雜推理任務中表現強勁,但在交易任務中,指令調優模型如Qwen3-235B-Ins表現更好,最大回撤更低(-11.2%對比-14.9%),顯示出推理能力與動態決策之間的差距。

分析

投資目標規模的影響

投資目標規模對智能體性能的影響顯著,隨著目標規模(5、10、20、30個DJIA成分股)的擴大,投資組合的權重差異增加,表現出更高的波動性。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

可擴展性挑戰:所有模型在投資組合規模增加時表現下降,平均收益降低,收益波動性上升,表明多資產決策的復雜性。

模型規模的穩健性:較大規模模型Kimi-K2在中等投資組合規模(10-20只股票)下保持相對穩定的風險收益特征,正收益;而較小模型GPT-OSS-120B則表現出嚴重的性能下降和過度波動,說明模型容量的增加有助于提升多資產決策的泛化能力和穩定性。

錯誤對交易流程的影響

交易過程中常見的錯誤有:算術錯誤(計算買賣股數時出錯)和格式錯誤(未遵循JSON格式導致解析失敗)。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

思維模型的算術錯誤發生率低于指令模型,符合其在數學推理任務中的優異表現。

思維模型的格式錯誤發生率高于指令模型,可能因其輸出過于復雜,導致偏離預期格式。

數據來源消融研究

LLM智能體依賴新聞文章和基本財務數據兩種信息源,前者反映市場情緒,后者提供關鍵財務指標。進行消融研究,逐步去除輸入,發現累計回報隨著信息源的減少而下降。Kimi-K2模型在去除新聞后仍較為穩健,但缺失兩者時表現顯著下降。GPT-OSS-120B對新聞和基本面信號依賴更強,表現下降更明顯。研究表明,LLM交易智能體能夠有效整合文本和數值信息,提升交易策略的有效性。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

評價窗口的影響

研究不同市場條件下模型表現,使用2025年1月至4月的下行期和5月至8月的上行期進行實驗。模型包括Kimi-K2、DeepSeek系列、GPT-OSS系列和被動基準。

STOCKBENCH: 大模型現實環境股票交易盈利及風險評估-AI.x社區

模型排名在下行期和上行期顯著變化,GPT-OSS120B在下行期排名靠后,上行期排名靠前,表明其適合牛市。Kimi-K2在兩個時期保持相對穩定的排名,顯示出對市場波動的魯棒性。在下行期,所有LLM智能體未能超越被動基準,而在上行期,大多數LLM智能體表現優于基準,表明LLM智能體在熊市中表現不佳,需改進。

總結

STOCKBENCH是一個新穎的基準,用于評估LLM智能體在真實股票交易場景中的表現。該基準模擬動態市場環境,要求在多個月的時間內進行持續決策,評估盈利能力和風險管理能力。實驗表明,當前LLM智能體能夠盈利,但難以持續超越簡單基線,顯示出該領域的挑戰。STOCKBENCH將為研究社區提供重要資源,推動智能金融智能體的發展。未來工作將增強基準,增加市場場景,并探索新智能體架構以提升交易表現。

本文轉載自??靈度智能??

已于2025-10-13 07:10:39修改
收藏
回復
舉報
回復
相關推薦
丝袜国产日韩另类美女| 要久久电视剧全集免费| 亚洲自拍偷拍综合| 国产一区高清视频| 中文字幕手机在线视频| 99re66热这里只有精品8| 欧美mv日韩mv| 国产 porn| 先锋成人av| 国产亚洲精品超碰| 97在线资源站| 波多野结衣一区二区三区在线| 久久久久久久久久久妇女| 亚洲第一网中文字幕| 天天色综合社区| av手机免费在线观看| 中文无字幕一区二区三区| 国产精品一区在线观看| 中文字幕欧美人妻精品| 亚洲国内欧美| 免费不卡在线观看av| 久久久久久国产精品无码| 亚洲一区二区三区中文字幕在线观看 | 欧美在线视频网站| 欧美三级小视频| av中文一区| 亚洲第一男人天堂| 国产女同无遮挡互慰高潮91| 欧美天堂视频| 亚洲成av人影院在线观看网| 先锋影音男人资源| 在线观看免费高清完整| 久久久久88色偷偷免费| 国产另类自拍| 亚洲黄色小说网| 久久精品国产精品青草| 国产福利精品在线| 在线观看免费国产视频| 女生裸体视频一区二区三区| 一本大道亚洲视频| 波多野结衣一本| 欧美一区 二区| 精品久久一区二区| 国产亚洲色婷婷久久| 国产精品美女久久久久人| 日本道精品一区二区三区| 日韩人妻精品无码一区二区三区| 黑人另类精品××××性爽| 一区二区三区精密机械公司| 特级黄色录像片| 久久久久久久久免费视频| 日本一区二区三区在线观看| 日本a级片久久久| 毛片在线能看| 久久精品视频免费| 日韩精品久久一区| 大胆av不用播放器在线播放| 久久久777精品电影网影网| 狼狼综合久久久久综合网| 深夜福利在线看| 92国产精品观看| 久久精品美女| 国产视频三级在线观看播放| 欧美国产欧美综合| 亚洲第一在线综合在线| 99视频在线观看地址| 国产精品福利一区二区| 亚洲av首页在线| 欧美xxxx视频| 黑人巨大精品欧美一区二区三区| 色综合av综合无码综合网站| 成人免费福利| 3d成人h动漫网站入口| 熟妇无码乱子成人精品| 成人免费在线电影网| 亚洲精品v欧美精品v日韩精品| 国产偷人妻精品一区| 国产日产一区 | 国产模特精品视频久久久久| 欧美一区二区三区图| 亚洲图片欧美日韩| 九九国产精品视频| 国产精品美女黄网| 国产在线黄色| 亚洲精品视频观看| 91九色在线观看视频| 九九九伊在线综合永久| 欧美一区二区视频网站| 久久久久亚洲AV成人无码国产| 免费看成人吃奶视频在线| 最近2019中文字幕mv免费看| 国产探花在线播放| 性欧美长视频| 91在线观看免费高清完整版在线观看| 欧美视频一二区| 欧美韩日一区二区三区四区| 成人在线视频一区二区三区| 你懂得影院夜精品a| 91精品国产综合久久精品| 日b视频在线观看| 欧美激情偷拍自拍| 97激碰免费视频| 亚洲天堂网视频| av亚洲精华国产精华| 国产麻豆电影在线观看| 日韩欧美精品一区二区三区| 欧美精品一二三区| 37p粉嫩大胆色噜噜噜| 欧美在线免费一级片| 日韩av观看网址| 亚洲精选一区二区三区| 中文字幕在线观看一区二区| 97超碰青青草| 91九色鹿精品国产综合久久香蕉| 中文字幕视频在线免费欧美日韩综合在线看 | 国产精品欧美亚洲777777| 亚洲成人av综合| 国产精品三级久久久久三级| 9久久9毛片又大又硬又粗| 亚洲网站免费| 亚洲网站在线看| 日本一本高清视频| 国产真实乱对白精彩久久| 欧美亚洲免费高清在线观看 | 国产精品日韩欧美综合| 国产xxxx在线观看| 国产精品国产三级国产aⅴ入口 | 国产69精品久久久久毛片| 亚洲午夜精品一区二区| 欧美一级大片| 日韩精品在线第一页| 久久综合色综合| 国产在线一区二区| 亚洲图片都市激情| 国产亚洲欧美日韩精品一区二区三区 | 自拍一级黄色片| 成人精品天堂一区二区三区| 欧美中文在线字幕| 五月天福利视频| 亚洲成人久久影院| 99riav国产精品视频| 亚洲一区二区| 5g国产欧美日韩视频| 嫩草在线视频| 欧美日韩一二三| 日本美女xxx| 青青草97国产精品免费观看无弹窗版 | 亚洲欧洲日本在线| 五月婷婷六月丁香激情| 国产欧美日韩精品高清二区综合区| 青青青国产精品一区二区| 午夜国产在线观看| 五月天中文字幕一区二区| 无码成人精品区在线观看| 亚洲国产91| 国内精品久久国产| 无遮挡爽大片在线观看视频| 亚洲全黄一级网站| 黄色污污视频软件| 国产精品久久免费看| 国产成人美女视频| 一区二区影院| 国产一区二区三区免费不卡| 999福利在线视频| 国产丝袜一区二区三区免费视频| 久久久久久无码精品大片| 欧美激情资源网| 亚洲一二三不卡| 伊人久久综合| 欧美极品一区| 九九久久国产| 欧美精品在线免费观看| 日韩在线观看视频一区二区三区| 欧美日韩另类在线| av免费播放网站| 国产在线看一区| 国产毛片视频网站| 欧美综合在线视频观看| 亚洲精品免费av| 爱草tv视频在线观看992| 亚洲午夜小视频| 国产女18毛片多18精品| 精品人伦一区二区三区蜜桃网站| av中文字幕免费观看| 国产一区二区在线免费观看| 久久国产精品网| 成人亚洲一区| 国外成人在线视频网站| 国产私拍福利精品视频二区| 久久夜精品va视频免费观看| 午夜在线视频免费| 欧美日韩国产在线观看| 伊人国产在线观看| 国产精品污网站| 中文字幕无码人妻少妇免费| 麻豆91在线播放| 三上悠亚久久精品| 亚洲成av人片一区二区密柚| 久久一区二区精品| 精品国产鲁一鲁****| 人人澡人人澡人人看欧美| 国产写真视频在线观看| 亚洲女人天堂av| 国产www免费观看| 欧洲视频一区二区| 日韩精品无码一区二区| 亚洲欧洲av另类| 久久久久亚洲av无码a片| 成人性生交大片免费看中文 | 亚洲一区二区福利| 亚洲精品国产精品国| 欧美日韩三级在线| 一级片中文字幕| 一级特黄大欧美久久久| 一本色道久久88| 久久久久久亚洲综合| 成人做爰www看视频软件| 人妖欧美一区二区| 黄色网页免费在线观看| 欧美日韩一区自拍| 在线视频精品一区| 欧美午夜精彩| 久久香蕉综合色| 超碰一区二区三区| 亚洲在线视频福利| 亚洲毛片在线免费| 国产精品视频久久| 另类专区亚洲| 欧洲美女免费图片一区| 国产自产自拍视频在线观看| 欧美日产国产成人免费图片| 国产激情在线| 久久精品电影一区二区| melody高清在线观看| 亚洲天堂影视av| 精品福利视频导航大全| 亚洲欧美日韩国产中文专区| 亚洲区小说区图片区| 亚洲精品成人网| 好男人www在线视频| 精品国产网站在线观看| 精品区在线观看| 日韩欧美在线网站| 国产欧美久久久精品免费| 欧美日韩精品一区二区三区蜜桃| 日本成人一级片| 欧美日韩在线播放三区四区| 一级片在线免费播放| 欧美亚一区二区| 一区不卡在线观看| 欧美日本国产一区| 国产露脸无套对白在线播放| 日韩一区二区电影网| 免费看黄网站在线观看| 欧美xxxx老人做受| 手机在线观看毛片| 日韩精品在线播放| 成人综合影院| 久久精品视频导航| 黄色在线观看视频网站| 97热在线精品视频在线观看| 午夜伦理福利在线| 国产精品igao视频| 日韩第二十一页| 成人久久久久爱| 99ri日韩精品视频| 欧美三级网色| 亚洲h色精品| bt天堂新版中文在线地址| 99视频一区| 日本成人黄色网| 激情深爱一区二区| www.com日本| 久久综合九色综合欧美亚洲| 美国黑人一级大黄| 亚洲精品国产a久久久久久| 国产精彩视频在线观看| 色婷婷狠狠综合| 国产精品人人爽| 精品对白一区国产伦| 毛片网站在线观看| 久久精品国产欧美亚洲人人爽| 久草在线资源站资源站| 日本高清不卡在线| 伊人久久大香| 久久久神马电影| 久久资源中文字幕| 我的公把我弄高潮了视频| 日本伊人色综合网| 风韵丰满熟妇啪啪区老熟熟女| 99久久精品一区| av最新在线观看| 午夜精品久久久久久久久久| 在线免费观看一区二区| 精品国内片67194| 9色在线视频| 69久久夜色精品国产7777| **精品中文字幕一区二区三区| 国产精品一区二区你懂得| 日韩欧美一区二区三区在线视频| 精品人妻大屁股白浆无码| 丝袜美腿亚洲综合| 国产国语老龄妇女a片| 欧美国产1区2区| 日韩女优在线观看| 欧美一二区视频| 91在线免费看| 欧美中文字幕视频| av日韩在线播放| 中文字幕在线亚洲三区| 久久综合伊人| 午夜不卡久久精品无码免费| 亚洲色欲色欲www在线观看| 日韩免费av网站| 日韩电视剧免费观看网站| 91在线中文| 国产免费一区二区三区香蕉精| 欧美日韩麻豆| 91免费黄视频| 国产盗摄女厕一区二区三区| 男女男精品视频网站| 欧美性xxxx极品hd欧美风情| 风流老熟女一区二区三区| 麻豆国产精品va在线观看不卡 | 欧美日韩一卡二卡三卡| 免费国产在线观看| 69av在线视频| 神马久久av| 成熟了的熟妇毛茸茸| www.欧美.com| 日本亚洲色大成网站www久久| 日韩一卡二卡三卡国产欧美| 免费黄色在线看| 成人免费激情视频| 色呦哟—国产精品| 天天干天天爽天天射| 欧美韩国日本综合| 一级特黄免费视频| 中文字幕欧美日韩va免费视频| 深夜视频一区二区| 午夜精品福利一区二区| 丝袜脚交一区二区| 欧美精品日韩在线| 欧美四级电影网| 搞黄视频在线观看| 国产精品久久久久久久久久久久久久| 国产亚洲一区| 成人免费视频久久| 亚洲国产精品传媒在线观看| 伊人成年综合网| 最近2019中文字幕mv免费看 | 黄色美女视频在线观看| 俄罗斯精品一区二区三区| 欧美日韩hd| 日本国产在线视频| 疯狂做受xxxx高潮欧美日本| 亚洲日本中文字幕在线| 欧洲永久精品大片ww免费漫画| 久久99久久人婷婷精品综合| 在线免费视频a| 国产精品久久久久久户外露出 | 国产在线观看免费av| 亚洲国产古装精品网站| 欧美a级在线观看| 欧美自拍资源在线| 久久超级碰视频| 欧美高清视频一区二区三区| 亚洲成**性毛茸茸| 亚洲v.com| 亚洲图片在线观看| 国产99精品在线观看| 在线能看的av| 色香阁99久久精品久久久| 精品国产乱码一区二区三区| 欧美乱做爰xxxⅹ久久久| 91片在线免费观看| 中文字幕无码乱码人妻日韩精品| 欧美成人午夜免费视在线看片| 国产一区丝袜| 黄色手机在线视频| 亚洲精品成人少妇| 天堂在线一二区| 国产视频观看一区| 亚洲黄色影片| 国内精品卡一卡二卡三| 日韩欧美综合在线| 欧美理论影院| 波多野结衣与黑人| 久久久99精品免费观看不卡| www.国产三级| 国产成人精品一区| 欧美激情 亚洲a∨综合| 国产免费看av| 欧美一级黄色片| 欧美理论影院| 欧美中日韩在线| 国产女主播一区| 色婷婷在线视频| 成人免费视频97| 视频一区二区三区在线|