從模式到預測:嘈雜金融市場中基于形狀的方向預測框架
深度學習在股市預測中面臨挑戰,因市場波動性大且信號噪聲比低。本文提出一種兩階段框架用于金融時間序列的模式基礎方向預測。結合SIMPC(基于DTW的無監督聚類方法)和JISC-Net(基于形狀的分類器)。SIMPC發現多變量模式,適應動態窗口、幅度縮放和時間扭曲。JISC-Net利用部分輸入序列進行可解釋預測。
在四種金融資產上的實證評估顯示,該方法在方向準確性和交易表現上顯著優于競爭基線。該框架通過聚焦于與經驗提取模式結構對齊的局部子序列,增強了可解釋性和實際應用價值。

摘要
本文提出一種兩階段框架,結合無監督模式提取與可解釋預測。
- 第一階段:SIMPC對多變量時間序列進行分段和聚類,提取對幅度縮放和時間扭曲不變的重復模式。
- 第二階段:JISC-Net使用提取模式的初始部分作為輸入,預測后續短期方向性運動。
在比特幣和三只S&P 500股票的實驗中,該方法在12個指標-數據集組合中排名前兩名,優于基線模型。與傳統深度學習模型不同,該方法提供透明決策,揭示驅動預測結果的模式結構。
簡介
深度學習在股市預測中面臨挑戰,因市場波動性大且信號噪聲比低。預測方法主要可以分為兩類:內部時間序列模型(僅使用歷史價格和技術指標)和混合模型(結合外部信號)。本研究專注于價格數據,遵循有效市場假說,適用于多種股票和市場。
價格模型面臨三大挑戰:
- 金融時間序列噪聲大,長期信號弱,難以識別有意義的模式。
- 重復模式在不同尺度和持續時間上變化,稱為幅度縮放和時間扭曲。
- 深度神經網絡能建模復雜市場動態,但可解釋性差。
本文呢提出一種兩階段框架,從噪聲多變量金融時間序列中提取可解釋模式。
- 第一階段:Selective Invariant Multivariate Pattern Clustering (SIMPC) 模塊,使用動態時間規整(DTW)對多變量子序列進行分段和聚類,識別幅度縮放和時間扭曲不變的模式。
- 第二階段:Joint-variable Invariant Shapelet-Classification Network (JISC-Net),結合DTW與多長度輸入的擴張因果卷積神經網絡(Mdc-CNN),學習對時間扭曲魯棒的表示。
JISC-Net通過兩階段過濾過程識別和過濾有意義的模式實例,排除噪聲或非模式段。在四種金融資產上的實證評估顯示,該方法在方向準確性和交易表現上顯著優于競爭基線。該框架通過聚焦于與經驗提取模式結構對齊的局部子序列,增強了可解釋性和實際應用價值。
相關工作
時間序列預測模型
多變量時間序列預測在建模復雜的時間和變量依賴性方面取得了顯著進展。FEDformer、PatchTST和TimesNet等模型在標準基準上有效,但在噪聲金融時間序列上表現不佳,易過擬合。針對金融領域的挑戰,提出了股票特定架構,如SFM網絡、StockMixer、MASTER和SAMBA,盡管有效,但仍缺乏透明性。
時間序列中的模式聚類
開發了無監督和弱監督方法識別重復的時間結構,如DTCC引入對比學習,但未解決金融時間序列的特定挑戰。SISC算法有效識別潛在模式,但僅限于單變量輸入,可能包含噪聲段。提出的SIMPC擴展了SISC,支持多變量輸入,使用領域信息原型初始化聚類,并過濾低信息子序列。
基于形狀的分類
形狀方法通過識別區分性子序列提供可解釋的時間序列分類。ShapeNet將方法推廣到多變量序列,結合擴張因果卷積和三元組損失。提出的JISC-Net通過DTW三元組損失增強對金融數據常見時間扭曲的魯棒性,保持變量間的聯合時間依賴性。
問題建模
目標:在噪聲多變量時間序列中識別和檢測具有幅度縮放和時間扭曲特征的重復模式,采用無監督方式預測未來的方向性運動(上漲或下跌)。
方法分為兩個階段:模式提取和分類。

模式提取階段:使用SIMPC對時間序列X進行分段,生成P個模式簇C,每個簇包含多個時間上連續的子序列。每個子序列s_{p,j}是X的一個連續片段,長度在[L_min, L_max]之間,且子序列的起始時間在所有簇中唯一。最終階段進行簇合并,得到精煉的模式集P'。
分類階段:JISC-Net通過提取的模式集C,將輸入子序列s??,??映射到模式類型的概率分布。僅使用子序列的初始??部分進行分類,剩余部分可在模式檢測后推斷。訓練時使用K-S檢驗進行標簽級過濾,排除統計上不顯著的子序列。推理時采用基于置信度的閾值(top-??%)過濾模糊或非模式實例。JISC-Net能夠可靠地識別和拒絕不對應有意義模式的輸入。
SIMPC: 模式提取
SIMPC算法:通過將多變量時間序列分段為可變長度候選項并僅聚類最具信息量的部分,改進了SISC算法,解決了其局限性。擴展了動態時間規整(DTW)到多變量輸入,捕捉變量間依賴性,增強了行為的可解釋性。通過使用傳統圖表模式原型進行中心初始化,結合領域知識,提升聚類效果。剔除低信息段和稀疏聚類,以減少噪聲。
預處理:使用Nadaraya-Watson核回歸平滑多變量輸入,降低短期波動。

領域適應:提取符合傳統圖表規則的多變量時間序列段,作為初始中心集。識別基于價格的模式一致性區間,收集市場變量,使用Min-Max縮放進行歸一化,線性插值至統一長度??。通過DTW Barycenter Averaging (DBA)計算每個圖表模式類的代表性原型,保持結構特征并對齊序列。
改進的K-means++初始化:固定??個原型,隨機選擇剩余的?????個質心,基于DTW距離更新概率。


迭代聚類生成與質心更新:提取候選段并與質心比較,選擇最小DTW距離的質心。如果最小距離 ?? ★ ≤ DTW 閾值 ??,段落分配給 ?? ★,時間索引按固定步長前進。完成一次遍歷后,至少有 ?? 個成員的簇使用 DBA 重新壓縮,小簇被丟棄,得到的重心經過 Min-Max 歸一化后作為更新的質心。若簇數低于 ??,重復 K-means++ 初始化,使用更新的質心作為固定種子,排除已分配的起始索引 ??。完成 ?? 次聚類迭代后,合并任意質心 ( ?? ?? , ?? ?? ),使得 ?? DTW ( ?? ?? , ?? ?? ) ≤ ??,最終質心集為 C = { ?? 1 , . . . , ???? ′ },其中 ?? ′ ≤ ??。

偽代碼:算法 1 為 SIMPC 的偽代碼,輸出模式集 C,作為后續形狀基分類器的顯式標簽,實現 JISC-Net 的模式檢測轉為完全監督學習任務。

JISC-Net:模式檢測
JISC-Net是對ShapeNet的擴展,旨在發現多變量時間序列中的形狀特征(shapelets),以提高分類的可解釋性,特別適用于金融領域。ShapeNet通過滑動窗口和因果CNN嵌入候選形狀特征,并通過端到端訓練選擇最具類信息的形狀特征,適應時間變化和幅度縮放。
JISC-Net的創新點:
- 將整個D維觀測視為單個token,保留跨變量交互。
- 用DTW距離替代ShapeNet中的歐幾里得距離,提高對時間扭曲的魯棒性。
這些改進使JISC-Net能夠捕捉更豐富的變量間動態,同時對異構時間尺度保持韌性。

Mdc-CNN編碼器與基于DTW的三重損失。輸入為模式標記的子序列。通過線性插值和列歸一化處理子序列,形成固定長度的輸入。采用多尺度滑動窗口對子序列進行切片,使用DTW-based K-means進行聚類,增加訓練實例。從聚類中選擇錨點、正樣本和負樣本,進行編碼并計算距離。損失函數通過懲罰錨-正距離和增強錨-負分離來優化編碼器,使用DTW提高時間不變性。



Shapelet發現
形狀發現:利用訓練好的編碼器發現具有區分性的形狀,采用K-means聚類將嵌入的段落分為g個簇,選擇距離簇中心最近的段落作為候選形狀,確保每個簇的純度超過閾值P',并通過效用分數U_c對候選形狀進行排名。
SVM分類器:使用候選形狀訓練支持向量機(SVM),計算每個候選形狀與所有相同長度段落的最小DTW距離,生成特征向量并訓練線性SVM,輸出模式概率分布。
預測準確性提升:在訓練階段使用K-S檢驗識別非區分性模式標簽,推斷階段保留高置信度的測試子序列,初始部分作為分類器輸入,檢測模式匹配以進行方向性預測。
實驗
設計實驗以解決四個研究問題:多變量輸入、基線比較、基于信心的過濾和可解釋性。
實驗設置
評估框架在兩個金融領域:加密貨幣(BTC/USD)和股票(S&P 500)。
數據:股票數據集包含三只高市值股票:AAPL(科技)、BRK.B(金融)、XOM(能源)。數據集劃分:訓練集(BTC/USD: 2014/01/01–2021/12/31;股票: 2008/01/01–2018/12/31),驗證集(BTC/USD: 2022/01/01–2023/01/31;股票: 2019/01/01–2021/07/30),測試集(BTC/USD: 2024/02/01–2025/05/13;股票: 2021/08/01–2025/05/13)。所有模型使用相同輸入特征進行訓練和評估。
超參數設置:模式長度約20天,提取8個模式,使用6個原型,DTW閾值2.3,最小聚類大小40。JISC-Net使用每個子序列的前80%進行分類,線性插值至長度100。多尺度形狀提取滑動比率為{0.2, 0.4, 0.6},形狀數量設為10。
RQ1:輸入變量的影響
研究不同輸入變量組合對SIMPC算法提取模式的結構和可分離性的影響,包括:僅收盤價(C)、收盤價和成交量(CV)、收盤價、成交量和RSI(CVR)。依賴DTW累積歐幾里得距離,聚類閾值??根據輸入維度進行縮放:1D為?? = 2.3/3,2D為?? = 2.3/2,3D為?? = 2.3。

提取的子序列數量相近:C: 658, CV: 657, CVR: 642,平均每個聚類約80個子序列。聚類質量因輸入維度而異,較大的平均DTW距離表示模式中心的多樣性,較大的最小距離表示更好的聚類分離。C配置中,部分中心對的距離低于閾值??,顯示潛在結構重疊;添加成交量和RSI提高了模式中心的獨特性。CVR配置在合并前顯示出最豐富和分離良好的中心,強調多變量輸入在捕捉金融時間序列結構變化中的重要性。
RQ2:基線對比
評估指標:使用F1-score、Win-Loss Ratio、Average Return和Total Return with fees四個指標,F1用于處理類別不平衡,WLR衡量正確與錯誤交易的比例,AR表示每筆交易的預期盈利,TRwf則考慮交易費用后的累計收益。
交易協議:每4天開倉一次,基于預測的4天走勢,交易時收取0.1%手續費,確保所有模型的交易頻率一致。
基線比較:與三類基線模型進行比較,包括隨機策略、Qlib平臺的定量投資方法(如LightGBM、ADARNN等)和近期的時間序列方法(如DLinear、Autoformer等)。
結果:Ours-T@100在12個指標-資產組合中,8個指標表現最佳,3個指標排名第二,主要指標為F1、WLR、AR。在盈利能力(AR)方面,Ours-T@100在三項資產上記錄最高平均回報,第四項資產排名第二。調整費用后的總回報(TRwf)保持正值且最大,顯示出實際經濟價值。模型與基線執行相同數量的交易,性能提升源于信號質量優越,而非交易頻率降低??蚣芡七t預測,直到可靠檢測到重復模式,避免高噪聲段,提升預測信心。通過專注于高置信度的時間步,框架在嘈雜的金融環境中實現顯著的統計和經濟改進。

RQ3:JISC-Net中的兩級過濾
JISC-Net的兩階段過濾過程基于SVM模式分類器的輸出。
第一階段:使用K-S檢驗對每個模式標簽進行過濾,p值小于0.05的標簽被保留。表3顯示,XOM標簽中只有標簽7未通過K-S檢驗,被重新分類為非模式。K-S過濾后,BTC/USD去除13.90%測試子序列,AAPL去除41.47%,BRK.B去除8.74%,XOM去除5.60%,對應低可分離性的模式標簽。
第二階段:通過最大類概率進行全局閾值篩選,僅保留前?? %的預測結果,以提高推斷效果。表2比較了不同閾值(T@100, T@80, T@60, T@20)的表現,發現適度的閾值(如T@80)在收益和風險之間取得良好平衡。在XOM上,T@80的平均回報(AR)為0.889,調整后總回報(TRwf)為1.219,交易數量為177,顯示出低置信度預測的過濾能提升盈利性。更激進的過濾(如T@20)雖然AR最高(1.567),但由于交易稀少(29),導致盈利性顯著下降(0.396)。
定性影響混淆結構:圖4展示了兩階段過濾對分類一致性的影響,混淆矩陣經過K-S過濾后,噪聲標簽(-1)被有效減少,分類結果更為準確。應用T@30閾值后,混淆矩陣趨向對角線,表明大多數噪聲序列被自信拒絕,進一步降低了模式模糊性。


RQ4:基于模式的預測分析
通過對XOM資產的案例研究,分析JISC-Net模型的成功和失敗交易,重點關注輸入序列、預測模式和實際價格軌跡。成功案例中,模型準確預測了價格走勢,輸入序列與預測模式高度一致,實際市場表現與預測相符。失敗案例中,模型預測與實際市場走勢偏離,可能因過擬合早期輸入,建議引入概率預測以捕捉未來價格的不確定性。第三種失敗案例顯示輸入序列與預測模式明顯不符,可能是動態時間規整(DTW)方法的局限性,建議通過形狀感知懲罰和局部特征一致性檢查來改進DTW。JISC-Net結合SIMPC提供了可解釋性,支持用戶在交易前驗證模式匹配的合理性,增強人機協作決策。


總結
本文提出一種兩階段框架用于金融時間序列的模式基礎方向預測。結合SIMPC(基于DTW的無監督聚類方法)和JISC-Net(基于形狀的分類器)。SIMPC發現多變量模式,適應動態窗口、幅度縮放和時間扭曲。JISC-Net利用部分輸入序列進行可解釋預測。在四個資產類別的實驗中,該方法在方向準確性和交易表現上優于定量投資模型和深度學習方法。提高可解釋性以支持人機協作決策。未來工作將探索概率預測和形狀感知對齊,以增強魯棒性和泛化能力。
本文轉載自??靈度智能??

















