TRADES金融AI模拟框架:股价预测表现提升3.48倍,开启金融市场新篇章!
金融市场复杂,建模困难,尤其是限价订单簿(LOB)市场模拟。本文提出TRADES模型,基于Transformer架构生成真实的订单流时间序列,捕捉高频市场数据的时空特征。采用预测评分(MAE)作为量化评估指标,TRADES在两只股票上相较于现有技术提升了3.27倍和3.48倍。TRADES有效学习条件数据分布,能够响应实验代理,适用于交易策略校准和市场影响实验。基于TRADES开发了DeepMar
金融市场复杂,建模困难,尤其是限价订单簿(LOB)市场模拟。传统市场模拟方法如回测和互动代理基础模拟(IABS)存在局限性,回测缺乏响应性,IABS难以获得真实的多代理模拟。
本文提出TRADES模型,基于Transformer架构生成真实的订单流时间序列,捕捉高频市场数据的时空特征。基于TRADES开发了DeepMarket,首个开源深度学习市场模拟框架,并提供TRADES生成的合成LOB数据集。
TRADES在现实性和响应性方面进行了评估,生成的数据在真实数据分布上覆盖率平均为67%。TRADES在Tesla和Intel的表现分别超越现有技术(SoTA)3.27倍和3.48倍。

摘要
金融市场复杂,建模困难,尤其是限价订单簿(LOB)市场模拟。本文提出TRADES模型,基于Transformer架构生成真实的订单流时间序列,捕捉高频市场数据的时空特征。采用预测评分(MAE)作为量化评估指标,TRADES在两只股票上相较于现有技术提升了3.27倍和3.48倍。TRADES有效学习条件数据分布,能够响应实验代理,适用于交易策略校准和市场影响实验。基于TRADES开发了DeepMarket,首个开源深度学习市场模拟框架,并提供TRADES生成的合成LOB数据集。
简介
市场模拟的理想目标包括:校准和评估算法交易策略、进行反事实实验、分析市场统计行为、生成有用的市场数据。模拟的关键要素是现实性(生成数据与实际数据分布的相似度)和响应性(市场对实验代理行为的反应)。传统市场模拟方法如回测和互动代理基础模拟(IABS)存在局限性,回测缺乏响应性,IABS难以获得真实的多代理模拟。生成模型(如Wasserstein GANs)在生成市场订单方面有潜力,但存在模式崩溃和训练不稳定的问题。
本文提出TRADES(基于Transformer的去噪扩散概率引擎),生成高频市场数据,超越现有方法,适应多元时间序列生成。同时发布了DeepMarket框架,促进市场模拟的深度学习研究,提供TRADES实现和合成LOB数据集,支持股票价格预测模型训练,引入新“世界”代理类扩展ABIDES环境,提出市场模拟的首个定量评估指标。
通过一系列实验验证TRADES生成的市场模拟在有用性、真实性和响应性方面的优越性,显示其在预测评分上超越现有方法,并符合金融市场的已建立风格化事实。
背景
多元时间序列生成
生成市场订单流可视为多元时间序列生成问题,定义为 X = {x_{1:N,1:K}}。目标是基于过去的观察生成下一个样本 x_{N+1},可通过自监督学习和自回归模型实现。

使用滑动窗口方法,在每个生成步骤生成单个样本 x_N,并将其附加到条件部分,向前移动时间序列。模型条件数据分布 q(x_N | x_{1:N-1}) 与学习的分布 p_theta(x_N | x_{1:N-1})进行采样。
限价单
限价订单簿(LOB)市场中,交易者可以提交买卖订单,主要有三种订单类型:市场订单、限价订单和撤单。市场订单即时以最佳可得价格成交;限价订单设定买入的最高价或卖出的最低价;撤单用于移除活跃的限价订单。
LOB是一个数据结构,存储并匹配活跃限价订单,所有市场参与者均可访问,随着每个事件(如订单插入、修改、取消和执行)更新。连续双向拍卖(CDA)是最常用的订单匹配机制,订单在最佳买价和最佳卖价重叠时执行,允许持续竞争交易。LOB的演变是一个多变量时间问题,研究可分为四类:LOB动态的实证研究、价格和波动性预测、LOB动态建模和市场模拟。
相关工作
扩散模型在时间序列生成方面的应用逐渐增多,Lim等人提出的TSGM使用RNN架构,而我们的模型基于Transformer架构的条件去噪扩散概率模型。传统市场模拟方法依赖强假设,难以产生真实的模拟,深度学习方法逐渐取而代之。Li等人首次使用WGAN生成基于历史市场数据的订单流,Coletta等人也采用WGAN进行股票市场模拟。Nagy等人使用简化状态空间模型学习长程依赖,Shi和Cartlidge提出的NS-LOB结合了神经Hawkes过程与多智能体交易模拟。我们的方法结合最后订单和LOB快照,提升市场模拟的真实性,避免了GAN和RNN的局限性。
基于Transformer的LOB仿真降噪扩散概率引擎
TRADES是基于Transformer的去噪扩散概率引擎,专用于LOB模拟。条件扩散模型在生成序列任务中优于标准扩散模型,能利用过去观察信息指导生成过程。
使用TRADES生成
本文的目标是通过TRADES生成时间序列,近似真实条件数据分布𝑞(x₀|xₖ)。前向过程仅对“未来”部分添加噪声,保持观察值不变。反向过程扩展无条件分布𝑝ₜ(x₀:𝑇)至条件情况。条件去噪学习函数定义为𝜃₆,设置𝑀=𝑁−1,𝑆=1以简化实验。使用参数化方法估计均值项,方差项通过学习而非固定调度。通过最小化负对数似然来优化模型,最终重建x₀。

![]()

![]()

TRADES中的自监督学习
给定生成目标 x_0 和条件观察 x_c,通过公式
![]()
进行采样,并通过最小化 Eq. (8) 训练 epsilon_theta 。
![]()
优化 Sigma_theta 以最小化 Eq.(9) 的负对数似然,特别是在前期扩散步骤中。

最终损失函数为 Eq.(10) 的线性组合:
![]()
采用自监督方法进行训练,仅对时间序列的最后一个元素 x_{0N} 添加噪声,通过反向过程去噪,学习 以生成新样本。采样过程 TRADES 自回归生成新样本,基于之前的输出进行条件生成,直到模拟结束。
使用TRADES进行市场模拟
TRADES通过生成订单来模拟市场状态,目标是学习订单分布模型。使用多个transformer编码器层来建模金融时间序列的时空关系,并将订单张量和LOB快照投影到高维空间。条件扩散概率模型学习条件概率分布𝑝𝜃(𝑜|𝑠),其中𝑜为新生成的订单,包含价格、数量、方向、深度、时间偏移和订单类型。模型的条件输入包括最近的𝑁个LOB快照,设置𝑁=256和𝐿=10,以捕捉市场供需动态。研究表明,最佳买卖价后的订单对价格发现和短期价格变动有重要影响。

基于合成数据集的DeepMarket框架,用于深度学习市场模拟
DeepMarket是一个开源Python框架,用于基于深度学习的限价单簿市场模拟。主要功能包括:
-
高频市场数据预处理。
-
基于PyTorch Lightning的训练环境。
-
使用WANDB进行超参数搜索。
-
提供TRADES和CGAN实现及检查点,支持直接生成市场模拟。
-
进行全面的定性和定量评估。
通过扩展ABIDES工具,结合世界代理和历史数据进行模拟。
TRADES-LOB:一个新的合成LOB数据集
LOB研究面临大型数据集缺乏的问题,现有免费数据集限制多。本文发布TRADES-LOB合成数据集,包含特斯拉和英特尔的市场数据,覆盖两天。数据集包含四个CSV文件,50列,265,986行,结构包括订单特征、LOB快照和财务指标。关键财务指标包括中价、价差、订单量失衡和VWAP,适用于股票价格预测。
实验
数据集。使用2015年1月2日至30日的特斯拉和英特尔的订单簿数据,包含约2400万样本,强调市场微观结构行为与单一股票特性无关。
实验设置。模型训练70,000步后进行市场模拟,模拟包括电子市场、TRADES代理和可选实验代理,生成的订单与真实市场订单进行比较。
模拟过程。从10:00到12:00进行,平均生成50,000个订单,输出包含订单和LOB快照。
基准比较。与市场重放、IABS配置和Wasserstein GAN(CGAN)进行比较,未与其他SoTA方法比较因缺乏开源实现和可复现性。
结果
本文评估TRADES模型在特斯拉和英特尔市场模拟中的有效性、现实性和响应性。
TRADES模型在两只股票的预测得分上分别超越第二名3.27倍和3.48倍。TRADES的预测得分与市场重播的绝对差异分别为0.29(特斯拉)和0.158(英特尔),表明合成数据与真实数据的训练效果差距缩小。IABS在特斯拉上优于CGAN,但在英特尔上表现最差,且英特尔的中价平均为特斯拉的1/20,导致预测得分规模差异。TRADES生成的市场数据训练的预测模型能有效预测中价。

TRADES生成的时间序列在真实数据分布上表现出较高的现实性,覆盖67.04%的真实数据分布,优于CGAN(52.92%)和IABS(57.49%)。通过主成分分析(PCA)和金融方法比较,TRADES生成的数据符合市场的风格特征。TRADES生成的资产回报线性自相关性迅速衰减,15分钟后统计上不显著,符合市场预期。TRADES展示了正的成交量-波动率相关性,优于特定市场重放日,且基于17天的市场数据训练,准确捕捉该特征。真实市场可能不总是遵循所有风格特征,因其非确定性和非平稳性。CGAN也表现出类似现象,但强度不现实。

TRADES展示了资产收益和波动率的负相关性,模拟市场重放分布,优于IABS。CGAN也表现出类似现象,但强度不现实。TRADES的对数收益分布几乎完美匹配真实数据,IABS因影响比例被排除。TRADES在平方收益的自相关函数上优于其他方法,显示出更好的波动聚集性。TRADES的五个模拟的特斯拉中间价格时间序列表现出多样性和真实性。TRADES的成交量分布与市场重放高度相关,而与SoTA方法截然不同。

TRADES模型的响应性对市场模拟至关重要,尤其是在验证交易策略和市场影响实验时。通过市场影响实验(A/B测试)评估生成器的响应性,进行有无POV代理的模拟实验。实验结果显示,历史市场模拟仅表现出瞬时影响,而扩散基础的模拟则导致价格的永久性偏离。使用TRADES生成的模拟可以进行可行的反事实分析,评估不同交易策略和金融法规的影响。TRADES模拟的市场影响与真实市场观察一致,支持交易策略评估和反事实实验。


DDIM采样
扩散模型的采样时间较长,生成单个样本需数百次迭代。本研究使用100步的扩散过程训练模型。引入DDIM采样方法(𝜂 = 0)以加速生成过程,采用单步处理。在RTX 3090上,每小时市场模拟需六小时计算,DDIM显著提高了计算效率,达到100倍。尽管性能有所下降,但影响不大。

消融和敏感性研究
消融分析。验证LOB条件和特征向量增强对性能的影响。使用LOB条件时,TRADES平均提升2.473;特征增强通过MLP时,平均提升1.980 MAE。

敏感性分析。替换TRADES中的transformer为LSTM,性能下降6.06,因LSTM信息损失。尝试交叉注意力(CA)条件策略,性能下降7.814,因CA限制了模型的能力,无法实现全局注意力。
总结
本文提出了基于Transformer的去噪扩散概率引擎TRADES,用于生成与当前市场状态相关的真实订单流。TRADES在现实性和响应性方面进行了评估,生成的数据在真实数据分布上覆盖率平均为67%。TRADES在Tesla和Intel的表现分别超越现有技术(SoTA)3.27倍和3.48倍。TRADES遵循多项金融市场模拟评估的风格化事实。发布了DeepMarket框架和TRADES-LOB合成LOB数据集,旨在促进研究社区的发展。TRADES被认为是可行的市场模拟策略,但需进一步测试以完善交易策略评估协议。

大模型&AI产品经理如何学习
求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。
1.学习路线图

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2.视频教程
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。


(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方图片前往获取
3.技术文档和电子书
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。

4.LLM面试题和面经合集
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)