TRADES金融AI模拟框架：股价预测表现提升3.48倍，开启金融市场新篇章！

金融市场复杂，建模困难，尤其是限价订单簿（LOB）市场模拟。本文提出TRADES模型，基于Transformer架构生成真实的订单流时间序列，捕捉高频市场数据的时空特征。采用预测评分（MAE）作为量化评估指标，TRADES在两只股票上相较于现有技术提升了3.27倍和3.48倍。TRADES有效学习条件数据分布，能够响应实验代理，适用于交易策略校准和市场影响实验。基于TRADES开发了DeepMar

AGI大模型老王

978人浏览 · 2025-04-02 17:24:38

AGI大模型老王 · 2025-04-02 17:24:38 发布

金融市场复杂，建模困难，尤其是限价订单簿（LOB）市场模拟。传统市场模拟方法如回测和互动代理基础模拟（IABS）存在局限性，回测缺乏响应性，IABS难以获得真实的多代理模拟。

本文提出TRADES模型，基于Transformer架构生成真实的订单流时间序列，捕捉高频市场数据的时空特征。基于TRADES开发了DeepMarket，首个开源深度学习市场模拟框架，并提供TRADES生成的合成LOB数据集。

TRADES在现实性和响应性方面进行了评估，生成的数据在真实数据分布上覆盖率平均为67%。TRADES在Tesla和Intel的表现分别超越现有技术（SoTA）3.27倍和3.48倍。

摘要

简介

市场模拟的理想目标包括：校准和评估算法交易策略、进行反事实实验、分析市场统计行为、生成有用的市场数据。模拟的关键要素是现实性（生成数据与实际数据分布的相似度）和响应性（市场对实验代理行为的反应）。传统市场模拟方法如回测和互动代理基础模拟（IABS）存在局限性，回测缺乏响应性，IABS难以获得真实的多代理模拟。生成模型（如Wasserstein GANs）在生成市场订单方面有潜力，但存在模式崩溃和训练不稳定的问题。

本文提出TRADES（基于Transformer的去噪扩散概率引擎），生成高频市场数据，超越现有方法，适应多元时间序列生成。同时发布了DeepMarket框架，促进市场模拟的深度学习研究，提供TRADES实现和合成LOB数据集，支持股票价格预测模型训练，引入新“世界”代理类扩展ABIDES环境，提出市场模拟的首个定量评估指标。

通过一系列实验验证TRADES生成的市场模拟在有用性、真实性和响应性方面的优越性，显示其在预测评分上超越现有方法，并符合金融市场的已建立风格化事实。

背景

多元时间序列生成

生成市场订单流可视为多元时间序列生成问题，定义为 X = {x_{1:N,1:K}}。目标是基于过去的观察生成下一个样本 x_{N+1}，可通过自监督学习和自回归模型实现。

使用滑动窗口方法，在每个生成步骤生成单个样本 x_N，并将其附加到条件部分，向前移动时间序列。模型条件数据分布 q(x_N | x_{1:N-1}) 与学习的分布 p_theta(x_N | x_{1:N-1})进行采样。

限价单

限价订单簿（LOB）市场中，交易者可以提交买卖订单，主要有三种订单类型：市场订单、限价订单和撤单。市场订单即时以最佳可得价格成交；限价订单设定买入的最高价或卖出的最低价；撤单用于移除活跃的限价订单。

LOB是一个数据结构，存储并匹配活跃限价订单，所有市场参与者均可访问，随着每个事件（如订单插入、修改、取消和执行）更新。连续双向拍卖（CDA）是最常用的订单匹配机制，订单在最佳买价和最佳卖价重叠时执行，允许持续竞争交易。LOB的演变是一个多变量时间问题，研究可分为四类：LOB动态的实证研究、价格和波动性预测、LOB动态建模和市场模拟。

相关工作

扩散模型在时间序列生成方面的应用逐渐增多，Lim等人提出的TSGM使用RNN架构，而我们的模型基于Transformer架构的条件去噪扩散概率模型。传统市场模拟方法依赖强假设，难以产生真实的模拟，深度学习方法逐渐取而代之。Li等人首次使用WGAN生成基于历史市场数据的订单流，Coletta等人也采用WGAN进行股票市场模拟。Nagy等人使用简化状态空间模型学习长程依赖，Shi和Cartlidge提出的NS-LOB结合了神经Hawkes过程与多智能体交易模拟。我们的方法结合最后订单和LOB快照，提升市场模拟的真实性，避免了GAN和RNN的局限性。

基于Transformer的LOB仿真降噪扩散概率引擎

TRADES是基于Transformer的去噪扩散概率引擎，专用于LOB模拟。条件扩散模型在生成序列任务中优于标准扩散模型，能利用过去观察信息指导生成过程。

使用TRADES生成

本文的目标是通过TRADES生成时间序列，近似真实条件数据分布𝑞(x₀|xₖ)。前向过程仅对“未来”部分添加噪声，保持观察值不变。反向过程扩展无条件分布𝑝ₜ(x₀:𝑇)至条件情况。条件去噪学习函数定义为𝜃₆，设置𝑀=𝑁−1，𝑆=1以简化实验。使用参数化方法估计均值项，方差项通过学习而非固定调度。通过最小化负对数似然来优化模型，最终重建x₀。

TRADES中的自监督学习

给定生成目标 x_0 和条件观察 x_c，通过公式

进行采样，并通过最小化 Eq. (8) 训练 epsilon_theta 。

优化 Sigma_theta 以最小化 Eq.(9) 的负对数似然，特别是在前期扩散步骤中。

最终损失函数为 Eq.(10) 的线性组合：

采用自监督方法进行训练，仅对时间序列的最后一个元素 x_{0N} 添加噪声，通过反向过程去噪，学习以生成新样本。采样过程 TRADES 自回归生成新样本，基于之前的输出进行条件生成，直到模拟结束。

使用TRADES进行市场模拟

TRADES通过生成订单来模拟市场状态，目标是学习订单分布模型。使用多个transformer编码器层来建模金融时间序列的时空关系，并将订单张量和LOB快照投影到高维空间。条件扩散概率模型学习条件概率分布𝑝𝜃(𝑜|𝑠)，其中𝑜为新生成的订单，包含价格、数量、方向、深度、时间偏移和订单类型。模型的条件输入包括最近的𝑁个LOB快照，设置𝑁=256和𝐿=10，以捕捉市场供需动态。研究表明，最佳买卖价后的订单对价格发现和短期价格变动有重要影响。

基于合成数据集的DeepMarket框架，用于深度学习市场模拟

DeepMarket是一个开源Python框架，用于基于深度学习的限价单簿市场模拟。主要功能包括：

高频市场数据预处理。
基于PyTorch Lightning的训练环境。
使用WANDB进行超参数搜索。
提供TRADES和CGAN实现及检查点，支持直接生成市场模拟。
进行全面的定性和定量评估。

通过扩展ABIDES工具，结合世界代理和历史数据进行模拟。

TRADES-LOB：一个新的合成LOB数据集

LOB研究面临大型数据集缺乏的问题，现有免费数据集限制多。本文发布TRADES-LOB合成数据集，包含特斯拉和英特尔的市场数据，覆盖两天。数据集包含四个CSV文件，50列，265,986行，结构包括订单特征、LOB快照和财务指标。关键财务指标包括中价、价差、订单量失衡和VWAP，适用于股票价格预测。

实验

数据集。使用2015年1月2日至30日的特斯拉和英特尔的订单簿数据，包含约2400万样本，强调市场微观结构行为与单一股票特性无关。

实验设置。模型训练70,000步后进行市场模拟，模拟包括电子市场、TRADES代理和可选实验代理，生成的订单与真实市场订单进行比较。

模拟过程。从10:00到12:00进行，平均生成50,000个订单，输出包含订单和LOB快照。

基准比较。与市场重放、IABS配置和Wasserstein GAN（CGAN）进行比较，未与其他SoTA方法比较因缺乏开源实现和可复现性。

结果

本文评估TRADES模型在特斯拉和英特尔市场模拟中的有效性、现实性和响应性。

TRADES模型在两只股票的预测得分上分别超越第二名3.27倍和3.48倍。TRADES的预测得分与市场重播的绝对差异分别为0.29（特斯拉）和0.158（英特尔），表明合成数据与真实数据的训练效果差距缩小。IABS在特斯拉上优于CGAN，但在英特尔上表现最差，且英特尔的中价平均为特斯拉的1/20，导致预测得分规模差异。TRADES生成的市场数据训练的预测模型能有效预测中价。

TRADES生成的时间序列在真实数据分布上表现出较高的现实性，覆盖67.04%的真实数据分布，优于CGAN（52.92%）和IABS（57.49%）。通过主成分分析（PCA）和金融方法比较，TRADES生成的数据符合市场的风格特征。TRADES生成的资产回报线性自相关性迅速衰减，15分钟后统计上不显著，符合市场预期。TRADES展示了正的成交量-波动率相关性，优于特定市场重放日，且基于17天的市场数据训练，准确捕捉该特征。真实市场可能不总是遵循所有风格特征，因其非确定性和非平稳性。CGAN也表现出类似现象，但强度不现实。

TRADES展示了资产收益和波动率的负相关性，模拟市场重放分布，优于IABS。CGAN也表现出类似现象，但强度不现实。TRADES的对数收益分布几乎完美匹配真实数据，IABS因影响比例被排除。TRADES在平方收益的自相关函数上优于其他方法，显示出更好的波动聚集性。TRADES的五个模拟的特斯拉中间价格时间序列表现出多样性和真实性。TRADES的成交量分布与市场重放高度相关，而与SoTA方法截然不同。

TRADES模型的响应性对市场模拟至关重要，尤其是在验证交易策略和市场影响实验时。通过市场影响实验（A/B测试）评估生成器的响应性，进行有无POV代理的模拟实验。实验结果显示，历史市场模拟仅表现出瞬时影响，而扩散基础的模拟则导致价格的永久性偏离。使用TRADES生成的模拟可以进行可行的反事实分析，评估不同交易策略和金融法规的影响。TRADES模拟的市场影响与真实市场观察一致，支持交易策略评估和反事实实验。

DDIM采样

扩散模型的采样时间较长，生成单个样本需数百次迭代。本研究使用100步的扩散过程训练模型。引入DDIM采样方法（𝜂 = 0）以加速生成过程，采用单步处理。在RTX 3090上，每小时市场模拟需六小时计算，DDIM显著提高了计算效率，达到100倍。尽管性能有所下降，但影响不大。

消融和敏感性研究

消融分析。验证LOB条件和特征向量增强对性能的影响。使用LOB条件时，TRADES平均提升2.473；特征增强通过MLP时，平均提升1.980 MAE。

敏感性分析。替换TRADES中的transformer为LSTM，性能下降6.06，因LSTM信息损失。尝试交叉注意力（CA）条件策略，性能下降7.814，因CA限制了模型的能力，无法实现全局注意力。

总结

本文提出了基于Transformer的去噪扩散概率引擎TRADES，用于生成与当前市场状态相关的真实订单流。TRADES在现实性和响应性方面进行了评估，生成的数据在真实数据分布上覆盖率平均为67%。TRADES在Tesla和Intel的表现分别超越现有技术（SoTA）3.27倍和3.48倍。TRADES遵循多项金融市场模拟评估的风格化事实。发布了DeepMarket框架和TRADES-LOB合成LOB数据集，旨在促进研究社区的发展。TRADES被认为是可行的市场模拟策略，但需进一步测试以完善交易策略评估协议。

大模型&AI产品经理如何学习

求大家的点赞和收藏，我花2万买的大模型学习资料免费共享给你们，来看看有哪些东西。

1.学习路线图

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。

（都打包成一块的了，不能一一展开，总共300多集）

因篇幅有限，仅展示部分资料，需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档，有几百本，都是目前行业最新的。

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla