使用LSTM进行股票市场预测，MAPE仅2.72%

本文提出了一种基于深度学习的框架，利用长短期记忆网络（LSTM）预测NASDAQ上市的科技公司（如苹果、谷歌、微软和亚马逊）的收盘股价。采用Yahoo Finance收集的历史市场数据，经过高级归一化和特征工程处理。模型在未见测试数据上实现了2.72%的平均绝对百分比误差（MAPE），显著优于传统统计模型（如ARIMA）。通过VADER情感分析工具整合实时新闻和社交媒体的情感评分，以提高预测准确性

发菜君

1647人浏览 · 2025-05-15 18:03:49

发菜君 · 2025-05-15 18:03:49 发布

“Advanced Stock Market Prediction Using Long Short-Term Memory Networks: A Comprehensive Deep Learning Framework”

股票市场价格受全球经济指标和投资者心理等多种因素影响，传统预测方法难以应对股票数据的非平稳性和噪声。

本文提出了一种基于深度学习的框架，利用长短期记忆网络（LSTM）预测NASDAQ上市的科技公司（如苹果、谷歌、微软和亚马逊）的收盘股价。

经过高级归一化和特征工程处理。模型在未见测试数据上实现了2.72%的平均绝对百分比误差（MAPE）。

摘要

同时开发了用户友好的网页应用，展示实时预测，便于个人和机构投资者使用。研究展示了LSTM在处理复杂金融数据集中的优势，并提出了一种结合技术分析与市场情感的新方法。

简介

股票市场价格受全球经济指标和投资者心理等多种因素影响，传统预测方法难以应对股票数据的非平稳性和噪声。深度学习中的RNN和LSTM在捕捉时间依赖性和长期模式方面表现优越。结合金融新闻和社交媒体的情感分析有助于实时评估公众情绪，影响市场趋势。

本文提出了一种情感感知的LSTM框架，专门用于预测纳斯达克科技股的短期收盘价，整合结构化数值数据与非结构化文本情感输入，并提供实时预测接口。

本文开发了基于LSTM的框架，专注于NASDAQ科技股的短期预测。结合情感分析，捕捉影响市场行为的心理和情感因素。部署实时互动网页界面，用户可视化预测并获取洞察。与ARIMA等经典模型比较，准确性显著提升（MAPE为2.72%）。

问题定义

股票价格预测受限于不可预测性、数据质量稀疏和市场突发事件影响。传统统计模型在捕捉突变和潜在市场情绪方面通常不足。本研究提出基于LSTM的深度学习模型，能够从历史模式学习并适应实时市场情绪（来源于新闻和社交媒体）。通过一个网络平台，增强模型输出与用户的可访问性。

数据

本研究使用了来自四家主要科技公司（苹果、谷歌、微软和亚马逊）的历史股市数据，数据来源于Yahoo Finance，通过Python库yfinance获取。数据涵盖2024年4月至2025年4月的完整交易年度，包含每日的开盘价、最高价、最低价、收盘价和交易量。收盘价被选为预测目标变量，因其稳定性和市场情绪的代表性。研究中使用LSTM等深度学习模型进行股价预测，以应对股市数据的波动性和非线性特征。

方法

数据预处理

处理缺失值：使用pandas的dropna()函数去除缺失值。确保模型在完整、干净的数据集上训练。最小化偏见学习或无效预测的风险。
异常值检测与处理：采用z-score阈值法识别异常值。z-score超过±3标准差的数据点被视为异常值。异常值可以被移除或限制，以减少其影响。
归一化：应用Min-Max归一化于收盘价和情感分数特征，将所有值缩放至[0, 1]范围，适合对输入数据尺度敏感的模型，如LSTM。
生成LSTM输入数据：数据被分割为60个交易日的重叠时间窗口。每个60天的序列作为一个输入样本，预测第61天的收盘价。滑动窗口方法捕捉时间依赖性和趋势，适用于序列预测。

模型架构

本研究采用长短期记忆（LSTM）神经网络进行时间序列预测，使用Keras框架实现。模型输入为60天的交易数据，包括归一化的收盘价和情感分数，结合定量与定性信息。

第一层LSTM包含64个记忆单元，设置return_sequences=True以保留时间序列信息。使用20%的Dropout层防止过拟合。第二层LSTM包含32个记忆单元，进一步提炼数据特征。输出层为单个线性激活神经元，预测第61天的归一化收盘价。

模型使用Adam优化器和均方误差（MSE）作为损失函数，训练100个周期，批量大小为32。

情感分析集成

通过情感分析增强模型的预测性能，整合市场信号。来源于Bloomberg和Reuters的金融新闻文章被处理。使用VADER工具分析短文本的情感，生成-1到+1的复合情感分数。情感分数经过Min-Max缩放，与交易日对齐。LSTM模型的输入序列包括历史价格和情感分数，识别情感驱动的价格波动。

训练和测试

数据集分为训练集（80%）和测试集（20%），训练集为2024年4月至2025年1月，测试集为2025年2月至4月。使用滑动窗口法，窗口大小为60个交易日，输入序列对应第61天的目标值。选择60天窗口基于经验评估和文献支持。采用早停法，耐心参数为10个epoch，以防止过拟合。

移动均线作为特征工程

计算移动平均线（MAs）以丰富数据集，帮助分析股票趋势。

10日移动平均线（MA10）：捕捉短期动量，敏感于近期价格变化。
20日移动平均线（MA20）：提供中期趋势的平衡视角。
50日移动平均线（MA50）：突出长期方向变化和市场情绪。

这些特征有助于LSTM模型理解趋势强度和反转，提高预测准确性。

探索性数据分析

本文对苹果、谷歌、微软和亚马逊四大科技公司的股票价格数据进行了深入的探索性数据分析（EDA）。目标是揭示隐藏模式、评估股票间的相关性、理解波动特征，并为模型开发提供指导。采用了统计技术和可视化分析相结合的方法。

回归相关分析

生成了散点图以评估不同股票的日收益线性关系。图7显示了谷歌收益的完美自相关，作为基准参考。图8比较了谷歌和微软的日收益，显示出正相关，表明两者价格常常同向波动。

多股关系可视化

使用成对可视化分析四家公司的日收益率之间的多变量依赖关系。图9展示了所有公司的日收益率的成对图及线性趋势回归线。图10和图11通过PairGrid可视化进一步探讨这些关系，结合散点图、核密度估计（KDE）和直方图，全面展示收益和价格分布。

探索性收益分析

计算每日收益率（R_t）以识别股票价格波动模式。

日收益率的时间序列图揭示了以下市场行为：

波动聚集：特定时期内多只股票的收益波动显著，通常与宏观经济公告或行业发展相关。
不对称性和偏斜性：市场下跌时，收益的急剧下降比上涨更为明显，显示出收益分布的偏斜性。
同步行为：不同股票收益的共同波动表明它们之间的依赖关系，可能源于行业联系或外部市场力量。

这些收益序列为统计建模和风险分析提供基础，帮助检测结构变化和市场异常。直方图分析收益的分布特性（偏斜度、峰度、波动性），对模型假设和损失函数选择至关重要。

一、大模型风口已至：月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长，根据工信部最新数据：

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K

70%企业存在"能用模型不会调优"的痛点

真实案例：某二本机械专业学员，通过4个月系统学习，成功拿到某AI医疗公司大模型优化岗offer，薪资直接翻3倍！

二、如何学习大模型 AI ？

🔥AI取代的不是人类，而是不会用AI的人！麦肯锡最新报告显示：掌握AI工具的从业者生产效率提升47%，薪资溢价达34%！🚀

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

1️⃣ 提示词工程：把ChatGPT从玩具变成生产工具
2️⃣ RAG系统：让大模型精准输出行业知识
3️⃣ 智能体开发：用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你：
✔️ 大厂内部LLM落地手册（含58个真实案例）
✔️ 提示词设计模板库（覆盖12大应用场景）
✔️ 私藏学习路径图（0基础到项目实战仅需90天）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

* 大模型 AI 能干什么？
* 大模型是怎样获得「智能」的？
* 用好 AI 的核心心法
* 大模型应用业务架构
* 大模型应用技术架构
* 代码示例：向 GPT-3.5 灌入新知识
* 提示工程的意义和核心思想
* Prompt 典型构成
* 指令调优方法论
* 思维链和思维树
* Prompt 攻击和防范
* …

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

* 为什么要做 RAG
* 搭建一个简单的 ChatPDF
* 检索的基础概念
* 什么是向量表示（Embeddings）
* 向量数据库与向量检索
* 基于向量检索的 RAG
* 搭建 RAG 系统的扩展知识
* 混合检索与 RAG-Fusion 简介
* 向量模型本地部署
* …

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

* 为什么要做 RAG
* 什么是模型
* 什么是模型训练
* 求解器 & 损失函数简介
* 小实验2：手写一个简单的神经网络并训练它
* 什么是训练/预训练/微调/轻量化微调
* Transformer结构简介
* 轻量化微调
* 实验数据集的构建
* …

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

* 硬件选型
* 带你了解全球大模型
* 使用国产大模型服务
* 搭建 OpenAI 代理
* 热身：基于阿里云 PAI 部署 Stable Diffusion
* 在本地计算机运行大模型
* 大模型的私有化部署
* 基于 vLLM 部署大模型
* 案例：如何优雅地在阿里云私有部署开源大模型
* 部署一套开源 LLM 项目
* 内容安全
* 互联网信息服务算法备案
* …

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla