img

*第一章:引言*

在当前的金融科技浪潮中,深度学习与量化交易的结合已成为一个备受瞩目的领域,并在全球证券投资市场中取得了巨大成功。大量的研究工作致力于开发基于深度学习的股票收益预测模型,这些模型凭借神经网络强大的表示学习能力,能够有效地从海量历史数据中识别出影响股价的复杂模式。具体来说,现有模型在捕捉市场中的普遍规律方面表现出色,例如股价的趋势性、成交量与价格之间的关系,以及各种时间尺度下的变化规律。

然而,作者敏锐地观察到,现有的大多数深度学习预测模型在建模过程中,很大程度上忽略了一类至关重要却又难以量化的因素——市场非理性 (Market Irrationality) 。这类因素源于投资者群体的集体行为,表现形式多样,包括由贪婪或恐惧驱动的市场情绪 (market sentiment)、通过不正当手段影响价格的市场操纵 (market manipulation),以及投资者固有的如过度自信、锚定效应等心理偏差 (psychological biases)。这些非理性因素由于其内在的抽象性,且缺乏明确的数据标签和直接的量化描述,导致它们很难被显式地纳入到传统的预测框架中。这构成了现有模型性能的一个核心瓶颈。

为了填补这一研究空白,作者提出了一种全新的模型框架,其核心思想是从数据中学习能够反映市场非理性行为的通用因子。作者将这个模型命名为 *UMI (Universal multi-level Market Irrationality factor model)**。UMI模型的核心创新之处在于,它从两个不同的层次——*个股层面 (stock-level)整体市场层面 (market-level)——来系统性地学习和量化非理性行为。

个股层面,作者认为非理性表现为股价对其内在“理性价格”的暂时性偏离。为此,UMI构建了一个与股票实际价格存在长期协整关系的“估算理性价格”。实际价格与这个估算理性价格之间的差异,就被作者定义为衡量个股层面非理性事件的因子。

市场层面,作者将非理性行为定义为市场内所有股票发生的反常的、大规模的同步波动。因为在一个有效且理性的市场中,个股的涨跌应主要由其自身基本面决定,大规模的同涨同跌通常是群体非理性情绪的体现。为了捕捉这种现象,作者设计了两个新颖的自监督学习任务:子市场对比学习 (sub-market comparative learning)市场同步性预测 (market synchronism prediction)。通过这两个任务,UMI模型能够将市场层面的非理性信息有效地编码到一个市场表示向量中,该向量便成为作者的市场层面非理性因子。

为了充分利用作者挖掘出的UMI因子,作者还专门设计了一个先进的预测模型。该模型能够同时捕捉股票数据中的时间依赖性 (temporal dependencies) 和股票之间的关联依赖性 (relational dependencies)

img

最后,作者在全球最大的两个经济体——美国和中国的股票市场上进行了全面而深入的实验。实验结果有力地证明了作者提出的UMI模型及其挖掘的非理性因子的有效性。与当前最前沿的基准模型相比,作者的模型在预测精度和模拟投资回报上均取得了显著的提升。更重要的是,作者发现这些非理性因子具有极佳的通用性 (universality) ,将它们作为额外输入整合到其他各种主流预测模型中,都能一致性地提升这些模型的性能。


*第二章:预备知识*

在深入探讨模型细节之前,作者首先明确本研究中使用的基本符号和核心问题的形式化定义。

作者将一个股票市场定义为可交易股票的集合,记作 ,其中 代表第 支股票, 是市场中股票的总数。市场的交易时间被划分为一系列连续的时间段,记作 ,通常一个时间段代表一个交易日。

定义1 (股票特征, STOCK FEATURE): 股票的特征是一组用于描述该股票在特定时间状态的数值属性,例如开盘价、收盘价、成交量等。在第 个时间段,股票 的特征被定义为一个向量 ,其中 是特征的维度。

定义2 (股票价格, STOCK PRICE): 在 个连续的时间段内,股票 的价格序列定义为 ,其中 通常指在第 期结束时的收盘价。

定义3 (股票收益率, STOCK RETURN): 股票 在第 期的收益率定义为价格的变化百分比:。

基于以上定义,股票收益预测问题 (Stock Return Forecasting Problem) 的目标是利用市场中所有股票的历史特征和价格数据,来预测某支股票在未来的收益率。

作者的模型采用一个两步走的策略来解决此问题:

  1. 因子学习 (Factor Learning): 首先,作者利用一个因子学习函数 ,从截至 期的所有股票历史特征数据 中,为每支股票 提取能够反映市场非理性行为的指示性因子 。
  2. 收益预测 (Return Forecasting): 接着,作者构建一个收益预测函数 ,它将学习到的非理性因子 和原始的历史股票特征 作为共同输入,来预测股票 在第 期的收益率 。

*第三章:个股层面非理性因子 (Stock-level Irrationality Factors)*

本章的核心任务是学习能够指示个别股票发生非理性行为的因子。

*3.1 个股的非理性行为*

作者首先需要对什么是个股层面的非理性事件给出一个明确的定义。

定义4 (个股层面非理性事件, STOCK-LEVEL IRRATIONAL EVENTS): 对于任意一支股票 在 时刻的真实价格 ,作者假设存在一个与之对应的“理性价格 (rational price)” 。如果真实价格与理性价格之间的背离程度超过了某个阈值 ,即 ,作者就认为股票 在此刻发生了一次个股层面的非理性事件。

这种由非理性因素导致的股价对其内在价值的暂时偏离,为投资者创造了套利机会。例如,作者可以通过买入那些价格远低于其理性价格的股票,或卖出(做空)那些价格远高于其理性价格的股票,并预期其价格最终会“均值回归”到理性水平,从而获利。

然而,这里的核心挑战在于,所谓的“理性价格” 是一个隐藏变量,无法从市场数据中被直接观测或计算。在经典的量化交易策略中,一个常用的解决思路是利用协整关系 (Cointegration Relations)

定义5 (协整, COINTEGRATION): 给定两支股票 和 的价格序列 和 ,作者可以通过线性组合构造一个新的时间序列 。如果这个新的序列 是一个平稳时间序列 (stationary time series),作者就称 和 是协整的。

根据定义,一个平稳序列 会围绕其均值在一个固定的范围内波动。因此,对于一对协整的股票,如果它们的价格差 在某一时刻显著偏离了其历史均值,这便预示着一次个股层面非理性事件的发生,即其中一支股票被高估而另一支被低估。这构成了配对交易 (pair trading) 策略的理论基础。交易者可以在 偏离时建立头寸,并在其回归均值时平仓获利。

在实践中,作者可以使用经典的迪基-福勒检验 (Dickey-Fuller (DF) Test) 来判断两个序列是否协整。DF检验假设序列 遵循一个自回归过程 。序列是否平稳,关键取决于回归参数 的值。如果 ,过去随机扰动 的影响不会随时间衰减,序列是非平稳的;反之,如果 ,过去扰动的影响会逐渐消失,序列则是平稳的。DF检验的本质就是检验 是否显著小于1。

*3.2 个股层面非理性因子的学习*

尽管基于协整的配对交易策略能够利用个股的非理性,但其应用效果非常有限。主要原因在于,真实股票市场中天然存在的、稳定的协整关系非常稀疏。传统的配对交易策略需要对所有可能的股票对进行遍历筛选,效率低下,且最终能投资的标的非常有限,导致投资风险集中,策略稳定性差。

为了克服这些局限性,作者提出了一种全新的、基于注意力机制的方法,来为每一支股票都人工构建一个与其协整的“估算理性价格”。这个估算价格随后被用来生成作者所需的个股非理性因子。

协整注意力机制 (Cointegration Attention): 对于目标股票 ,作者不再寻找单一的配对股票,而是将市场中所有其他股票 都视为其潜在的协整“候选者”。作者将每个候选股票 的价格 乘以一个可学习的系数 ,得到一个候选协整价格 。

然后,作者引入注意力机制,将所有这些候选协整价格进行加权融合,从而为股票 构建一个“虚拟理性价格 (virtual rational price)” :

其中

这里的 是用于计算注意力权重的可学习参数。

作者的核心目标是让作者构建的这个虚拟理性价格序列 与股票 的真实价格序列 尽可能地协整。换句话说,它们的差值序列 必须是一个平稳序列。

协整目标函数 (Cointegration Objective Functions): 为了在模型训练中实现上述目标,作者精心设计了一个包含两部分的协整目标函数。

  1. 回归损失 (Regression Loss): 基于平稳序列的特性,其期望值 应该是一个不随时间变化的常数。因此,作者可以将关系式 看作是一个回归问题,即用作者构建的虚拟理性价格 去拟合(回归)真实价格 ,而差值 则是回归误差。因此,作者使用均方误差 (MSE) 损失来最小化这个误差:

  2. 平稳性正则化 (Stationary Regularization): 这部分直接借鉴了DF检验的思想。作者将差值序列 建模为一个一阶自回归过程 。为了保证其平稳性,作者必须施加约束 。因此,作者设计了一个正则化项,通过最小化自回归模型的拟合误差来学习参数,同时强制约束 :

通过优化这个正则化项,模型会调整参数 和 ,使得最终生成的差值序列 尽可能地满足平稳性条件。

最终,作者将回归损失和平稳性正则化结合起来,形成用于学习个股层面非理性因子的总目标函数:

其中 是一个超参数,用于平衡两部分损失。

与传统配对交易策略相比,作者的方法不再依赖于寻找稀疏的天然协整关系,而是为市场中的每一支股票都能高效、普适地构建一个“软”的协整序列作为其估算理性价格。

训练完成后,差值序列 就成为作者最终得到的个股层面非理性因子。 的值高,意味着真实价格高于虚拟理性价格,股票可能被高估;反之则可能被低估。这个因子将作为增强信息,输入到后续的收益预测模型中。


*第四章:市场层面非理性因子 (Market-level Irrationality Factors)*

在处理完个股层面的非理性之后,作者转向一个更宏观的视角——整个市场的集体非理性行为。

*4.1 市场层面的非理性事件*

在一个完全理性的市场中,个股的价格应主要由其自身的基本面价值决定,不同股票价格的涨跌走势不应表现出高度的同步性。然而,真实世界的股票市场中,个股价格往往会受到整体市场情绪的强烈影响,导致价格行为出现显著的同步性 (synchronicity)。例如,在市场情绪极度乐观(牛市)时,绝大多数股票都会上涨;而在极度悲观(熊市)时,则会普遍下跌。2013年诺贝尔经济学奖得主罗伯特·希勒 (Robert J. Shiller) 的研究表明,这种市场层面的集体行为与人类群体的非理性因素密切相关。

基于此,作者对市场层面的非理性事件给出了如下的量化定义:

定义6 (市场层面非理性事件, MARKET-LEVEL IRRATIONAL EVENTS): 作者将 时期股票 的收益率涨跌情况表示为 :如果收益率上涨超过某一阈值,则 ;如果下跌超过阈值,则 ;其他情况为 。当市场中上涨股票的比例( 的股票数占比)或下跌股票的比例( 的股票数占比)超过一个较高的阈值 时,作者便定义此刻发生了一次市场层面的非理性事件。

这个定义的核心思想是,市场中股票大规模、反常的同步波动,是市场非理性的一个关键表征

*4.2 市场层面非理性因子的学习*

正如希勒教授所强调的,导致市场非理性行为的原因是复杂多样的,与市场结构、文化甚至投资者心理等深层因素交织在一起。仅仅将上述定义6中的事件作为标签,并不能充分捕捉这些背后的复杂信息。因此,作者采用了一种表示学习 (representation learning) 的方法,旨在学习到一个能够全面反映市场层面非理性的综合性表示向量。

作者的学习框架包含两个核心模块:i) 一个市场表示提取模块,用于构建能准确反映整个市场动态的表示向量;ii) 两个自监督学习任务,其目标是将市场非理性的信息注入到这个市场表示向量中。

4.2.1 市场表示提取 (Market Representation Extraction)

该模块首先为每支股票提取一个动态的行为表示,然后将这些个股表示聚合成一个总体的市场表示。

  1. 动态个股表示提取 (Dynamic Stock Representation Extraction): 作者关注股票在短期内的动态行为。对于一支股票在过去 个时间窗口内的特征序列 ,作者使用自注意力机制 (self-attention mechanism) 来计算当前时刻 的特征与历史时刻 特征之间的相互依赖关系 。然后,利用这些注意力权重对历史特征进行加权求和,并将结果与当前特征拼接,形成最终的动态个股表示 :

    这个表示 不仅包含了股票的当前状态,还融入了如趋势、波动性等时间上的动态模式。

  2. 市场表示生成 (Market Representation Generation): 仅仅使用动态个股表示 进行聚合是不够的。在现实中,即使两支不同股票的短期特征动态完全相同,它们对市场整体情绪的影响力也可能天差地别。例如,一支是主要股指的成分股,而另一支不是,前者对市场的影响显然更大。 为了捕捉这种差异,作者提出了一个包含股票ID信息的、依赖于个股的权重 (stock ID-involved stock-dependent weight)。具体地,作者将每支股票的ID编码成一个独热向量 (one-hot vector) ,并将其与动态个股表示 一同输入一个小型网络来计算权重 。

    其中 是一个可学习的ID嵌入矩阵。这个权重 能够学习到不同股票对市场影响力的差异。 最后,作者使用这个权重 对所有股票的动态表示 进行加权平均,得到最终的市场表示 (market representation)

    通过分母的归一化,作者确保了市场表示 的量级不受市场中股票总数 的影响。

4.2.2 用于学习市场层面非理性因子的自监督任务

这个模块是整个市场层面因子学习的精髓所在。作者设计了两个自监督任务,来迫使市场表示 学习到与市场非理性相关的深层信息。

  1. 子市场对比学习 (Sub-market Comparative Learning): 这个任务的灵感来源于作者对市场非理性的定义——反常的同步性。如果市场正在经历一次非理性事件,那么它的不同组成部分(子市场)应该会表现出相似的行为模式。 具体操作上,在每个时间点 ,作者随机地将市场中的所有股票划分成两个不相交的子市场(Sub-market 1 和 Sub-market 2)。作者为这两个子市场分别计算出它们的市场表示 和 。 在对比学习的框架下,作者将在同一时间点 的两个子市场表示对 视为一个正样本对 (positive sample),而将不同时间点 的表示对 视为负样本对 (negative samples)。作者采用经典的 InfoNCE 损失函数来训练模型,目标是最大化正样本对的相似度,同时最小化负样本对的相似度:

    通过这个任务,模型被激励去学习一种表示,使得在任何时间点,无论如何随机划分市场,得到的子市场表示都是相似的。这间接地捕捉了市场整体行为的内在一致性,尤其是在发生同步波动的非理性时期。

  2. 市场同步性预测 (Market Synchronism Prediction): 这个任务更加直接。作者利用前一期的市场表示 ,来直接预测下一期 的市场同步性状态。作者将根据定义6计算出的市场同步性状态量化为一个三分类的独热标签 :(1,0,0) 代表大规模上涨,(0,1,0) 代表大规模下跌,(0,0,1) 代表正常波动。 然后,作者将市场表示 输入一个多层感知机 (MLP) 网络,来预测这个标签 :

    作者使用交叉熵损失 (cross entropy loss) 来最小化预测与真实标签之间的差距:

最后,作者将这两个自监督任务的损失函数加权组合,形成市场层面因子学习的总目标函数:

经过这两个任务的联合训练,作者得到的市场表示向量 便蕴含了丰富的、关于市场层面非理性的信息。作者将其作为最终的市场层面非理性因子,与个股层面因子一起,服务于最终的收益预测。


*第五章:预测模型与训练*

作者挖掘出的个股层面因子 和市场层面因子 具有通用性,可以作为输入来增强任何现有的股票收益预测模型。为了最大化这些因子的潜力,作者专门设计了一个融合了 Transformer 和图神经网络思想的混合模型。

*5.1 预测模型架构*
  1. 输入融合与时序编码: 作者首先将个股层面的非理性因子 与对应时期的原始股票特征 进行拼接,形成一个增强的特征序列。然后,作者将这个序列输入一个 Transformer 模型。Transformer的自注意力机制能够有效地捕捉历史信息中的长期时间依赖关系,并生成一个编码了时序信息的表示 。

  2. 股票间关系依赖模块 (Stock Relation Dependency Module): 股票之间并非孤立的,它们会通过产业链、行业、投资者共同持仓等多种方式相互影响。为了捕捉这种股票间的关联依赖,作者设计了一个基于图注意力 (graph attention) 的模块。作者将市场中的所有股票看作一个图的节点,并计算任意两个股票 和 之间的注意力分数 。这个分数的计算巧妙地复用了在第四章学习到的包含股票ID信息的表示,使得模型能够学习到非显性的、复杂的股票间关系。

    利用这些注意力分数,作者将所有其他股票的时序表示 进行加权聚合,得到一个反映了股票 所受“同伴影响”的表示 。

  3. 最终预测: 最后,作者将三部分信息进行拼接:i) 股票自身的时间序列表示 ,ii) 股票间的关系依赖表示 ,以及 iii) 宏观的市场层面非理性因子 。将这个融合后的超级向量输入一个MLP网络,便得到最终的股票收益率预测值 。

*5.2 融合RankIC的损失函数*

在优化预测模型时,一个直接的方法是使用均方误差 (MSE) 损失函数 ,它旨在最小化预测值与真实值之间的数值差距。然而,作者认识到,在许多实际的投资策略中,例如作者实验中采用的多空对冲策略 (long-short hedging strategy),对股票收益率进行准确的排序 (ranking),其重要性甚至超过了对收益率进行精确的数值预测。

多空对冲策略的运作方式是:在每个交易周期,根据模型预测的收益率对所有股票进行排名,然后买入(做多)排名最高的N支股票,同时卖出(做空)排名最低的N支股票。只要这个“相对好坏”的排名是准确的,即使预测的具体数值有偏差,该策略也能够稳定盈利。

基于这一洞察,作者引入了一个RankIC正则化项来增强模型对投资策略的适应性。作者计算预测收益率 与真实收益率的秩次 (rank) 之间的信息相关系数 (Information Correlation, IC),作者称之为 RankIC

RankIC衡量了预测值与真实排名的线性相关性。即使预测值不准,只要它们的排序趋势与真实收益的排序趋势一致,RankIC的值也会很高。

作者将所有样本的RankIC的负值定义为RankIC正则化损失 。最终,作者的预测模型的目标函数被定义为MSE损失和RankIC正则化损失的加权和:

通过引入RankIC正则化,模型在训练时会更关注股票间的相对排序关系,从而能更好地服务于基于排名的投资策略。

*5.3 训练流程*

作者的整个模型训练过程遵循一个清晰的两阶段流程:

  1. 因子学习阶段 (Factor-learning): 在这个阶段,作者使用训练数据集,通过最小化自监督损失 (公式14) 和 (公式24),分别独立地训练个股层面和市场层面非理性因子的学习模块。这个过程是无监督的,不依赖于真实的收益率标签。
  2. 预测器训练阶段 (Forecasting-training): 在因子学习模块训练完毕后,作者将其参数固定。然后,作者使用这些模块来为训练数据生成非理性因子,并将这些因子与原始特征一起,通过最小化包含RankIC的监督损失 (公式31),来训练最终的预测器模型。

*第六章:实验*

为了全面验证作者模型的有效性和通用性,作者在美国和中国这两个全球最大的股票市场上进行了广泛的实验。

*6.1 实验设置*
  • 数据集: 美国市场数据涵盖了从2000年到2020年的8993支股票;中国市场数据涵盖了从2006年到2023年的5148支股票。作者都划分了训练集、验证集和测试集。

  • 特征: 作者使用开源量化平台Qlib中的Alpha360因子库,提取了6个核心的价量特征,包括开盘价、收盘价、最高价、最低价、成交量和成交额加权平均价。

  • 基准模型: 作者选取了7个当前领域内极具竞争力的基准模型进行对比,涵盖了三类:专为股票预测设计的模型(如DoubleAdapt, D-Va)、先进的通用时间序列预测模型(如SAN, FreTS),以及同样采用自监督学习思想的模型(如Co-CPC, Basisformer, SimMTM)。

  • 评估指标: 作者从两个维度评估模型性能:

    • 预测精度: 包括RMSE, MAE等数值精度指标,以及更能反映排序能力的IC, ICIR, RankIC, RankICIR等指标。
    • 投资回测性能: 作者将所有模型的预测结果输入一个标准的多空对冲投资策略中进行模拟回测,并评估策略的年化收益率(AR)、年化波动率(AV)、夏普比率(SR)、最大回撤(MDD)和卡玛比率(CR)等金融指标。同时,作者也绘制了累计财富曲线(CW)进行直观对比。
*6.2 预测与投资性能分析*

img

总体性能: 实验结果(如论文表1所示)清晰地表明:

  1. 作者的UMI模型在美股和A股两个市场上,无论是在预测精度指标还是投资回测性能指标上,均全面超越了所有基准模型,取得了最优的成绩,这雄辩地证明了作者模型的有效性。
  2. 专为股票数据设计的模型普遍优于通用的时间序列模型,这说明股票数据确实存在需要特殊机制来处理的独有特性。
  3. 采用自监督学习方法的模型(如Co-CPC和作者的UMI)通常比纯监督学习的模型表现更好,这证明了通过自监督任务从无标签数据中挖掘隐藏信息是一种非常有效的范式。作者的模型正是通过新颖的自监督任务挖掘了以往被忽视的“市场非理性”这一隐藏信息,从而实现了性能的飞跃。
  4. 作者的模型在IC、RankIC等排序相关指标上的提升幅度,显著高于在RMSE、MAE等数值精度指标上的提升,这直接验证了作者设计的RankIC正则化项的有效性。这种优势被直接传导到了投资回测中,使得作者的模型在投资性能上的领先幅度远大于其在预测数值上的领先幅度。累计财富曲线(论文图2)更直观地展示了,随着时间的推移,UMI带来的微小预测优势能够复利成巨大的最终盈利差异。

消融研究 (Ablation Study): 作者通过移除UMI模型的不同组件来检验各部分的重要性。结果显示:移除个股层面因子、移除市场层面因子、移除RankIC正则化、或移除股票关系依赖模块,都会导致模型性能的下降。这证明了作者设计的每一个模块都对最终的优异性能做出了不可或缺的贡献。其中,个股层面因子的贡献略大于市场层面因子,作者推测这是因为它提供了更细粒度的、针对每支股票的特定信息。

非理性因子的通用性 (Universality): 这是作者研究的一个核心亮点。作者将UMI学习到的非理性因子作为额外的输入,添加到三个主流的基准模型(DoubleAdapt, D-Va, Co-CPC)中。结果(论文表2)显示,所有这三个模型在加入了作者的因子后,其投资回测性能都得到了显著的提升。这一发现强有力地证明了作者挖掘出的非理性因子具有高度的通用性,它们捕捉到的信息是其他模型所缺失的,可以作为一个“即插即用”的增强模块来赋能各种不同的量化模型。

img

img

*6.3 探索性分析*

为了更直观地理解作者的非理性因子是如何工作的,作者进行了一些可视化分析。

  • 个股层面因子可视化: 作者以A股市场的“川大智胜(SZ002253)”为例(论文图3)。图清晰地展示了其真实价格序列和作者模型估算的“虚拟理性价格”序列之间存在着明显的协整关系,它们的差值——即作者的个股非理性因子——是一个平稳序列。在2016年11月9日,因子出现了一个剧烈的异常波动,这正对应着一次非理性事件。经过查证,当天是美国大选结果揭晓日,由于该公司中文名与“特朗普大胜”谐音,其股价受此非理性情绪驱动而涨停。这个生动的案例表明,作者的模型确实能够有效捕捉到由真实世界非理性事件引发的股价异动。

    img

  • 市场层面因子可视化: 作者想探究市场表示是如何区分不同市场状态的。作者选取了若干个交易日,包括发生大规模上涨、大规模下跌和正常波动的日子。然后,作者通过随机抽样不同数量的股票(5、50、500支)来生成当天的市场表示,并用t-SNE进行降维可视化(论文图4)。结果发现,当采样股票数量足够多(如500支)时,不同市场状态(上涨、下跌、正常)的日子所对应的市场表示在二维空间中形成了清晰可分的簇。这表明作者的方法能够有效地从微观的个股行为中提炼出宏观的市场状态。同时,衡量聚类效果的轮廓系数 (Silhouette score) 随着采样股票数量的增加而提高,证明了更广泛的股票样本能提升作者市场表示的质量和区分度。


*第七章与第八章:相关工作与结论*

相关工作部分,作者梳理了深度学习在股票预测领域的现有研究,包括预测股价/收益率的方法和直接使用强化学习设计交易策略的方法。作者指出现有工作大多聚焦于设计更复杂的网络结构或引入如新闻、研报等文本补充信息,但很少有研究系统性地考虑市场非理性。在因子学习方面,作者强调了作者的工作在利用协整关系上的创新性,并指出传统方法多用市场指数来代表宏观市场状态,而作者的方法通过自监督学习来构建更深层次的市场非理性表示,是一个全新的视角。

总而言之,在作者的结论中,作者重申了这项研究的核心贡献。作者提出了UMI模型,这是一个新颖的框架,它首次系统性地从个股市场两个层次来学习和量化金融市场中的非理性行为,并将其作为通用因子来提升股票收益预测。通过将股价与其估算的“理性价格”进行对比,UMI揭示了个股层面的非理性。通过对大规模股票的同步性进行建模,UMI捕捉了市场层面的集体非理性。在中美两个市场的详尽实验,不仅验证了作者模型本身的卓越性能,更展示了其所挖掘的非理性因子具有普适的应用价值。作者相信,这项工作为量化投资领域开辟了一个新的研究方向,即从行为金融学和投资者心理的角度,利用深度学习技术来更深刻地理解和预测市场。

如何学习AI大模型 ?

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈

(👆👆👆安全链接,放心点击)

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战项目来学习。(全套教程文末领取哈)
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(全套教程文末领取哈)
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(全套教程文末领取哈)
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型,我这份资料就可以无偿分享给你学习,我国在这方面的相关人才比较紧缺,大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

在这里插入图片描述
在这里插入图片描述

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利: 👉👉CSDN大礼包:《最新AI大模型学习资源包》免费分享 👈👈

(👆👆👆安全链接,放心点击)
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐