使用正交化和自助法寻找显著因子

发布时间：2019-03-20 | 来源: 川总写量化

作者：石川

摘要：本文在 A 股上复现 Harvey and Liu (2018) 提出的方法，使用正交化和自助法寻找显著的因子。

1 引言

《出色不如走运 (II)》一文曾介绍了 Harvey and Liu (2018) 提出的基于回归的因子有效性检验方法。该方法避免了因 multiple testing 造成的运气成分、从而鉴别出能显著解释资产截面预期收益率差异的因子。考虑到《出色不如走运 (II)》涉及的内容理论有余、实证不足，本文以中证 500 指数成分股为例，做一些实证分析，同时也指出在大 A 股中应用 Harvey and Liu (2018) 时遇到的一些坑。

首先简单回归一下 Harvey and Liu (2018) 提出的方法。当大量因子同时被用做 empirical asset pricing 分析时，它们之中效果最显著的因子中一定包含了运气的成分。Harvey and Liu (2018) 巧妙之处在于通过正交化和自助法（Bootstrap）得到了仅靠运气能够得到的显著性的经验分布；如果当排除了运气造成的显著性之后某个因子依然显著，那它就是真正有效的因子。下图高度概括了该方法的逻辑（正交化和 Bootstrap 是核心）。

值得一提的是，Harvey and Liu (2018) 提出的方法既可以用针对 empirical asset pricing 找出显著因子；也可以用于更一般的 predictive regression —— 即考察解释变量 X 能否预测被解释变量 Y。面对不同的问题，正交化和 Bootstrap 的核心思想是一致的，但在具体处理方法上存在差异。《出色不如走运 (II)》一文以 predictive regression 为例详细介绍了该方法，本文不再赘述。以下行文将假设读者了解 Harvey and Liu (2018)。但是，我会针对 empirical asset pricing 问题，说明使用正交化和 Bootstrap 时的各种细节。这篇实证的目的更多的是介绍在 A 股上如何复现 Harvey and Liu (2018)。相反的，由于实证中的因子以及用来检验这些因子的一组资产，均无法避免的存在主观成分（本文最后一节会再聊聊这点），因此实证结果仅是示例性的。

2 Block Bootstrap

先来说说 Bootstrap。本来 Bootstrap 无需多言（需要背景知识的朋友请点这里），但是数据的特殊性决定了 Bootstrap 的特殊性。在 Harvey and Liu (2018) 的方法中，需要进行 Bootstrap 的数据是资产的收益率和正交化后的因子收益率时间序列。由于时间序列存在自相关性，因此在重采样的时候应使用 Block Bootstrap。顾名思义，Block Bootstrap 就是每次从序列中有放回的抽取一个由连续 n 个相邻数据点构成的 block（大小由 block size 决定）。主流的 Block Bootstrap 算法包括以下三种：

Moving Block Bootstrap（Kunsch 1989, Liu and Singh 1992）；

Circular Block Bootstrap（Politis and Romano 1992）;

Stationary Bootstrap（Politis and Romano 1994）。

下图说明了 Moving Block Bootstrap（MBB）的原理。假设原始数据由 1 – 9 组成，且令 block size = 3。MBB 依次以序列中的每个数字为起点构建长度为 3 的 blocks（本例中一共 7 个），然后从这 7 个 blocks 中有放回的随机抽取，直至构成和原始序列长度一样的 bootstrapped sample。

从上图的原理可知，MBB 最大的问题是对于原始序列首尾两端样本采样不足。为了规避这个问题，Circular Block Bootstrap（CBB）被提出。顾名思义，它是将原始数据的首尾相连，构成一个圆圈（Circular 一词的出处），然后再按照给定的 block size 进行重采样，避免首尾两端采样不足。

最后一种方法是 Stationary Bootstrap（SB），它和前两者最大的区别是使用非固定的 block size。SB 中的 block size 满足几何分布；作为输入而给定的 block size 是它的期望。该方法得到的 bootstrapped 样本可以更好的满足平稳性的要求，因此当原始时间序列难以满足平稳性时有更好的效果。

本文的实证采用 stationary bootstrap，并在第四节说明原因。

3 因子模拟和投资组合

Harvey and Liu (2018) 的目的是找到能够真正解释资产截面预期收益率差异的显著因子。因此在实证中，我们需要选定多因子模型，以及用来检验这些因子的一组资产。在因子方面，实证中选择 Fama and French (2015) 五因子以及 Carhart (1997) 的动量因子，一共六个因子：MKT、HML、SMB、RMW、CMA 和 UMD。构建这些因子的标的均为中证 500 的成分股；实证区间为 2008 年 10 月到 2019 年 2 月。每个月最后一个交易日排除停牌的股票，使用剩余成分股构建多空投资组合（多、空两边均等权配置），以此计算每个因子下个月的收益率，全部数据均来自 JoinQuant。具体的，这些因子定义如下：

MKT：中证 500 指数的收益率，为了简化没有考虑其相对无风险利率的超额收益；

HML：做多 Book-to-Price 最高的 150 支、做空 Book-to-Price 最低的 150 支；

SMB：做多流通市值小的一半、做空流通市值大的一半；

RMW：使用营业利润 TTM 与总市值之比为排序指标、从大到小排序，做多排名靠前的 150 支、做空排名靠后的 150 支；

CMA：使用总资产增长率为排序指标、从小到大排序，做多排名靠前的 150 支、做空排名靠后的 150 支；

UMD：使用 T - 12 到 T - 2 月之间（即过去 12 个月到上一个月）的累积收益率为排序指标，从大到小排序，做多排名靠前的 150 支、做空排名靠后的 150 支。

这六个因子在实证区间内的累积净值如下图所示。

下面再来看看用来检验因子的一组资产。由于多因子模型是用来给个股的超额收益定价的，因此最纯粹的实证是使用个股。考虑到本文更多的是为了说明如何复现 Harvey and Liu (2018)、实证结果仅是示例性的，因此我们也像 Harvey and Liu (2018) 一样，考虑使用 BP 和流通市值 double sort 得到的投资组合作为资产。具体的，将中证 500 成分股按照 BP 和流通市值的大小各分成五档，并按照个股在两个指标上的档位取值将它们归类于 5 × 5 = 25 个投资组合中的某一个，由此构建 25 个纯多头投资组合。这 25 个投资组合在实证区间内的累积净值如下图所示。

下面用这 25 个投资组合检验上述六个因子。

4 挑选有效因子

在检验有效因子时，Harvey and Liu (2018) 的思路是反复使用正交化 + 自助法，逐一找到显著的因子，直到所有剩余因子中没有任何显著的。下面就来进行这个过程。在第一轮中，这六个因子是否显著都是未知的。首先对它们进行正交化处理。正交化的目的是排除因子对资产截面预期收益差异的解释能力；正交化的手段是对因子收益率序列在时序上去均值（demean）。时序上 demean 不改变这些因子对于资产收益率波动的解释力度（时序回归的 R-squared 不变），但由于 demean 之后因子收益率期望为零，使用 demean 因子对资产进行时序回归得到的截距恰好等于资产本身的时序均值，说明 demean 因子在截面上不再具备解释能力。这六个因子 demean 之后的时序如下图所示。

由于 A 股上旗帜鲜明的牛熊市，demean 之后的 MKT 因子（以及其他一些因子）难以满足平稳性，如不加以处理，将会影响 Harvey and Liu (2018) 的使用。该方法的本质是 demean 之后的因子无法解释资产预期收益率的截面差异（能解释的都是运气），因此在 bootstrap 时应保证 bootstrapped 样本中这些 demean 之后的因子的收益率依然为零。如果使用 MBB，由于对原始序列两端采样不足，则会使 bootstrapped 样本中 demean 后因子的收益率均值对于实证窗口的选择异常敏感。例如上图中，原始序列两端 demean 之后的 MKT 收益率一个很小、一个巨大，如果采样不足会影响 bootstrapped 样本。为此，在实证中选择将原始序列首尾相连的 Stationary Bootstrap。这是在 A 股中复现 Harvey and Liu (2018) 时的第一个坑。

下面再来说说第二个。我在一开始选择的实证窗口是 2010 年 1 月到 2019 年 2 月，而非从 2008 年 10 月开始。然而，由于中证 500 指数在这段时间内涨上去又跌回来，导致 MKT 因子的收益率期望接近零。这就意味着，哪怕不 demean，由于 E[MKT] ≈ 0，MKT 因子对于资产截面收益率的解释力度也十分有限。对于一个真正有效的因子，demean 的目的是排除它的截面解释能力，把它暂时视作一个随机因子（随机因子的期望收益为零），从而仅考察由于多个因子 multiple testing 中的运气成分能造成的解释力度。不幸的是，如果选择从 2010 年 1 月开始的实证区间，我们这位 MKT 因子都不需要 demean 就 E[MKT] ≈ 0 了，剩下再怎么检验，它也难言有效，从而造成错误的结论。这就是第二个坑。OK，坑挖完了也填完了，下面继续实证。

分别使用这六个因子和 25 个投资组合收益率做时序回归。对于每个因子，得到 25 个回归截距，它们是这些投资组合在使用该因子时的定价错误。使用这 25 个截距绝对值的中位数作为该因子解释这些投资组合的能力。定价错误低意味着解释力度高，因此该中位数越小说明因子越有效。此外，为了计算仅凭运气能够获得的显著性，将原始 25 个投资组合的收益率序列和 demean 之后六个因子的收益率序列放在一起（T × 31 阶矩阵），令 block size = 4，进行 1000 次 stationary bootstrap，得到 1000 个 bootstrapped 样本。对于每个样本，分别使用每个 demean 因子对这 25 个投资组合进行时序回归、得到 6 个截距绝对值中位数，将这 6 个中位数中的最小值作为 test statistic，它就是在这个 bootstrapped 样本中，仅靠运气能够获得的最低定价错误。

从 1000 个 bootstrapped 样本中得到 1000 个 test statistic，便构成了它的分布，这就是仅靠运气能够得到的定价错误分布。使用该分布 5% 分位数作为阈值，如果原始因子获得的定价错误小于该阈值，我们就说该因子在 5% 的显著性水平下有效。在第一轮中，这六个因子对 25 个投资组合定价错误绝对值的中位数、以及使用 1000 次 stationary bootstrap 获得的 test statistic 阈值如下表所示。不难看出，MKT 的解释力度最高且小于阈值，因此 MKT 被选为第一个有效的因子。第一轮正交化 + 自助法结束。

下面来看第二轮（后面的以此类推）。在第二轮中，已选出的 MKT 将会出现在时序回归方程的右侧，这么做是为了考察剩余待检验因子对于解释资产预期收益截面差异的增量贡献。首先，对于 SMB、HML、RMW、CMA、UMD 的每一个，将它们和已经选定的 MKT 一起（如果是第 n 轮正交化 + 自助法，则使用前 n – 1 轮中选出的 n – 1 个因子），对那 25 个投资组合进行时序回归，得到的截距项绝对值的中位数作为这五个因子的解释力度。

接下来，使用 MKT（again，如果是第 n 轮正交化 + 自助法，则使用前 n – 1 轮中选出的全部因子）对待检验因子正交化。具体做法为，将待检验因子依次放在回归方程左侧，将已经选出的因子放在回归方程的右侧，时序回归得到截距项；使用原始待检验因子减去截距项（也是一种 demean 处理），得到的就是其正交化之后的因子。该方法保证了使用 demean 的待检验因子和已选出因子一起对资产时序回归时得到的截距和仅使用已选出因子对资产时序回归时得到的截距相同，从而说明 demean 后的待检验因子无增量贡献。

将正交化后的五个因子和原始 MKT 因子一起，和 25 个投资组合收益率序列放在一起，构成一个 T × 31 阶矩阵。对其并进行 1000 次 stationary bootstrap 的到 1000 个 bootstrapped 样本。对于每一个样本，逐一使用 demean 后的因子，将它和已选出的因子一起（这里是 MKT），对这 25 个投资组合回归，得到截距绝对值中位数；然后从这五个因子中挑出中位数最低的，它就是该 bootstrapped 样本的 test statistic。这 1000 个 bootstrapped 样本的 test statistic 取值便构成了它的分布。下表是第二轮中这五个因子的解释能力以及 test statistic 的 5% 分位数阈值。其中，SMB 的解释力度最高且小于阈值，因此 SMB 被选为第二个有效因子。第二轮正交化 + 自助法结束。

按上述说明，反复使用正交化 + 自助法，直至没有显著的因子。在第三轮中的结果如下，RMW 因子被选出。

第四轮的结果如下，剩余三个因子的解释力度均无法超过 test statistic 阈值，因此全部被拒绝、检验结束。最终选出的因子为：MKT + SMB + RMW。

以上就是对 Harvey and Liu (2018) 的实证研究。

5 结语

Harvey and Liu (2018) 这篇文章十分 technical。我在《出色不如走运 (II)》对它的理论部分做了介绍，但是不甚满意，因此便有了这篇实证，希望这篇没那么晦涩（但我觉着也挺晦涩的……）。想对它进一步加深理解的小伙伴，我推荐翻墙去 YouTube 上看 Prof. Harvey 在 Jacobs Levy Center 年会上题为 Lucky Factors 的演讲，它能帮我们跳出细节、从全局掌握该方法的实质。从我的实证体会来说，最难的不是方法本身，而是如何尽可能客观的选择多因子模型以及用来检验该模型的资产。

在 empirical asset pricing 的研究中，最著名的文章当属 Fama 和 French 的一系列文章。无疑，这和他们开创性的研究密不可分，但不容忽视的一点是，人家 marketing 做的好！Ken French 在其网站上定期更新因子收益率序列供所有人免费下载。这些高质量且被市场广泛认可的数据为美股研究的蓬勃发展奠定了坚实的基础。反观 A 股，很难找到大家都认可的标准化因子收益率数据，这造成不同人对于哪怕是对同一因子的研究结果都有可能大相径庭。（就我有限的所知，中央财经大学维护了针对全 A 股的 Fama-French 五因子 + Carhart 动量因子数据。）究其原因是因为处理因子数据背后的细节太过纷繁 —— 按什么频率调仓；具体使用什么指标（比如当期还是 TTM）；依何种权重配置多空组合；如何处理 ST、涨跌停、停牌、退市等股票。

但即便有各种困难，为了在 A 股上得到更加客观、公允的实证分析结果（无论某个因子是有效还是无效都是有价值的发现），构建标准化因子数据的努力都必不可少。（最近，我在构思写一篇比较学术界主流多因子模型在 A 股上的效果分析文章，但是第一步就是要获得客观、标准的因子收益率。）希望未来能有更多的你、我（特别是市面上的各种量化平台）能为此努力，这将是造福量化多因子研究的大功绩。

参考文献

Carhart, M. M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance 52(1), 57 – 82.

Fama, E. F. and K. R. French (2015). A Five-Factor Asset Pricing Model. Journal of Financial Economics 116(1), 1 – 22.

Harvey, C. R. and Y. Liu (2018). Lucky Factors. Working paper, available at SSRN: https://ssrn.com/abstract=2528780.

Kunsch, H. R. (1989). The jackknife and the bootstrap for general stationary observations. The Annals of Statistics 17(3), 1217 – 1241.

Liu, R. Y. and K. Singh (1992). Moving blocks jackknife and bootstrap capture weak dependence. In Exploring the Limits of Bootstrap (R. Lepage and L. Billard, eds.), 225 – 248. Wiley, New York.

Politis, D. N. and J. P. Romano (1992). A circular block resampling procedure for stationary data. In Exploring the Limits of Bootstrap (R. Lepage and L. Billard, eds.), 263 – 270. Wiley, New York.

Politis, D. N. and J. P. Romano (1994). The stationary bootstrap. Journal of the American Statistical Association 89(428), 1303 – 1313.

免责声明：入市有风险，投资需谨慎。在任何情况下，本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下，本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外，文中图表均直接或间接来自于相应论文，仅为介绍之用，版权归原作者和期刊所有。

合格投资者声明

使用正交化和自助法寻找显著因子