Which Beta (II) ?

发布时间：2019-09-27 | 来源: 川总写量化

作者：石川

摘要：Fama and French (2020) 系统的比较了时序和截面多因子定价模型，为回答 which beta 提供了有力的依据。

1 引言

近日，Eugene Fama 和他的老搭档 Ken French 在 Review of Financial Studies 上发表了一篇题为 Comparing cross-section and time-series factor models 的最新文章（Fama and French 2020）。顾名思义，该文对比了截面（CS）和时序（TS）两种因子模型在解释资产收益率时的效果。这篇文章保留了 FF 一贯简单、直接、从数据出发的文风。但是它在 CS 和 TS 上来回切换，在时序回归 β 为作为因子载荷和以 firm characteristics 作为因子载荷之间辗转腾挪，读来也着实令人烧脑。需要对 CS 和 TS 模型，以及使用到的 Fama and MacBeth (1973) Regression（以下记为 FM regression）非常熟悉才不至于在阅读时迷失。有小伙伴后台留言希望我们能介绍一下这篇文章，今天就借这个机会对它进行解读。

Fama and French (2020) 的目的是为了从 TS 和 CS 的比较中找出更好的定价模型（empirical asset pricing model）。它的结论对于进行因子投资非常有价值，因为更好的模型意味着在截面上能更好区分股票预期收益率的差异。在 Fama and French (2020) 一文中，两位作者先后考虑了四个模型，进行了全方位系统的对比，从实证数据中得出了非常符合预期的结论，而这个结论也刚好能回答前文《Which Beta ?》所关注的核心问题。为此，我给本文起名为《Which Beta (II) ?》。

2 Fama-MacBeth Regression

Fama and French (2020) 一文以 Fama and French (2015) 五因子模型（下文记为 FF5）为 benchmark 构建了不同 TS、CS 版本的因子模型。为构建 CS 模型，他们采用了 FM regression。传统的 FM regression 分为两步：

第一步是时序回归：把因子收益率放在回归方程的 RHS，把资产收益率逐一放在回归方程的 LHS，通过时序回归计算每个资产在这些因子上的 factor loading β；

第二步是截面回归：使用第一步得到的 β 作为解释变量放在 RHS，使用资产的收益率放在 LHS，截面回归求出因子的 risk premium λ；每一期得到每个因子的溢价后，最后检验每个因子溢价的均值是否显著。

最初，Fama and MacBeth (1973) 一文是为了检验 CAPM。因此，它的第一步是为了得到个股的 market β 值。而如今无论是学术界还是业界的应用中，在使用 FM regression 时，往往跳过第一步，而直接运用它第二步中“先单期截面回归、再从时序上取平均”的思想，以排除残差收益率的截面相关性带来的影响。既然跳过了第一步，那么用什么来做 factor loading 呢？对，正是 firm characteristics。比如我们熟悉的 Barra 模型，其本质是一个 FM regression。它没有使用第一步时序回归计算 factor loading，而是直接使用了 firm characteristics，并进行第二步的截面回归计算 factor risk premium。

Fama and French (2020) 也正是使用 firm characteristics 作为 factor loadings，并通过 FM regression 来提出截面因子模型。考虑 FF5 中的五个因子，除了市场因子外，其余四个风格因子用到的 firm characteristics 包括 Market Cap（MC）、Book-to-Market（BM）、Operating Profitability（OP）以及 Change of Total Assets（INV）。以这四个指标作为 RHS，以资产下期收益率作为 LHS，可以写出 FM regression：

在每一期 t – 1，通过使用该期的指标和 t 期资产收益率进行截面回归，就可以得到 t 期这些指标的因子收益率。上式中，所有 R 代表的变量均表示不同的收益率，其中 R_zt 为截距项（会在本文第三节重点说明），e_it 为残差项。由截面回归的性质可知，这些收益率对应的投资组合均为纯因子组合。以 R_MCt 为例，它是 MC 因子纯因子组合的收益率，该组合满足在 MC 因子上一个单位的暴露，而在其他三个因子上零暴露。而截距项对应的投资组合则满足其中资产的权重之和为 1，而在任何风格因子上均没有暴露。将上式中 R_zt 挪到等式左侧得到：

不妨把这个式子称为（*）式，它是构建 CS 定价模型的关键，我们会留在第三节进行说明。

3 三个模型

Fama and French (2020) 一文共考虑了四个多因子定价模型，两个 TS 模型，两个 CS 模型。其中第二个 TS 模型是在其更早的 working paper 版本中并没有出现，它里面考虑了交叉项。但老实说这第二个 TS 模型并不是对比的重点，所以下文中不做考虑。本文仅介绍三个模型：一个 TS 模型和两个 CS 模型。TS 模型就是我们熟悉的 FF5：

其中 R_mt 是 t 期市场收益率，R_ft 为 t 期无风险收益率，SMB、HML、RMW 以及 CMA 这些是使用相应 firm characteristics 通过 2 × 3 double sort 构建的多空对冲组合的收益率，代表了因子的收益率（具体方法可参考 Fama and French 2015），而小写字母 b_i、s_i、h_i、r_i、c_i 则代表了公司 i 在这些因子上的暴露，通过时序回归得到；a_i 是截距项，即该模型无法解释的超额收益。

说完了 TS 模型，再来说 CS 模型。还记得（*）式吗？它是 CS 模型的基础，但它看起来不像个定价模型，原因是它是一个单期的截面回归。如果我们把全部 T 期的截面回归跨时间堆叠在一起（用 FF 的话叫 stacked across time），并在（*）等号右边的表达中将收益率和作为 loading 的 firm characteristics 位置对调，就可以得到下面这个式子：

通过这个变化，FM regression 摇身一变，成为一个定价模型，这就是第一个 CS 定价模型（记为 CS 模型一）。它是一个四因子模型，因子为 R_MC、R_BM、R_OP 以及 R_INV，factor loading 为这些因子各自对应的 firm characteristics。特别需要强调的是，该因子模型解释的并不是 TS 模型中 R_it 相对 R_f 的超额收益，而是 R_it 相对 R_zt 的超额收益。

R_zt 是什么呢？从（*）式可知，R_zt 是每个截面上 FM regression 回归的截距项，因此它显然和 FM regression 中 LHS 的那些资产的收益率有关。那么，用什么资产放在 LHS 呢？Fama and French (2020) 的目的是以 FF5 为基础比较 TS 和 CS 定价模型。因此，显然不能随便挑一些无关资产放在 FM regression 的 LHS，那样的话 CS 模型的因子就和 FF5 的因子不具备可比性。

从上面的描述中，你大概已经猜到了（用红笔划重点已经划到那个份儿上了），被放在 FM regression 的 LHS 的资产必须和 FF5 的因子密切相关；事实上，这些 LHS 资产正是构建 FF5 因子的那些投资组合。在 FF5 中，除去市场因子，其他四个因子均是由市值和某个指标 2 × 3 double sort 得到的 6 个投资组合来构建。由于在 SMB 之外还有三个因子，因此一共有 6 × 3 = 18 个投资组合。Fama and French (2020) 正是用这 18 个投资组合作为 FM regression 的 LHS，从而求出（*）式中的因子收益率 R_MCt、R_BMt、R_OPt、R_INVt 以及截距项 R_zt。

上述 LHS 资产的选择在 Fama and French (2020) 中至关重要，它也对应着该文中很重要的一段话：Using the same portfolios (those from the 2×3 sorts) to produce TS and CS factors is important. The cross-section regressions that generate the CS factors optimize the month-by-month description of returns of these portfolios. In contract, the TS factor definitions are arbitrary. Since the same portfolios produce the TS and CS factors, one central issue in our tests is whether the optimization of the CS factors enhances the description of average returns for test assets beyond those that produce the factors.

上面这段话的意思就是，CS 模型中，每个因子都是截面回归最优化得到的纯因子组合，保证了在目标因子上的单位暴露和在非目标因子无暴露；而在 TS 模型中，2 × 3 double sort 得到的因子则没有这样的性质，每个因子都可能在其他因子上有时变的暴露。基于这种差异，Fama and French (2020) 想要通过实证分析回答的问题是，构建因子组合时的这种优化能否更好的解释截面预期收益率差异？由于 LHS 资产是这 18 个投资组合，那么在 FM regression RHS 的 firm characteristics 显然也只能是这些投资组合的。这些投资组合的 firm characteristics 由每个组合中个股的相应指标按市值加权得到。此外，对 CS 模型中的每个因子，Fama and French (2020) 将这 18 个组合的指标在截面上进行了常规的标准化，让它们截面均值为 0，标准差为 1。

下面我们终于能够回答 R_zt 是什么了。假设我们有一个投资组合（称为 X）是上述 18 个组合的等权平均。令 R_X 代表这个组合的收益率。依据上述标准化方法，由于 X 组合是这 18 个组合的平均，因此它在 CS 模型中的全部四个因子上的暴露均为零。把 R_X 和这些零暴露（factor loading = 0）代入到（*）式中有：

R_zt = R_X 意味着 R_zt 正是这 18 个投资组合收益率的均值；这就是 R_zt 的含义。熟悉 Barra 模型的小伙伴也不妨回想一下，R_zt 的作用和 CNE5 中的国家因子是一样的。由于在 Barra 模型中风格因子用市值权重来做的标准化，因此 CNE5 中的国家因子代表了市值加权的个股收益率，也就正好是市场因子。这里的 R_zt 和 CNE5 中的国家因子有异曲同工之妙。之所以花费了如此多的笔墨解释 R_zt，是因为在上述 CS 定价模型中，四因子解释的是 R_it 相对 R_zt 的超额收益（即 R_it – R_zt）的截面差异。因此，从业务上搞清楚 R_zt 的含义至关重要。

Fama and French (2020) 在上述 CS 定价模型的基础上又提出了第二个 CS 模型（记为 CS 模型二）：

相比前者，这个版本的 CS 模型就非常好理解了。它实际上是用了时序回归 + CS 因子。在这个模型中，作为因子的仍然是通过 FM regression 得到的 R_MCt、R_BMt、R_OPt、R_INVt；除此之外还加入了 R_mt – R_ft 这个市场因子，因此该模型是一个五因子模型。它解释的也是 R_it 相对 R_ft 的超额收益 —— 在这个模型中没有 R_zt 什么事儿！最重要的是，这个模型也是通过时序回归求出上述五个因子的 factor loadings。从上面的描述不难看出，第二个 CS 模型直接对标了 FF5。这二者唯一的区别就是在四个风格因子的构建上：FF5 使用 18 个 2 × 3 double sort 的投资组合构建；而在 CS 模型二中，使用 FM regression 求解纯因子模型来构建。

作为回顾，下表总结了这三个不同的定价模型：

4 CS 因子做定价模型？

看到这里，有的小伙伴也许会困惑：FF5 和 CS 模型二非常好理解，它们只是 factor returns 的差异，从定价模型的角度来说，以这些 factor returns 作为解释变量，只需要对每个 LHS 资产单独进行时序回归就能得到其无法被模型解释的超额收益（时序回归中的截距 a_i）。而 CS 模型一则有所不同，它的 factor loadings 是 firm characteristics，它只不过是把不同的截面回归跨时间堆叠在一起使它看起来像一个定价模型。但它从始至终都不进行时序回归，如何获得 pricing error 呢？

It is important to be clear about how model (2) is applied in the asset pricing tests of panels B5 and B6 of Table 3. Panels B5 and B6 do not test model (2) with time-series regressions.

上面这段话出自 Fama and French (2020)，其中 model (2) 就是本文的 CS 模型一。为了使用该模型进行 asset pricing 并求出 pricing error，该文采用了如下两步：

第一步：每一期，通过（*）式的截面回归得到四个因子的收益率和截距项 R_zt；

第二步：对于某给定资产（强调！这里的资产是定价模型的 LHS，而非 FM regression 的 LHS，因此这里的资产并不是用来计算 CS 因子的 18 个投资组合！），计算其四个 firm characteristics，然后使用第一步回归得到的四个因子的收益率以及 R_zt 计算出该资产 t 期的预期收益率；该预期收益率与真实收益率之差就是该资产在 t 时刻的 pricing error。

按照上述两步就可以得到每个资产每期的 pricing error；将它们在时序上平均就得到该资产在 CS 模型一下的平均 pricing error。为了比较这三个定价模型，需要使用足够多有代表性的资产放在因子模型的 LHS。Lewellen, Nagel, and Shanken (2010) 指出应使用足够多的投资组合作为 LHS 以避免这些 LHS 资产有非常强的 factor structure、造成检验失效；而 Jegadeesh et al. (2019) 更是倡导使用个股作为 LHS 检验定价模型。

在 Fama and French (2020) 中，二位作者（自然）没有使用个股作为 LHS，但是使用了多达 210 个投资组合。构建这些投资组合背后的指标即来自构建因子的指标，也来自学术界常见的异象。比如，对于 BM、OP、INV 这些指标，他们分别使用市值和这些指标进行 5 × 5 double sort 构建了 25 个组合（因此 3 个指标一共有 75 个组合），此外 Fama and French (2020) 还考虑了动量指标，也构建了 25 个组合。在异象方面，他们考虑了诸如 Black, Jensen, and Scholes (1972) 的 market β 和 Ang et al. (2006) 的低波动异象，构建了一共 110 个组合。关于这些 LHS 组合的具体描述，请参考原文，下面来看实证结果。

5 实证结果

为对比不同的 TS 和 CS 定价模型，Fama and French (2020) 使用了大量的实证并进行了充分的稳健性检验。此外，在评价模型时，他们采用了不同的 metrics，如 Gibbons, Ross, and Shanken (1989) test statistic 以及 pricing error 绝对值均值等。本小节仅以 Table 3 为例介绍实证结果。首先来看 Table 3 的 Panel A。

虽然仅仅是 Panel A，但它又细分为 A1 到 A4，包含的信息量非常大。我把最关键的用红框标出来了。这里，我们只需要关注 Panels A1 和 A2（因为 A3 和 A4 是关于那个带交叉项的模型，本文并不涉及）。Panels A1 和 A2 的区别只是在于 LHS 投资组合的数量差异，除此之外它们均是比较了 Fama and French (2020) 中的模型（3）和模型（4），分别对应本文中的 TS 模型（FF5）和 CS 模型二（对标 FF5 的那个）。

另外值得一提的是，在 FF5 的基础上，Fama and French (2020) 也考虑了 UMD 动量因子。当加入动量因子后，其 TS 模型便加入了 UMD 因子，而 CS 模型就加入了 R_MOM 因子。上表中，红框标出来的 metric（A|α|）是给定定价模型下，所有 LHS 资产的 pricing errors 绝对值的均值。这个值越接近零说明定价模型越出色。从结果不难看出，无论是五因子还是加入了 UMD 和 R_MOM 的六因子模型，无论是考虑 185 个还是 210 个 LHS 资产，CS 模型二均优于其对应的 TS 模型。

接下来再看看 Panel B。相比于 Panel A 对比了 TS 模型和 CS 模型二，Panel B 仅仅关注 CS 模型一，但它巨大的信息量却更令人“懵逼”。

为了解释它，我不得不先回顾一下 CS 模型一：

首先，这个模型解释的是 R_it 相对 R_zt 而非 R_ft 的超额收益；其次，该模型中作为 factor loadings 的是 firm characteristics，而且它们是时变的，而非常数。记住了这两条，就可以来看 Panel B 了：

其中 Panels B5 和 B6 正是这个 CS 模型一的结果（注意表中横线标出的部分：factor loadings are time-varying characteristics）；因此，只有这两个 panels 的结果才能和 Panel A 中的 TS 模型和 CS 模型二进行 apple-to-apple 的比较。

Panels B3 和 B4 可以算是 CS 模型一的对照组，它们和该模型的区别是 factor loadings 是 firm characteristics 在整个时序上的平均值，因此对于每个 CS 因子，其 factor loading 是一个常数（factor loadings are average characteristics）。

最后，Panels B1 和 B2 就是打酱油的（哦，不不不，它们也是对照组）；它们的 factor loadings 和 firm characteristics 没有任何关系，而是使用 R_it – R_zt 和 CS 因子收益率进行时序回归得到的（类似 TS 模型的处理；factor loadings are constant regression slopes）。

有了上述说明就可以来看结果了。上表显示，无论采用哪些 LHS 资产来评价不同模型，我们都可以观察到这样的结果：Panels B5/6 优于 Panels B3/4 优于 Panels B1/2。进一步的，比较 Panels B5/6 和 Panel A 中的 TS 和 CS 模型二可知，CS 模型一的效果是最好的。比如，当采用 185 个 LHS 资产时，这三个模型的平均定价错误绝对值为：

从以上各种对比的结果中可以得到 Fama and French (2020) 一文的核心结论：

1. 以 FM regression 得到的 CS 因子作为解释变量的 CS 定价模型优于传统的 FF5，即 TS 定价模型（两个 CS 模型均优于 TS 模型）。

2. 当使用 CS 因子时，对应的 factor loadings 应采用 firm characteristics，而非像 Panels B1/2 中的时序回归。

3. 当使用 firm characteristics 作为 CS 模型的 factor loadings 时，时变 loadings 的效果好于恒定 loadings 的效果（Panels B5/6 优于 Panels B3/4），但这种差异并不明显；CS 模型之所以优秀源于通过 FM regression 得到的 CS 因子 factor returns（那些纯因子组合的收益率）。

最后用 Fama and French (2020) 原文对上述结论做一个总结：

We close by addressing a central question: What explains the dominance of model (2)? All the models we consider target cross-section variation in average returns related to the same size, value, profitability, investment, and momentum characteristics. And the CS factors of model (2) are constructed from returns on the same 2 × 3 MC-BM, MC-OP, MC-INV, and MC-MOM portfolios that produce the TS factors of model (3). The way these returns are related to produce the TS factors is, however, arbitrary. In contrast, monthly cross-section FM OLS regressions combine returns and characteristics on the 2 × 3 portfolios to produce CS factors that optimize the month-by-month description of returns on these portfolios.

一句话概括：截面回归得到的纯因子组合的 factor returns 比各种 double sort 得到的 factor returns 能够更好的解释资产的截面差异。Barra 大概要笑出声了。

6 结语

Fama and French (2020) 是一篇典型的 Eugene Fama 的文章，它把 empirical analysis 做到了极致并得出了非常清晰的结论。不过，我最初精读完它的 working paper 版本的时候感受也是懵逼的，因为它的信息量太大，而且在各种模型之间切换，给人一种脑容量不够的感觉。而后来得知这篇文章被 RFS 接受后也是懵逼的。我想大概只有 FF 写这么一篇文章才能被顶刊接受吧。它实在是太 empirical 了，最终的结论 —— 虽然异常清晰 —— 也仅仅是建立在 empirical results 之上的。

当然，不管怎样，该文回答了无论是学术界还是业界都非常关心的问题，即到底应该用什么作为 factor returns 以及用什么作为 factor loadings。从 Fama and French (2020) 的研究结果来看，CS 纯因子组合或大有可为。也许在不久的将来，我们就能看到用 CS 因子来构建的因子模型来 PK 掉所有靠各种 sort 获得的 TS 因子模型了（学术界主流 TS 因子模型见 Hou et al. 2019）。So, which beta? 我们也许已经有了答案。

参考文献

Ang, A., R. J. Hodrick, Y. Xing, and X. Zhang (2006). The cross-section of volatility and expected returns. Journal of Finance 61(1), 259 – 299.

Black, F., M. C. Jensen, and M. Scholes (1972). The Capital Asset Pricing Model: Some Empirical Tests. In Studies in the Theory of Capital Markets. M. C. Jensen (ed), New York: Praeger, 79 – 121.

Fama, E. F. and K. R. French (2015). A Five-Factor Asset Pricing Model. Journal of Financial Economics 116(1), 1 – 22.

Fama, E. F. and K. R. French (2020). Comparing cross-section and time-series factor models. Review of Financial Studies 33(5), 1891 – 1926.

Fama, E. F. and J. D. MacBeth (1973). Risk, Return, and Equilibrium: Empirical Tests. Journal of Political Economy 81(3), 607 – 636.

Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57(5), 1121 – 1152.

Hou, K., H. Mo, C. Xue, and L. Zhang (2019). Which factors? Review of Finance 23(1), 1 – 35.

Jegadeesh, N., J. Noh, K. Pukthuanthong, R. Roll, and J. Wang (2019). Empirical tests of asset pricing models with individual assets: Resolving the errors-in-variables bias in risk premium estimation. Journal of Financial Economics 133(2), 273 – 298.

Lewellen, J., S. Nagel, and J. Shanken (2010). A skeptical appraisal of asset pricing tests. Journal of Financial Economics 96(2), 175 – 194.

免责声明：入市有风险，投资需谨慎。在任何情况下，本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下，本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外，文中图表均直接或间接来自于相应论文，仅为介绍之用，版权归原作者和期刊所有。

合格投资者声明

Which Beta (II) ?