从 Factor Zoo 到 Factor War，实证资产定价走向何方？

发布时间：2019-07-10 | 来源: 川总写量化

作者：石川

摘要：近年来，实证资产定价研究已经从 factor zoo 逐渐演变成 factor war，然而在这种愈演愈烈的“竞争”下，我们对市场的理解又增加了多少？

1 引言

这一切都源于 Hou et al. (2019a) 怼了 Fama and French (2015) 五因子模型。近年来，侯恪惟、薛辰以及张橹三位教授在实证资产定价领域掀起了一股华人旋风。如果你对这三个中文名字没什么印象，那么对他们 Last Names 的首字母组成的三个字母缩写 —— HXZ —— 一定不陌生。几年前，这三位教授在一篇题为 Replicating Anomalies 的文章中惊人的复现了学术界的 447 个选股异象（anomalies），并指出在排除微小市值公司、考虑了 multiple testing 以及使用了“适当”的定价模型之后，绝大部分异象都不再显著。这篇最初的 working paper 长达 146 页，而如今它也终于即将被发表于顶刊 Review of Financial Studies（Hou, Xue, and Zhang 2018，下图），其期刊编辑后的版本也长达 115 页。我不知道这是不是 RFS 历史上最长的一篇，但至少是最长之一。

HXZ 对于实证资产定价的贡献远不止于上面这篇 Replicating Anomalies。在资产定价领域有着不同的方法论，比如人们熟悉的 consumption-based CAPM、以 Eugene Fama 和 Ken French 为代表的 empirical multi-factor asset pricing、以及最近流行的基于 behavioral finance 的 asset pricing（Stambaugh and Yuan 2017；Daniel, Hirshleifer, and Sun 2019）。而在方法论上，HXZ 三位倡导的则是 Investment-based CAPM。

在这方面，HXZ 的代表作是 Hou, Xue, and Zhang (2015) 这篇同样发表于 Review of Financial Studies 上的文章，题为 Digesting anomalies: an investment approach。他们从公司投资视角出发提出 q-factor asset pricing model（学术界简称 q-factor model）。以 The first principle of investment 为依据，q-factor model 在市场和 SMB 的基础上加入了 profitability 和 investment 两个维度，构建了四因子模型。张橹教授也在其个人主页上强调了 investment CAPM 对于资产定价理论的贡献：

My unique, big-picture perspective of asset pricing, which differs drastically from both the consumption CAPM and behavioral finance, is elaborated in my article titled The investment CAPM published in 2017 at European Financial Management (Zhang 2017).

Hou, Xue, and Zhang (2015) 这篇文章在发表时曾被作为 editor's choice 以及 lead article，足见其影响力。而 RFS 的出版商，牛津大学出版社也曾以 A new benchmark model for estimating expected stock returns 为题撰文为其造势。截至今日，Hou, Xue, and Zhang (2015) 已被引用超过 890 次，是 2015 年以来发表于 RFS 上的所有文章中引用量最高的一篇。显然，这三位教授在 Investment CAPM 的道路上远没有止步于此。最近两年，沿着 q-factor 的思路，他们（以及合作者 Haitao Mo）可谓相当高产，最新论文包括：

- 2018 年提出了 q-factor model 的进阶版：q5 model（Hou et al. 2018）。它在 q-factor model 的基础上增加了第五个因子 —— 预期投资增长因子；

- 2019 年，在 Review of Finance 上发表了 Which Factors 一文，使用 q 和 q5 模型和其他主流的多因子模型进行了全方位的比较（Hou et al. 2019a）；

- 同样是 2019 年，在一篇刚刚出炉、还冒着热气的 working paper 中（Hou et al. 2019b），这四位使用 q5 模型解释了历史上的多位大佬（比如巴菲特和神奇公式发明者 Greenblatt）以及学术界的一些重磅因子（比如 AQR 的 QMJ 和 Piotroski 的 F-Score）的收益；这些大佬和因子的共同之处都是源于 Graham 和 Dodd 的 Security Analysis。

由于 q-factor model 和 Fama and French (2015) 五因子模型中都包括投资因子，Hou et al. (2019a) 这篇文章在比较多个因子模型之外，还用了相当多的笔墨怼了 Fama and French (2015) 中的投资因子。终于和本文开篇第一句呼应上了。当我第一次看到 Hou et al. (2019a) 对 Fama and French (2015) 的抨击时，着实懵逼了好长时间 —— 虽然出发点不同，但两个因子模型都有投资因子、且指标的选取一模一样（都是过去一个财年 total assets 的增长率）；为什么 Hou et al. (2019a) 要怼 Fama and French (2015)？为了搞清楚这个问题，我又系统的沿着 Hou, Xue, and Zhang (2015)、Hou et al. (2018, 2019a, 2019b) 一路读下来，加深了对 investment CAPM 的理解。不过在这个过程中，也多少感到了近年来学术界因子模型之争（factor model war，简称 factor war）的硝烟。

本文就以梳理 investment CAPM 的发展脉络为契机，映射学术界最近在 factor war 上面愈演愈烈的趋势，以此表达一些对实质资产定价研究的担忧。最后需要强调的是，在多家因子流派“千帆竞发、百舸争流”之下，factor war 是一个普遍的现象；因此本文虽然是透过 investment CAPM 的镜头一窥这一现象，并不意味着该流派是 factor war 的众矢之的。下面先来看 q-factor model。

2 q-Factor Model 的经济学原理

Hou, Xue, and Zhang (2015) 提出的 q-factor model 是受到 Cochrane (1991) 的 production-based asset pricing 所启发，从公司投资的经济学原理出发。张橹教授曾在清华金融评论上撰文介绍过这个 q-factor model 的来龙去脉（Zhang 2016）。我在接下来两段的介绍中不妨直接引用一下 Zhang (2016) 的阐述。

根据 Zhang (2016)，q-factor model 是基于实体投资经济学理论，又称 q-theory（这也是该模型被称为 q-factor model 的原因）。它体现了公司金融学中的净现值原则（NPV rule）：如果项目现值大于投资成本，则应当投资该项目；如果项目现值小于投资成本，则不应当投资。起初，公司会有很多投资项目，此时应优先投资折现率低、盈利率高、因此现值最高的项目。随着被投资的项目越来越多，投资成本会慢慢变高，盈利率会越来越低。投资的最后一个项目应该是净现值为零（净现值原则）：投资成本 = 项目现值 = 盈利率 / 折现率。

上面这个净现值原则说的是：一家公司应该持续投资，直到投资的边际效益（被折现到今天）等于投资的边际成本。这就是对 Hou, Xue, and Zhang (2015) 所依托的经济学原理的核心概括。Zhang (2016) 继续介绍说：q-factor model 最富想象力和创造力的是把公司金融原则当作资产定价模型。传统资产定价理论从投资者最优证券组合角度出发，和公司变量没有直接关系。但是那一老套做了近半个世纪，结果只是大量异象现象。q-factor model 开辟了一个新的途径。我对以上这段如此之高的自我评价持保留态度。

将净现值原则变化一下得出：折现率 = 盈利率 / 投资成本。从这个式子出发，我们可以得到两个关于折现率的条件预期结论：当盈利率给定时，投资越多的公司（因此投资成本越高），折现率越低，股票预期收益率也越低；当投资给定时，盈利率越高的公司，折现率越高，股票预期收益率也越高。由此可知，股票收益率和投资成反比；和盈利率成正比。这就是 q-factor model 中加入 profitability 和 investment 两个维度的原因。不过我想“杠精”一下。尽管提出者对 q-factor model 有着很高的自我评价；但我们却无法从净现值原则中推导出市场和 SMB 两个因子。为什么最后 q-factor model 是四个因子而非两个呢？退一步说，加入市场因子无可厚非，但为什么 q-factor model 中不是三因子，而是偏偏加入了 SMB 凑出四个因子呢？

事实上，第一版的 q-factor model 并不是我们在 Hou, Xue, and Zhang (2015) 看到的那样。它出现在 Chen and Zhang (2007) 这篇题为 Neoclassical Factors（新古典因子）的 NBER 报告中，仅包含市场、盈利以及投资三个因子。这篇文章后被投到 Journal of Finance 却在几经修改之后还是被 rej 了。之后，Zhang 教授联手 Hou 和 Xue，最终提出了我们看到的四因子版本的 q-factor model，它经过两年的审稿和修改，终于在 2015 年被发表在 RFS 上。反观 Fama and French (2015)，他们从 discount cash flow（DCF）出发 promote 五因子模型（下文称 FF5）中新加入的 profitability 和 investment 两个因子；而如果从 DCF 的表达式来看，也是可以推出收益率和 SMB 及 HML 之间的关联（后文会说明）。从这个意义上说，FF5 更自洽一些。

那么，Hou, Xue, and Zhang (2015) 用了哪些指标作为盈利率和投资的 proxy 来构建因子呢？为此下面一小节将简单介绍 q-factor model 的数学模型。从之前的中文描述中我们已经搞清楚了该模型背后的核心经济学原理。因此在介绍数学表达时会力求言简意赅。了解 q-factor model 的数学模型也会帮助我们在本文第四节更好的理解 q5 model —— 它在数学上是 q-factor model 的一步拓展。

3 q-Factor Model 的数学模型

q-factor model 背后的数学模型十分简单；它假设一个两期（date 0 和 date 1）的公司投资决策模型。假设在 date 0，某公司 i 的资产为 A_i0、利润率是 Π_i0（假设已知）。在 date 1，该公司的利润率是 Π_i1，它是一个随机变量。对于 date 0 和 1，公司的 cash flow 为每一时刻的资产乘以利润率：Π_itA_it，t = 0, 1。在这个两期模型中，公司的决策变量是 date 0 的投资额 I_i0。该模型假设公司 date 0 的资产 A_i0 在 t = 1 时全部折旧完，因此该公司在 date 1 的资产正是其在 date 0 的投资：A_i1 = I_i0。除此之外，伴随 I_i0 而来的还包括一个调整费用（adjustment cost）：(a/2)(I_i0/A_i0)2A_i0。有了上述设定，我们就来看看最优化的目标函数是什么。

对于该公司，date 0 对于股东的回报是 cash flow 减去投资额以及投资的调整费用，即 Π_i0A_i0 – I_i0 - (a/2)(I_i0/A_i0)2A_i0；而对于 date 1，由于不再有投资，因此其在 0 时刻的预期回报可以表达为 E_0[M_1Π_i1A_i1]，其中 M_1 是 stochastic discount factor、Π_i1A_i1 是 date 1 的 cash flow、而求期望符号 E 的下标 0 代表 date 0 时的预期。这两期的回报相加就是最优化的目标函数：

该目标函数的最优解 I_i0 应满足：

上式的左侧为投资的边际成本（第二项为 marginal adjustment cost）；右边为边际效益预期被折现到 date 0。这个关系是也说明了上一小节提到的净现值原则。此外，由 the first principle of investment 可知，投资收益率 r^I（上标 I 表示投资收益率；为了区分股票收益率）应满足：

比较上面两个式子就可以得到投资收益率和边际成本以及边际效益的关系：

根据 Cochrane (1991) 和 Liu, Whited, and Zhang (2009) 的研究，在上述模型（以及更 general 的模型）设定下，公司的投资收益率等于其股票收益率（记为 r^S），因此最终可以把股票收益率和上述从公司投资角度出发的经济学理论联系起来：

上式就和本文第二节的文字解释一致了：当预期盈利 E_0[Π_i1] 给定时，股票收益率和投资 I_i0/A_i0 成反比；当投资给定时，股票收益率和预期盈利成正比。注意，在这个关系式中，投资 I_i0/A_i0 是 date 0 的，因此是历史投资，而非未来的预期投资（expected investment）。q-factor model 背后的理论用的是 past investment，而非 expected investment，这是它和 FF5 在投资因子上最大的差异（FF5 从 DCF 模型出发 promote 出来的 expected investment）。之所以强调这个，因为它是搞清楚 Hou et al. (2019a) 怼 FF5 的关键。

在实证研究中，Hou, Xue, and Zhang (2015) 使用 ROE 和 Total Assets 的增长率作为代表盈利和投资的指标。在构建因子时，为了体现上述条件预期收益率的关系，他们特意选择了通过 size、I/A 以及 ROE 将股票池独立进行 2 × 3 × 3 的 triple sort（使用 ROE 和 I/A 将股票分成三组时使用学术界常用的 30% 和 70% 分位数，中间的 40% 为 Middle 组），一共得到 18 个投资组合（每个投资组合中的股票都是按市值加权）。最终三个风格因子的定义为：

SMB：9 个 small size 组合的简单平均收益率与 9 个 large size 组合的简单平均收益率之差；

I/A：6 个 low investment 组合的简单平均收益率与 6 个 high investment 组合的简单平均收益率之差；

ROE：6 个 high ROE 组的简单平均收益率与 6 个 low ROE 组的简单平均收益率之差。

以上三个因子，再结合市场因子，就构成了 q-factor model。至于它和其他主流因子模型相比效果如何？我们留在本文的第七节 factor war 见分晓。有了对 q-factor model 数学模型的理解，将它进行一步扩展，就得到 q5。

4 q5

Hou et al. (2018) 这篇文章虽然目前仍然只是 working paper，但 q5 这个题目绝对标新立异。q5 在 q-factor model 的四因子基础上加入了第五个代表 expected investment growth 的因子，得到一个五因子模型。在数学上，它是 q-factor model 的直接延伸。而我更关注的是这第五个因子被加入的动机。Hou et al. (2018) 一开篇就以 Cochrane (1991) 来 motivate 出这第五个因子：

Cochrane (1991) shows that in a multiperiod investment framework, firms with high expected investment growth should earn higher expected returns than firms with low expected investment growth, holding current investment and expected profitability constant.

显然，这句话引入了 expected investment growth，同时它也指出了这是在 multiperiod investment framework 之下。由于 Hou, Xue, and Zhang (2015) 仅使用了简单的二期模型（因为 date 1 不再投资，因此它实际上是一个 one period investment framework），所以 q-factor model 中是没有投资增长的。因此，在 q5 这篇文章中，Hou et al. (2018) 把投资模型扩展到了多期。上面这个理论上的延展看来是把 q 升级到 q5 背后的主要动机。不过有意思的是，Zhang 教授和另外两位 co-authors 早在 Liu, Whited, and Zhang (2009) 一文（发表于经济学顶刊 Journal of Political Economy）中就研究过多期投资模型。虽然该文的重点不是 empirical asset pricing，但 expected investment growth 这个维度早就出现过（Liu, Whited, and Zhang 2009, pp 1126, eq. 10）。所以……

我无从得知为什么 Hou, Xue, and Zhang (2015) 在 q-factor model 里没有加入 expected investment growth；而是等到 q5 这篇才加入。也许在 q-factor model 被提出时，它已经能解释很多当时已有因子不能解释的异象了。而这几年一些新的因子模型有在效果上超过了 q-factor model，所以需要一个升级版。这当然纯属我的“阴谋论”，不过 Hou et al. (2018) 中的下面这句话也十分耐人寻味：

Improving on the q-factor model substantially, the q5 model is the best preforming model among all the factor models.

OK，八卦结束，让我们从数学上看看这个 q5 模型。Hou et al. (2018) 在 Hou, Xue, and Zhang (2015) 的基础上考虑无限期的模型。由于是多期模型，因此他们假设资产从 t 到 t + 1 期的折旧率为 δ（在 q-factor model 中，资产从 date 0 到 date 1 折旧完，因此在该模型中 δ = 1）。投资决策是每一期的投资 {I_it+s}, s = 0, 1, …。在任何时点 t，目标函数是最大化股东权益的现值。根据 the first principle of investment 可知从 t 到 t + 1 期的边际投资成本应该等于边际效益折现到 t，因此 t 到 t + 1 的投资收益满足：

对于 Hou, Xue, and Zhang (2015) 考虑的两期模型，由于折旧率 δ = 1 且 date 1 的投资 I_i1 = 0，因此上式分子中仅有第一项，而上式也就变成了本文第三节介绍的 q-factor model 的情况。对于多期模型，Hou et al. (2018) 如法炮制，指出股票收益率等于投资收益率。由此，从上式我们可以找到股票收益率和投资以及盈利的关系。上式中第一项近似对应“dividends”，第二项平方项与边际调整费用有关（由于是高阶小量故忽略），第三项近似对应“capital gain”，即 expected investment-to-asset growth（expected I/A growth）。从多期模型出发，股票收益率除了和 q-factor model 中已经考虑的 ROE 以及 I/A （条件）相关，也和 expected I/A growth 正相关。因此，该因子作为第五个因子被补充到 q-factor model 中，最终得到了 q5。

在实际构造 expected I/A growth 因子时，Hou et al. (2018) 使用了 predictive regression 外推的方法。即这个因子和我们了解的直接利用历史财务数据的因子均不同，它是使用历史数据构建了一个截面回归预测模型，然后使用最新的财务数据预测下一期 expected I/A growth。从数学复杂度上来说，我个人对这种构建因子的方法不是很感冒。因为这里面有模型设定以及参数估计误差等太多的问题。Hou et al. (2018) 自然意识到了这些问题；在文中他们也特别提到：

Our goal is a conceptually motivated yet empirically validated specification for the expected investment-to-assets changes. To this end, we turn to the investment literature in macroeconomics and corporate finance for guidance.

然而不可否认的是，在构造 expected I/A growth 因子时，由于可挖的数据太多，因此 data snooping 的风险也很高。本文不再赘述该因子的具体构造方法，感兴趣的小伙伴可以查看 Hou et al. (2018)。最后想要强调的是，我在上面提及这第五个因子时，不厌其烦的使用了 expected 这个词。这是因为从 q-theory 出发，该因子是（未来）预期投资增长率，而非过去的投资增长率。是否带有 expected 一词，含义截然不同。

5 FF5

说说 FF5 吧；它被 q-factor model 当成靶子打。从 DCF 出发并利用 Miller and Modigliani (1961) 的结果可知 t 时刻公司市值 M_t 满足如下关系：

上式中，Y_t+τ 是 t+τ 期的 total earnings，dB_t+τ 是未来 t+τ 时刻相对其前一期的 total book value 的变化，r 是 IRR。将上式两边同时处以 t 时刻公司的 book value B_t 可得：

Fama and French (2015) 通过上式 motivate 出 FF5：

1. 当除了 M_t 和 r 的其他变量给定时，更小的 M_t（或更高的 B_t/M_t）意味着更高的 r —— 这推出了 SMB 和 HML；

2. 当除了 Y_t+τ 和 r 的其他变量给定时，更高的 Y_t+τ 对应着更高的 r —— 即预期盈利和 r 正相关，推出了 RMW；

3. 当除了 dB_t+τ 和 r 的其他变量给定时，更高的 dB_t+τ 对应着更低的 r —— 即预期投资和 r 负相关（这就是被怼的靶子），从而推出 CMA。

在实证中如何围绕预期盈利和预期投资构建因子呢？这方面的研究可以追溯到 Fama and French (2006)。2006 年，Fama 和 French 在 Journal of Financial Economics 上发表了一篇题为 Profitability, investment and average returns 的文章，专门检验了预期盈利和预期投资这两个维度和 expected return 的关系：

Given B/M and expected profitability, higher expected rates of investment imply lower expected returns. But controlling for the other two variables, more profitable firms have higher expected returns, as do firms with higher B/M. These predictions are confirmed in our tests.

与 FF5 一样，Fama and French (2006) 也是从 DCF 出发。它在检验预期盈利和预期投资时，既检验了使用历史数据作为预期的 naïve estimate，又考虑了使用 predictive regression 构建因子。以预期投资为例，在使用历史数据直接外推时，该文使用 dA/A —— total asset 的变化率 —— 作为 expected investment。截面回归结果（下图）显示出它和收益率之间显著的负相关性。

而当 Fama and French (2006) 采用 predictive regression 计算 expected investment 时，却并没有获得统计上显著的关系（下图中 F(dA_t+τ/A_t)）：

上面的结果显示，预测的 F(dA_t+τ/A_t) 与收益率的相关系数为正（而这和从 DCF 推出的 expected investment 和收益率之间的负相关性是相左的！），但统计上非常不显著。以预测未来一年的 F(dA_t+1/A_t) 为例，它的回归系数仅为 0.04，t-statistic 为 0.05。对于这两种方法的差异，Fama and French (2006) 从计量经济学的角度进行了大量的探讨，并最终选择了使用历史数据进行 naïve estimate 的方法计算预期投资（对于预期盈利，使用历史数据和 predictive regression 的差异很小，故也采用历史数据）。上述处理方法也最终被保留到了 FF5 中。

值得一提的是，按照上述 DCF 模型，代表投资的变量应该是 dB_t+τ/B_t，即 book value 的预期变化，而非 total asset。Fama and French (2015) 坦言他们比较了使用 book value 和 total asset 两种方法，发现使用后者排序的话，股票收益率在截面上的差异更大，因此选择了 total asset 的变化。以上就是 FF5 背后的来龙去脉。下面就来看看 Hou et al. (2019a) 是怎么怼 FF5 的。

6 q vs FF5

Hou et al. (2019a) 这篇文章使用 spanning test 比较了他们提出的 q 和 q5 以及其他几个主流的多因子模型，包括：

Fama and French (2015) 五因子模型；

Fama and French (2018) 六因子模型（在 FF5 的基础上加入了动量）；

Stambaugh and Yuan (2017) 四因子模型；

Barillas and Shanken (2018) 六因子模型；

Daniel, Hirshleifer, and Sun (2019) 三因子模型。

结论自然不出意外，q 和 q5 完胜。不过，除了 empirical test 之外，这篇文章还从 valuation theory 的角度狠狠的怼了 FF5，而我一切的困惑和写作本文的动机皆源于此。下面开始解惑之旅。如果我们仔细查看 q-factor model 和 FF5 中构建投资因子的指标，会发现这两个指标完全一致（下图 1 来自 Hou, Xue, and Zhang 2015；图 2 来自 Fama and French 2015）。

虽然指标一致，但背后的出发点截然不同：

1. q-factor model 来自投资中的 q-theory，从其数学原理出发，收益率和 past investment 成反比，因此 q-factor model 中使用最近一个财年 total assets 的变化率没有任何问题；

2. FF5 来自 DCF 模型，从其数学原理出发，收益率和 expected investment 成反比；而 FF5 基于 Fama and French (2006) 的检验结果，采用 past investment —— 即过去一个财年 total assets 的变化率 —— 来对 expected investment 做 naïve estimate。

Hou et al. (2019a) 怼 FF5 的两个核心观点是：

1. DCF 中的 IRR 和未来单期的 expected return 不同；如果从 valuation theory 出发，从理论上是可以推导出 expected investment 和 expected return 之间存在正相关（正如同 Fama and French 2006 里用预测的 F[dA_t+τ/A_t] 和收益率的检验结果），而非 FF5 使用 DCF 所隐含的负相关 —— 这是从理论上开炮；

2. 实证结果显示 past investment 并不是 expected investment 的一个很好的代理指标，即 naïve estimate 根本不靠谱 —— 这是从实证上开炮。

结合上述两点，FF5 使用 past investment 构建的 CMA 因子（且该因子有效）其实是阴差阳错的利用了 past investment 和收益率之间的负相关（q-theory）；而非他们从 DCF 推出的 expected investment 和收益率之间的负相关性。这无疑直接撼动了 FF5 中投资因子的根基，也质疑了 FF5 在学术界的地位。

因子大战，硝烟弥漫。

对于上面第一点，Hou et al. (2019a) 的论述如下，感兴趣的小伙伴可以看看。

客观的说，关于 expected investment 和 expected return 的关系，我也认为 Hou et al. (2019a) 比 FF5 更合理。但上面这种“竞赛”还是让人感到不安。它似乎传递出一个信号：我们总能使用不同的金融学或经济学模型，推导出截然相反的关联 —— 上面的模型较 DCF 模型，通过把 IRR 换成单期收益率，巧妙的干掉了 dB 前面的负号，因此把“负相关”逆转为“正相关”。从实证结果出发总能讲出最适合的故事，但对着历史数据讲故事真的让我们离真相更进一步了吗？

OK，抛开理论上的差异不说，从实证结果来看，虽然 FF5 和 q-factor model 使用了同样的历史 total asset 增长率构建投资因子，但由于构建方法不同，q-factor model 中投资因子的溢价也完胜 FF5。从 q-theory 出发，投资和收益率的负相关是在控制了 ROE 之后的。因此，q-factor model 在构建投资因子时利用 size，ROE 和 total assets 增长率三个指标使用 2 × 3 × 3 triple sort，从而更好的反映了在控制 ROE 之后，投资和收益率的关系。反观 FF5，它仅使用 size 和 total asset 增长率做了 2 × 3 double sort，没有考虑控制 ROE 的影响，效果不如 q-factor model。这似乎佐证了 q-factor model 背后的 q-theory 能更好的解释 past investment 和 expected return 之间的关系。解惑之旅结束。

7 Factor War

让我们最后来看看近几年学术界的 Factor War。以下先后顺序使用论文的发表时间为基准。在 Hou, Xue, and Zhang (2015) 提出 q-factor model 时，他们使用了 80 个异象（那篇写 Replicating Anomalies 花的功夫绝对不会被浪费）比较了 q-factor model 和 Fama and French (1993) 三因子模型和 Carhart (1997) 四因子模型。结论自然是 q-factor model 战胜了它们。由于当时 FF5 还没有发表，因此并没有被拿来比较。

颇有意思的是，关于 q-factor model 和 FF5 写作背后的时间先后也拿来被当作 factor war 的炮弹。Zhang (2016) 介绍了两篇文章写作的背景（下图），指出 Fama 和 French 在 2013 年 6 月首先加入了盈利因子，然后才又加入了投资因子、构建了 FF5，而这个 timeline 远远晚于 q-factor model 的发展历程（见本文第二节），因此巨人 Fama 是站在了他们的肩膀上。不过 Zhang (2016) 似乎忘记了 Fama and French (2006) 这篇早就对盈利和投资进行检验的文章 —— 虽然 Hou et al. (2019a) 怼 FF5 的时候想起了它。

2017 年，Stambaugh 和 Yuan 在 Review of Financial Studies 上提出了两个 mispricing factors（Stambaugh and Yuan 2017），并结合市场和 SMB 构建了四因子模型。新的模型也少不了和已有的做一番对比，而结论也自不必说：

2018 年，Barillas 和 Shanken 在 Journal of Finance 上发表了题为 Comparing asset pricing models 的文章。该文提出了一个 Bayesian asset pricing test 检验不同的定价模型（Barillas and Shanken 2018）。通过对比，q-factor model 和 FF5 都败下阵来，而 Barillas and Shanken (2018) 也根据他们的结果提出了一个六因子模型，包括：市场因子、FF5 的 SMB、q-factor model 的 ROE 和 I/A，Asness and Frazzini (2013) 提出的按月更新的 HML，以及 UMD。

同年，在美国金融协会年会上，Daniel, Hirshleifer, and Sun (2019) —— 这里引用使用了即将发表于 RFS 的版本 —— 提出了基于行为金融学的两个因子，并结合市场因子构建了一个复合三因子模型（见《一个加入行为因子的复合模型》）。在 AFA 年会的报告中，Daniel, Hirshleifer, and Sun (2019) 将该模型和主流模型进行了对比，除了考察因子模型解释异象及其他因子的能力，也特别从模型复杂度角度进行了对比（见《Anomalies, Factors, and Multi-Factor Models》）。在 AFA 年会报告的讨论环节，Stambaugh 质疑 Daniel, Hirshleifer, and Sun (2019) 的三因子模型无法解释 SMB 因子，但他们却没有加入这个因子。我现在来看，这反而是 Daniel, Hirshleifer, and Sun (2019) 的一个优点。该模型从行为金融学的理论 promote 出长、短两个周期的行为因子；而从行为金融学的理论是无法引出 SMB 的因子的。所以该模型仅使用三个因子无可厚非；如果生硬的加入了 SMB，反而更有 data mining 之嫌。

自 2015 年 q-factor 被提出后，由于其理论上的创新和实证方面的优秀表现，获得了学术界的广泛关注。但是，随着新的模型被发表，它又被别人比了下去。在这种背（yin）景（mou）之（lun）下，q5 横空出世。Hou et al. (2019a) 的实证结果显示，q5 战胜了上述全部 candidates。

从现有的实证结果来看，出自 investment CAPM 的 q5 的五因子模型是当下“最强”的实证资产定价模型。当然，在不远的将来，学术界一定会搞出新的 factor model 来打败它。近年来，随着 John Cochrane 所提的 factor zoo 越来越深入人心，学术界对挖异象的热潮似乎有所减退，转而把研究重点放到了 factor war。然而，如果仅以各种 test 的结果或者谁解释的异象更多为标准，非要在众多模型中分出高下，又有多少意义？如果仅以“打赢” factor war 、而非推动人们对市场的理解为目标，而使用不同的金融学或经济学理论 promote 出一个“更好使”的因子或者互相“怼”，这又有多少意义？

因子大战，烽鼓不息。

8 结语

在上一节介绍 factor war 时，我特意保留了一篇，它就是 Fama and French (2018) 这篇题为 Choose Factors 的文章，发表于 Journal of Financial Economics。这篇文章拓展了 Gibbons, Ross, and Shanken (1989) test，提出使用模型所包含因子能够构成的 max squared Sharpe ratio 来比较不同的模型。之所以保留这篇文章是因为它没有和别人比，而是“自己和自己比”。该文比较了 CAPM，Fama and French (1993) 三因子、Fama and French (2015) 五因子以及 Fama and French (2018) 六因子模型。除了方法论之外，Eugene Fama 在这篇文章中表达出来的对 factor war 的担忧深深引起了共鸣。

Fama and French (2018) 认为，虽然 CAPM 以及 consumption-based CAPM 被 empirical data 拒绝了，但是这些理论模型在收益和风险之间建立了有效的联系。而另一方面，实证资产定价中的 factor models 是来自对历史平均收益率中某种模式的发掘。因此，factor model 背后必须有理论支撑。一旦缺乏理论，那么因子模型就会退化成以提升事后 mean-variance-efficient（MVE）tangency portfolio 为目标对着历史数据进行挖掘：

There is an obvious danger that, in the absence of discipline from theory, factor models degenerate into long lists of factors that come close to spanning the ex post MVE tangency portfolio of a particular period.

出于这个原因，Fama and French (2018) 在 FF5 加入动量因子的时候显得异常小心谨慎：

We include momentum factors (somewhat reluctantly) now to satisfy insistent popular demand. We worry, however, that opening the game to factors that seem empirically robust but lack theoretical motivation has a destructive downside — the end of discipline that produces parsimonious models and the beginning of dark age of data dredging that produces a long list of factors with little hope of sifting through them in a statistically reliable way.

对于一个因子模型来说，它是为了解释股票收益率如何共同运动的，因此必须和个股的协方差矩阵密切相关（Pukthuanthong, Roll, and Subrahmanyam 2019）。仅靠因子模型之间相互 spanning tests，或者用一箩筐其实相关性都不低的异象（全都是投资组合；连个股都没有用）来检验因子模型，恐怕和前面的目标还有一定的距离。如此 factor war 意义十分有限。最后，我想用 Fama and French (2018) 里的一段话作为本文的结尾。他们二位呼吁高质量和有意义的因子模型比较。此外，对于 factor modeling，必须要有理论依据，避免建模本身成为对着历史数据进行数据挖掘。然而，实现这一切需要我们对市场更深的理解。

In general, if inference is to have content, the list of models considered in a study must be relatively short. Moreover, if factor modeling is not to degenerate into meaningless dredging for the ex post MVE portfolio, the number of factors in models must also be limited. Establishing ground rules, however, awaits more experience.

参考文献

Asness, C. and A. Frazzini (2013). The devil in HML's details. The Journal of Portfolio Management 39(4), 49 – 68.

Barillas, F. and J. Shanken (2018). Comparing asset pricing models. Journal of Finance 73(2), 715 – 754.

Carhart, M. M. (1997). On persistence in mutual fund performance. Journal of Finance 52(1), 57 – 82.

Chen, L. and L. Zhang (2007). Neoclassical factors. NBER Working Paper, No. 13282.

Cochrane, J. H. (1991). Production-based asset pricing and the link between stock returns and economic fluctuations. Journal of Finance 46(1), 209 – 237.

Daniel, K., D. Hirshleifer, and L. Sun (2019). Short- and long-horizon behavioral factors. Review of Financial Studies forthcoming.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.

Fama, E. F. and K. R. French (2006). Profitability, investment and average returns. Journal of Financial Economics 82(3), 491 – 518.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.

Fama, E. F. and K. R. French (2018). Choosing factors. Journal of Financial Economics 128(2), 234 – 252.

Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57(5), 1121 – 1152.

Hou, K., H. Mo, C. Xue, and L. Zhang (2018). q5. Charles A. Dice Center Working Paper No. 2018-10; Fisher College of Business Working Paper No. 2018-03-010.

Hou, K., H. Mo, C. Xue, and L. Zhang (2019a). Which factors? Review of Finance 23(1), 1 – 35.

Hou, K., H. Mo, C. Xue, and L. Zhang (2019b). Security analysis: An investment perspective. Working paper.

Hou, K., C. Xue, L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies 28(3), 650 – 705.

Hou, K., C. Xue, and L. Zhang (2018). Replicating anomalies. Review of Financial Studies forthcoming.

Liu, L. X., T. M. Whited, and L. Zhang (2009). Investment-based expected stock returns. Journal of Political Economy 117(6), 1105 – 1139.

Miller, M. H. and F. Modigliani (1961). Dividend policy, growth, and the valuation of shares. Journal of Business 34(4), 411 – 433.

Pukthuanthong, K., R. Roll, and A. Subrahmanyam (2019). A protocol for factor identification. Review of Financial Studies 32(4), 1573 – 1607.

Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors. Review of Financial Studies 30(4), 1270 – 1315.

Zhang, L. (2016). Factors war. Tsinghua Financial Review 37, 101 – 104, in Chinese.

Zhang, L. (2017). The investment CAPM. European Financial Management 23(4), 545 – 603.

免责声明：入市有风险，投资需谨慎。在任何情况下，本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下，本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外，文中图表均直接或间接来自于相应论文，仅为介绍之用，版权归原作者和期刊所有。

合格投资者声明

从 Factor Zoo 到 Factor War，实证资产定价走向何方？